《数据可视化基础》第一章:把数据放到图表上

2021
01/15

+
分享
评论
医学数据库百科
A-
A+


以下部分是基于《Fundamentals of Data Visualization》学习笔记,最近可能会不定期连载哦!要是有兴趣还等不及更新的话,可以直接看原版书籍:https://serialmentor.com/dataviz/




 

 
所谓的数据可视化


我们在很多文章当中可以看到各种各样的图形,例如:散点图、条形图、热图……这些图形看似没有什么关系,但其实他们都有一个共同的特征就是,都是基于数据绘制出来的,这种把数据经过一定的转换变成图形的过程就是数据可视化



对于数据可视化而言,什么样的数据,绘制什么样子的图形基本都是固定的。所以我们只要了解了数据的类型,那之后就可以通过数据的分类来寻找做什么样的图。





 

 
数据类型


对于数据的分类,我们首先可以基于数据是不是数字分成定量数据定性数据。其中定量数据就是指数字,对于数字而言,还可以分成连续性变量离散变量。而定性数据则属于文本类型的描述,这样的描述也可以都属于分类变量,但是文本描述的话可以通过有没有顺序分成有序变量和无序变量。。另外,我们在处理数据的时候,也经常遇到日期的特殊类型的变量以及文本这种自由的变量。

数据类型例子变量类型描述
定量数据/连续性数值1.3, 5.7, 83, 1.5x10-2连续性变量可以是任何数值
定量数据/离散数值1,2,3,4分类变量数字以离散单位表示
定性数据/无序分类狗、猫、鱼分类变量没有任何的顺序,不同变量类别之间不存在比较关系。
定性数据/有序分类不好、比较好、好分类变量变量和变量之间存在一定的关系,有明显的顺序
日期/时间Jan. 5 2018, 8:03am连续/分类特定的日期或者时间
文本这里是转折点不是变量/分类变量自由格式的文本。如果需要,可以视为分类。


例如该表包含五个变量:月份,日期,位置,站点ID和温度(以华氏度为单位)。其中月是有序的分类变量;天是离散数值;位置和站点ID是无序分类变量;温度则是连续性数值。






 

 
将数据值放到图形上


一个图形而言包括很多组成部分,例如图形的位置、形状、大小、颜色、线条宽度、线条类型等等等等。我们将图形当中的每一个部分叫做标度(scale)。

因此数据可视化的过程基本上分成两个步骤:

  1. 把想要绘制的数据和图形的不同的标度对应上,我们称这个过程为映射。

  2. 选择合适的图形把映射表现出来。对于这个选择也是有一定原则的,这个我们在后面会慢慢讲的。


例如????美国四个地点的每日温度的例子,我们把温度值映射到Y轴,把每天的日期映射到X轴,把不同的地区映射到颜色上,最后通过线条来可视化这些结果,就有了下的这个图形。



同样的,如果我们把不同地区映射到Y轴,然后把温度映射到颜色上,最后通过正方形来可视化结果。然后就有了????的热图


以上两个图形都是使用了x轴、y轴和颜色三个标度。只不过基于不同标度的映射对象不同以及可视化呈现的不同就表现出不同的图形了。

同样的,我们可以把三个标度变成多个标度。例如????的图,就是有x、y轴的位置标度、颜色标度、大小标度和形状标度,五个标度来呈现一个图形。




本文由作者自行上传,并且作者对本文图文涉及知识产权负全部责任。如有侵权请及时联系(邮箱:nanxingjun@hmkx.cn
关键词:
数据,图表,标度,变量,图形,定量数据,映射

人点赞

收藏

人收藏

打赏

打赏

我有话说

0条评论

0/500

评论字数超出限制

表情
评论

为你推荐

推荐课程


社群

精彩视频

您的申请提交成功

确定 取消
剩余5
×

打赏金额

认可我就打赏我~

1元 5元 10元 20元 50元 其它

打赏

打赏作者

认可我就打赏我~

×

扫描二维码

立即打赏给Ta吧!

温馨提示:仅支持微信支付!