过五关|28个数据可视化图表的总结和介绍( 二 )



Scatter Plot
【过五关|28个数据可视化图表的总结和介绍】散点图是一种在二维坐标系中绘制两个数值变量的方法 。 通过散点图我们可以很容易地可视化数据分布

Line Plot
折线图类似于散点图 , 但点是用连续的线按顺序连接起来的 。 在二维空间中寻找数据流时 , 折线图更加直观 。

上图可以看到weight 是如何续变化的 。
Bar Chart
柱状图主要用于用柱状表示类别变量的出现频率 。 柱的不同高度表示频率大小 。

Histogram
方图的概念与条形图相同 。在柱状图中频率显示在分类变量的离散条中 , 而直方图显示连续间隔的频率 。它可以用于查找区间内连续变量的频率。

Pie Chart
饼图以圆形的方式以百分比表示频率 。 每个元素根据其频率百分比持有圆的面积 。

Exploded Pie Chart
展开饼图
展开饼图和饼图是一样的 。 在展开饼图中 , 可以展开饼图的一部分以突出显示元素 。

Distribution Plot
分布图可以显示连续变量的分布 。

Box Plot
箱线图是一种基于五数汇总(“最小值”、第一四分位数 [Q1
、中位数、第三四分位数 [Q3
和“最大值”)显示数据分布的标准化方法 。它可以显示异常值等信息 。

中级数据可视化中级的可视化图表是对基础可视化图表的延申 , 我们这里总结了8个
Stacked Bar Chart
堆叠柱状图是一种特殊的柱状图 。 我们可以在堆叠柱状图中集成比传统柱状图[2
更多的信息 。

Grouped Bar Chart
“分组柱状图”这个名字意味着——它是一种分成不同组的特殊类型的柱状图 。 它主要用于比较两个分类变量 。

Stacked Area Chart
堆叠面积图将几个区域序列叠加在一起进行绘制 。 每个序列的高度由每个数据点中的值决定 。

Pareto Diagram
帕累托图包括柱状图和折线图 , 其中各个值由柱状图降序表示 , 直线表示累计总数 。

Donut Chart
环形图是一个以圆心为切口简单的饼状图 。 虽然它和饼图表达的意思是一样的 , 但它也有一些优点:在饼图中我们经常会混淆每个类别所共享的区域 。 由于饼图的中心从环形图中移除 , 所以它可以强调读者要关注饼图的外弧线 , 同时内圈也可以用来显示额外的信息 。

Heatmap
热图是一个可以分为多个子矩形的矩形图 , 它用不同颜色表示不同的值/强度 。

Radar Chart
雷达图是一种以二维图表的形式显示多元数据的图形方法 , 三个或更多变量在从同一点开始的轴上进行表示 。来自中心的辐条称为半径 , 代表变量的数值 。半径之间的角度不包含任何信息 。

Treemap
矩形树图用嵌套的矩形形式显示层次数据 。

高级数据可视化这些图都比较复杂 , 一般情况下可能也不太常见 , 但是在处理特定任务时却非常好用 。 这里总结了10个相关的图表
Parallel Coordinate Plot
因为我们生活在三维空间 , 所以一般的可视化最多处理3维的数据 。 但有时需要可视化超过 3 维的数据 , 我们经常使用 PCA 或 t-SNE 来降维并绘制它 。在降维的情况下 , 可能会丢失大量的信息 。并且有时我们需要考虑所有特征 , 这时就需要平行坐标图 。

Hexagonal Binning
六边形分箱图是用六边形直观表示二维数值数据点密度方法 。

Contour Plot
2D等高线密度图是可视化特定区域内数据点密度的另一种方法 。 它可以方便的找到两个数值变量的密度 。 例如下面的图表显示了每个阴影区域中有多少个数据点 。