百科网

首页 > 生活常识 > 生活经验

生活经验

从零开始的数据分析之旅(四)集中趋势与离散趋势

生活经验佚名2023-06-04

一、前言

统计指标多种多样,今天我们来聚焦其中的集中趋势指标与离散趋势指标。

二、集中趋势指标

集中趋势指标是用于体现数据一般水平的指标,可以帮助数据分析师以最快的速度了解样本数据的概况,而其中最常见的集中趋势指标就是平均值。

以掘金上的文章数据举例,如果涉及到哪篇文章最受欢迎、哪篇文章的点赞数量最多、哪篇文章的引流效果最好等等数据分析的需求,那么就适合采用集中趋势指标,比如通过整体文章平均值的情况就可以得到一个初步的结论。

当然,如果样本数据中有异常值,那么光靠平均值也许不能够非常准确的反映数据体现出的规律,甚至可能因为平均值对异常数不敏感而出现误导性,这个时候也可以采用集中趋势指标中的中位数替代,则更具代表性。

集中趋势指标还有众数,众数是出现次数最多的数值,可以通过众数反应出样本数据的局部特征与密集度,需要注意的是,众数可以有多个。

三、离散趋势指标

离散趋势指标相对比较简单,能够体现出样本数据内部差异度的指标就是离散趋势指标,因此离散趋势指标就包括了极差、平均差和标准差。
(www.ws46.cOm)

极差是求相距最远的两个点之间的距离,可以体现出样本数据内部最大差异情况。

平均差是求样本数据与平均值的平均差异,可以体现出具体的离散程度,当平均差越大时样本数据就越分散。

标准差是最常使用的离散趋势指标,对数据误差比较敏感。

打赏