如果数据集有两种模式,则该数据集是双峰的。 这意味着没有一个数据值出现在最高的频率上。 相反,有两个数据值为最高频率配合。
双峰数据集的例子
为了帮助理解这个定义,我们将看一个具有一种模式的集合的例子,然后将其与双模数据集进行对比。 假设我们有以下一组数据:
1个,1个,2个,2个,2个,3个,4个,5个,5个,6个,6个,7个,7个,7个,8个,10个,10个
我们计算一组数据中每个数字的频率:
- 1发生在该组三次
- 2次出现在该组中四次
- 3发生在设定的一次
- 4一次出现在设置中
- 5次在该集合中发生两次
- 6次在集合中出现三次
- 7次在该集合中发生三次
- 8次出现在设置中一次
- 9发生在设定的零次
- 10次发生在该组中两次
在这里我们看到2最经常出现,所以它是数据集的模式。
我们将这个例子与以下对比
1,1,1,2,2,2,2,3,4,5,5,6,6,6,7,7,7,7,8,10,10,10,10,10,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,27,28,29,23,23,24,25,26,27,28,29,23,23,23,24,25,26,27,28,29,23,23,23,23,24,25,23,23,23,24,23,23,24,23,23,24,23,23,24,23,23,24,23,23,24,23,23,23,24,24
我们计算一组数据中每个数字的频率:
- 1发生在该组三次
- 2次出现在该组中四次
- 3发生在设定的一次
- 4一次出现在设置中
- 5次在该集合中发生两次
- 6次在集合中出现三次
- 7次发生在该组五次
- 8次出现在设置中一次
- 9发生在设定的零次
- 10次在集合中出现五次
这里7和10出现五次。 这比任何其他数据值都高。 因此我们说数据集是双峰的,这意味着它有两种模式。 双峰数据集的任何示例都与此类似。
双峰分布的含义
该模式是衡量一组数据中心的一种方法。
有时变量的平均值是最经常出现的变量。 出于这个原因,查看数据集是否是双峰是很重要的。 而不是单一的模式,我们会有两个。
双峰数据集的一个主要含义是,它可以向我们揭示数据集中表示了两种不同类型的个人。 双峰数据集的直方图将显示两个峰或峰。
例如,双峰测试分数的直方图将有两个峰值。 这些高峰将对应于学生得分最高的地方。 如果有两种模式,那么这可能表明有两种类型的学生:为测试做准备的人和没有准备好的人。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/190564.html