双峰....与递迴

双峰是许多人关注的焦点....我是说统计学上, 呈现出两种倾向.
比如: 生育率以高所得及低所得为主, 中产阶级的生育率反而偏低.

而在程式分析时, 就会遇到一个难题, 平均数跟中位数都不在双峰上.
所以为了确认是否呈现双峰分布, 甚至更多峰分布, 就要靠"众数"这个功能.

一般呈现常态分布的统计资料, 平均数, 中位数, 众数三者是非常接近,
如果中位数跟众数接近, 这两者跟平均数却比较远, 那就是双峰的一个特性.

所以程式可以先以所有样本计算第一次, 如果符合上述特徵,
再以众数加上一定差异(例如: 两个标準差),
然后剔除掉这些相近的资料, 就剔除掉一个峰值,

剩下的资料, 再重新取一次众数, 就是第二个峰值,
再重複执行到平均数, 众数, 中位数觉得差不多了, 就属于最后一个峰值,
重複这些过程, 就可以用递迴的方式处理.

只是当中难的地方, 就是平均数与众数, 中位数到底差多少才算双峰?
可能就要从其他相关的统计中, 先求出一个常态分布的样本, 再排除这种样本特性去考虑.

(什么? 写程式? 我不会.... ;p )

同步发表于个人Blog: https://slimetw.blogspot.com/2019/05/blog-post.html


关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章