练习R:单个连续数据的探索性统计可视化函数EDA

针对连续型数值变量的描述统计,除了给出集中、离散指标外,我们还可以选择统计图形可视化进行展示。
今天要练习的是,方匡南老师《R数据分析》一书中提供的自定义探索性数据分析函数EDA,用EDA直接给出单个连续变量数据的四张统计图形,可视化效果较好,能快速观察该组数据的基本状况。
EDA配合描述统计指标,效果会更佳。
案例数据:雇员数据
分析任务:考察当前工资salary的分布情况。
自定义EDA函数:
EDA <- function (x){ par(mfrow=c(2,2)) # 同时做4个图 hist(x) # 直方图 dotchart(x) # 点图 boxplot(x,horizontal=T) # 箱式图 qqnorm(x);qqline(x) # 正态概率图 par(mfrow=c(1,1)) # 恢复单图}
使用EDA:
EDA(employee$salary)
结果展示:
直方图:右侧有长尾,当前工资数据有一定程度的右偏态现象;
散点图:大多数人处于低中工资水平,有一小部分人工资较高;
箱线图:右偏状态,伴有可疑异常值;
Q-Q图:提示偏态。
本文完
文/图=数据小兵
参考资料:
方匡南, 朱建平, 姜叶飞. R数据分析[M]. 电子工业出版社, 2015.
(0)

相关推荐