![Stata统计分析与行业应用案例详解(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/500/26943500/b_26943500.jpg)
2.1 实例一——直方图
2.1.1 直方图的功能与意义
直方图(Histogram)又称柱状图,是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。一般用横轴表示数据类型,纵轴表示分布情况。通过绘制直方图,可以较为直观地传递有关数据的变化信息,使数据使用者能够较好地观察数据波动的状态,使数据决策者能够依据分析结果确定在什么地方需要集中力量改进工作。
2.1.2 相关数据来源
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0037_0001.jpg?sign=1738887476-Ap9Rru3omTzgq3DfBdm8l7re6R3kA5PD-0-67c8bb5284e4c80218ead1be45dd5449)
【例2.1】为了解我国各地区技工学校的建设情况,某课题组搜集整理了2009年我国29个省市的技工学校数量的数据,如表2.1所示。试通过绘制直方图来直观地反映我国技工学校的建设情况。
表2.1 2009年我国29个省市技工学校的数量
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0037_0002.jpg?sign=1738887476-ZlJjD1VdZ6qZjee0AGnd7YeB0GTaH30v-0-e82ee359e99561409717580a67f853ba)
2.1.3 Stata分析过程
在用Stata进行分析之前,我们要把数据录入到Stata中。本例中有两个变量,分别是地区和数量。我们把地区变量设定为region,把数量变量设定为number,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作我们在第1章中已有详细讲述。录入完成后,数据如图2.1所示。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0038_0002.jpg?sign=1738887476-5eLdLLXTlmKxV5ymUlYv2zEqDV6nxTBW-0-953c22998bc8aec2d0515950ef091533)
图2.1 案例2.1数据
先做一下数据保存,然后开始展开分析,步骤如下:
进入Stata 14.0,打开相关数据文件,弹出主界面。
在主界面的“Command”文本框中输入命令:histogram number, Frequency。
设置完毕后,按键盘上的回车键,等待输出结果。
2.1.4 结果分析
上述操作结束后,Stata 14.0将弹出如图2.2所示的直方图。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0038_0006.jpg?sign=1738887476-QViZHsbhr1Ones9cWCtd9Su1R1zFOtTE-0-7fa3c55615fc23d45c2016a696900d77)
图2.2 直方图1
通过观察直方图,可以比较轻松地看出我国的技工学校建设情况,某省市拥有技工学校的数量和与之处于同一区间省市的数量是负相关的,也就是说,拥有技工学校数量较多的省市较少,拥有技工学校数量较少的省市较多。
2.1.5 案例延伸
上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。但是Stata 14.0的强大之处在于,它同样提供了更加复杂的命令格式以满足用户更加个性化的需求。
1.延伸1:给图形增加标题
例如,我们要给图形增加标题的名称“案例2.1结果”,那么操作命令就应该相应地修改为:
histogram number, frequency title("案例 2.1结果")
在命令窗口输入命令并按回车键进行确认,结果如图2.3所示。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0039_0001.jpg?sign=1738887476-tBprM3IwS4hcxlaQSIX2pdk3sOjrP3YC-0-d12f5002b0310e753d33db592fddf127)
图2.3 直方图2
2.延伸2:给坐标轴增加数值标签并设定间距
例如,我们要在延伸1的基础上对X轴添加数值标签,取值为0~300,间距为25,对Y轴添加数值标签,取值为0~10,间距为1,那么操作命令就应该相应地修改为:
histogram number, frequency title("案例2.1结果")xlabel(0(25)300) ylabel(0(1)10)
在命令窗口输入命令并按回车键进行确认,结果如图2.4所示。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0039_0002.jpg?sign=1738887476-bK0khDDoDfY9FF1zsebCdhigDAUcTjVn-0-47933ee36c3ad610bf7bcca4ecfa6a14)
图2.4 直方图3
3.延伸3:显示坐标轴的刻度
例如,我们要在延伸2的基础上对Y轴添加刻度,取值为0~10,间距为0.5,那么操作命令就应该相应地修改为:
histogram number, frequency title("案例 2.1结果") xlabel(0(25)300) ylabel(0(1)10) ytick(0(0.5)10)
在命令窗口输入命令并按回车键进行确认,结果如图2.5所示。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0040_0001.jpg?sign=1738887476-Yo2EPbFco1izl2pjiP2zlenU0nc24fiM-0-085c958b9107826c6adafdbab537c076)
图2.5 直方图4
4.延伸4:设定直方图的起始值以及直方条的宽度
例如,我们要在延伸3的基础上进行改进,使直方图的第1个直方条从10开始,每一个直方条的宽度为25,那么操作命令就应该相应地修改为:
histogram number, frequency title("案例 2.1结果") xlabel(0(25)300) ylabel(0(1)10) ytick(0(0.5)10) start(10) width(25)
在命令窗口输入命令并按回车键进行确认,结果如图2.6所示。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0040_0002.jpg?sign=1738887476-nSiBrvjarBAqaHtkQmRXqhw3Nl7d2gej-0-65952ef6adfe4f84e20866192c8189d3)
图2.6 直方图5