文章来源: 丁点帮你
作者:丁点helper
首先,卡方检验的适用条件主要是针对表格的理论频数(还不太懂什么叫理论频数,戳此了解),具体内容如下:
以上n代表总的样本量,如果是四格表卡方检验,就是两组人群之和,如下图,常用的符号了解一下:
上述表格也称”四格表“
明白了卡方检验的适用条件,我们来看看什么是R*C交叉表检验,以前的教材也叫R*C列联表。
这里R表示行(英文Row),C表示列(英文Column),所以两者合起来就表示超过两行或两列的表格比较。
大家熟悉的四格表是比较两组率的差异,而R*C交叉表就是用来比较多组率(或多个构成比)的差异。
案例: 比较某地区男、女性的饮食口味是否存在差异,研究人员对该地区555名男性,819名女性居民的饮食喜好程度进行调查。数据整理如下。
本例相比四格表增加了一列,属于2*3交叉表的情形。
本质上看,卡方检验实际上是在看男性与女性人群在饮食口味上的分布是否一致,即男女喜欢清淡、一般和重口味的人数比例是否一致。
本例用SPSS操作的数据结构表如下:
(还不会用SPSS做卡方检验?戳此视频教程)
"xingbie"、”kouwei"、"F"分别为变量名,代表:“性别”、“口味”和“人数或频数”
SPSS变量视图
SPSS数据视图
检验结果为:
SPSS卡方检验
由上表可知 P=0.283 > 0.05,在α=0.05水平上不拒绝零假设,即不能认为该地区男女的饮食口味不同。
其中”卡方检验“表的注脚显示”0个单元格的期望计数小于5“,意味着本例的卡方检验条件满足,不需要校正。