14.6 Отдельный тест по критерию хи-квадрат
С помощью этого теста проверяют, насколько значительно отличаются друг от друга наблюдаемые и ожидаемые частоты переменных, относящихся к номинальной шкале. Как правило, при этом ожидаемая частота подчиняется равномерному распределения; однако в SPSS существует возможность задать соответствующие пропорции.
Одним из примеров ожидаемого равномерного распределения частот являются кости. Предположим, Вы бросили один игральную кость 3000 раз и получили следующее частоты для выпавших очков.
Число очков |
Частота |
Число очков |
Частота |
1 |
511 |
4 |
498 |
2 |
472 |
5 |
513 |
3 |
572 |
6 |
434 |
Исходя из предположения об идеальности игральную кость (равной вероятности выпадения любого числа очков), ожидаемая частота для каждого из выпавших чисел составит 3000 / 6 = 500. Необходимо проверить, значимо ли отличаются наблюдаемые частоты от ожидаемых. Данные, а именно переменные augen (число очков) и n (частота), находятся в файле wuerfel.sav. Последнюю переменную следует применить в качестве весовой переменной.
Откройте файл wuerfel.sav.
Сначала выберите в меню Data (Данные) Weight Case (Взвесить наблюдения)
Переменную n объявите частотной (см. гл. 8.7), выберите в меню Analyze (Анализ) Nonparametric Tests (Непараметрические тесты) Chi-Square (Хи-квадрат) Откроется диалоговое окно Chi-Square Test (Тест хи-квадрат) (см. рис. 14.6).
Перенесите переменную augen в поле тестируемых переменных.
Если Вы, как в рассматриваемом примере, хотите подвергнуть анализу все категории тестируемых переменных, то оставьте в разделе Expected range (Ожидаемый диапазон) включённой опцию Get from Data (Из исходных данных); в противном случае у Вас есть возможность ограничить вовлекаемые категории посредством ввода нижней и верхней границ. Так как ожидаемые частоты одинаковы для всех категорий (была принята гипотеза о равномерном распределении), то эта предварительная установка остаётся в силе.
После нажатия кнопки Опции... у Вас появится возможность организовать вывод характеристик дескриптивной статистики и квартилей (что в данном случае является абсолютно бессмысленным).
Запустите расчёт путём нажатия ОК.
В окне просмотра появятся следующие результаты:
Augenzahl (Число очков)
Observed N (Наблюдаемое N) |
Expected N (Ожидаемое N) |
Residuals (остатки) |
|
1 |
511 |
500,0 |
11,0 |
2 |
472 |
500,0 |
-28,0 |
3 |
572 |
500,0 |
72,0 |
4 |
498 |
500,0 |
-2,0 |
5 |
513 |
500,0 |
13,0 |
6 |
434 |
500,0 |
-66,0 |
Total (Сумма) |
3000 |
|
|
Test Statistics (Статистика теста)
Augenzahl (Число) |
|
Chi-Square (Хи-квадрат) а |
21,236 |
Df |
5 |
Asymp. Sig. (Статистическая значимость) |
,001 |
a. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 500,0. (В 0 ячеек (,0%) ожидаемая частота имеет значение менее 5. Минимальная ожидаемая частота в одной ячейке равна 500,0.)
Получилось очень значимое значение критерия хи-квадрат (р = 0,001). В рассматриваемом случае желателен вывод не абсолютных, а стандартизированных остатков, определяемых по формуле:
Рис. 14.6: Диалоговое окно СЫ-Square Test (Хи-квадрат-тест)
(см. гл. 11.1). При помощи основополагающего правила, приведенного в главе 8.7.2, можно точно определить те категории, для которых наблюдается значительное отклонение наблюдаемых частот от ожидаемых:
Стандартизированные остатки >= 2,0 указывают на значительное, >= 2,6 на очень значительное и >= 3,3 на сверх значительное отклонение. Если следовать этому правилу, то в экспериментах с игральной костью наблюдается очень значимое превышение количества выпадений 3 очков и очень, очень значимое занижение количества выпадений 6 очков.
Во втором примере, который принадлежит к области ботаники, нужно проверить не равномерное распределение, а наличие распределения подчиняющегося заданному соотношению.
Потомки трёх сортов бобовой культуры были разделены на три типа, которые находятся в соотношении между собой как 1:2:1. Во время некоторого эксперимента, проведенного с сотней таких потомков тип 1 появился 29 раз, тип 2 — 44 раза и тип 3 — 27 раз. Необходимо исследовать значительно ли отклоняется полученное распределение от теоретического распределения 1:2:1.
Данные находятся в файле bohnen.sav, причём переменная typ соответствует типу, а переменная n частоте.
Откройте файл bohnen.sav.
Сначала действуйте так же, как в первом примере, и взвесьте наблюдения с частотной переменной n.
В диалоговом окне Chi-Square Test (тест Хи-квадрат) присвойте переменной typ статус тестируемой переменной.
В поле Expected values (Ожидаемые значения) активируйте в этот раз опцию Values (Значения). Введите числа 1, 2 и 1 в предусмотренное для этого поле, и щёлкните дополнительно на кнопке Add (Добавить).
Запустите расчёт путём нажатия ОК. В окне просмотра появятся следующие результаты:
Тур (Тип)
Observed N (Наблюдаемое N) |
Expected N (Ожидаемое N ) |
Residual (Остаток) |
|
1 |
29 |
25,0 |
4,0 |
2 |
44 |
50,0 |
-6,0 |
3 |
27 |
25,0 |
2,0 |
Total (Сумма) |
100 |
|
|
Test Statistics (Статистика теста)
Тур (Тип) |
|
Chi-Square (Хи-квадрат) а |
1,520 |
Of |
2 |
Asymp. Sig. (Статистическая значимость) |
,468 |
а. 0 cells (,0%) have expected frequencies less than 5. The minimum expected cell frequency is 25,0. (В 0 ячеек (,0%) ожидаемая частота имеет значение менее 5. Минимальная ожидаемая частота в одной ячейке равна 25,0.)
Ожидаемые частоты выстроены в соответствии с заданным соотношением. На сей раз значимого отклонения наблюдаемых частот от ожидаемых не наблюдается (р = 0,468).