17.4 Компоненты дисперсии
Расчёт компонентов дисперсии в общей линейной модели производится при наличии факторов со случайными эффектами. Факторами со случайными эффектами являются те факторы, слои которых были случайно выбраны из популяции (совокупности) многих возможных слоев факторов.
Проанализируем длину листьев растений растущих на одной клумбе. Для этого вырвем произвольно три растения, листья которых мы и будем измерять.
Растения |
Длина листьев (см) |
Растения |
Длина листьев (см) |
|
1 |
9,5 |
2 |
9,0 |
|
1 |
9,8 |
2 |
9,5 |
|
1 |
8,7 |
3 |
8,0 |
|
1 |
8,8 |
3 |
7,8 |
|
1 |
8,9 |
3 |
9,0 |
|
1 |
10,0 |
3 |
8,7 |
|
2 |
11,0 |
3 |
8,9 |
|
2 |
10,5 |
|
|
|
Так как из большого количества растений мы произвольно взяли для исследований только три, то здесь можно говорить о факторе со случайными эффектами. Это следует учитывать, если при помощи некоего метода дисперсионного анализа нужно будет установить, зависит ли длина листьев от конкретного растения или насколько велика та часть дисперсии, причиной которой является неоднородность растений. Эти вопросы можно прояснить при помощи расчёта компонентов дисперсии.
Откройте файл pflanze.sav.
Выберите в меню Analyze (Анализ) General Linear Model (Общая линейная модель) Variance Components... (Компоненты дисперсии)
Откроется диалоговое окно Variance Components (Компоненты дисперсии).
Поместите laenge (длина) в поле для зависимой переменной, a pflanze (растение) в поле для случайных факторов.
Пройдя через кнопку Model... (Модель) вы можете выбрать, будете ли вы рассчитывать полнофакторную модель (установка по умолчанию) или включите в расчёт только некоторые факторы. При наличии только одного фактора, как в приведенном примере, можно говорить, конечно же, только о полнофакторной модели.
Выключатель Options... (Опции) предоставляет возможность выбора между четырьмя методами оценки компонентов дисперсии. Лучшим методом считается метод MINQUE (Minimum norm quadratic unbiased estimator) (Минимум нормы квадратической несмещённой оценки); поэтому он и установлен по умолчанию.
При помощи выключателя Save... (Сохранить) вы можете сохранить некоторые результаты в файле.
Оставьте это окно без изменений и начните расчёт нажатием ОК.
Рис. 17.9: Диалоговое окно Variance Components (Компоненты дисперсии)
В окне просмотра появятся оценки компонентов дисперсии.
Factor Level Information (Информация о слоях фактора)
|
N |
|
PFLANZE (Растение) |
1,00 |
6 |
2,00 |
4 |
|
3,00 |
5 |
Dependent Variable: LAENGE (Зависимая переменная: Длина)
Variance Estimates (Оценки дисперсии)
Component (Компоненты) |
Estimate (Оценка) |
Var(PFLANZE) (Переменная (Растение)) |
,471 |
Var(Error) (Переменная (Ошибка)) |
,438 |
Dependent Variable: LAENGE (Зависимая переменная: Длина) Method: Minimum Norm Quadratic Unbiased Estimation (Weight = 1 for Random Effects and Residual) (Метод: Минимум нормы квадратичной несмещённой оценки (Вес = 1 для случайных эффектов и остатков))
На основе этих результатов можно найти процентную долю дисперсии, получающуюся из-за наличия разных растений:
0,471/(0,471+0,438)=51,8%
Приведём ещё один несколько усложненный пример из учебника SPSS. На некоторой фирме, работающей в области электроники, в 36 различных печах при различных температурах (550 и 600 градусов по Фаренгейту) измеряют выносливость (в минутах) определенных радиоэлектронных комплектующих. Один инженер предполагает, что не все печи создают одинаковые условия для тестирования комплектующих. Чтобы это проверить, он случайно выбирает три печи и для каждой печи делает по три измерения выносливости комплектующих для каждой из температур.
Данные находятся в файле ofen.sav в переменных of en (печь), temp (температура) и zeit (время). Переменная ofen (печь) соответствует фактору со случайными эффектами, так как из 36 печей три были выбраны случайно. Температура также является фактором со случайными эффектами, так как температуры 550 и 600 градусов были выбраны из бесконечного множества возможных температур.
Так как вполне возможно, что в разных печах действуют различные температурные режимы, предположим, что температурный фактор является вложенным в фактор печей — т.н. ("гнездовая компоновка'").
Откройте файл ofen.sav.
Откройте так, как было изложено ранее, диалоговое окно Variance Components (Компоненты дисперсии).
Переменную zeit (время) поместите в поле зависимых переменных, а переменные ofen (печь) и temp (температура) в поле случайных факторов.
Мы должны здесь также учесть и вложенность фактора temp (температура) в фактор ofen (печь). Это можно осуществить только при помощи программного синтаксиса.
Щёлкните по выключателю Paste (Внести) для того, чтобы перенести синтаксис данной команды в редактор синтаксиса.
В редакторе будет показан следующий синтаксис:
VARCOMP
zeit BY ofen temp
/RANDOM = ofen temp
/METHOD = MINQUE (1)
/DESIGN
/INTERCEPT = INCLUDE .
Дополните вспомогательную команду DESIGN следующим образом:
VARCOMP
zeit BY ofen temp
/RANDOM = ofen temp
/METHOD = MINQUE (1)
/DESIGN = ofen temp(ofen)
/INTERCEPT = INCLUDE .
Запустите команду на исполнение при помощи кнопки Run Current. В окне просмотра появятся следующие оценки дисперсии:
Variance Estimates (Оценки дисперсии)
Component (Компонент) |
Estimate (Оценка) |
Var(OFEN) (Переменная (Печь)) |
29,287 |
Var(TEMP(OFEN)) (Переменная Температура (Печь)) |
1525,889 |
Var(Error) (Переменная (Ошибка)) |
69,778 |
Dependent Variable: ZEIT (Зависимая переменная: Время) Method: Minimum Norm Quadratic Unbiased Estimation (Weight = 1 for Random Effects and Residual) (Метод: Минимум нормы квадратичной несмещённой оценки (Вес = 1 для случайных эффектов и остатков))
Из таблицы можно узнать, что доля дисперсии объясняемая наличием разных печей очень незначительна:
[29, 287/(29,287 + 1525,889 + 69,778)]*100 = 1,8%
До этого момента мы рассматривали только модели со случайными эффектами. Модели, содержащие как случайные, так и постоянные эффекты, получили название "смешанных" моделей.
И, наконец, следует указать на то, что методы MINQUE и ANOVA иногда могут выдавать негативные оценки компонентов дисперсии, что собственно противоречит самому определению дисперсии. Это может происходить потому, что количество наблюдений слишком мало, некоторые значения отсутствуют или выбран неподходящий метод оценки.