Зависимые и независимые переменные
Разработчики SPSS активно используют понятия «зависимая переменная» и «независимая переменная», в частности эти термины встречаются в процедурах пакета при исследовании статистических закономерностей. Работая с пакетом SPSS, нам придется пользоваться этими терминами.
Независимыми переменными называются переменные, которые используются для объяснения или предсказания значений других переменных, а именно — зависимых переменных. Примерами независимых переменных являются пол покупателей, количественный состав их семьи, доход, покупательские возможности.
Зависимые переменные — это переменные, значения которых зависят от значений независимых переменных, быть может, даже определяются ими.
Например, в регрессионном анализе предполагается, что зависимая переменная является функцией независимых переменных. Примерами зависимых переменных могут служить оценка покупателем товара, предпочтение товара и т.д.
Зависимость одних переменных от других обычно отражает мнение аналитика о структуре явления и является его гипотезой. Совокупность всех предположений (гипотез) исследователя будет называться моделью явления. Поведение экспериментальных данных может соответствовать гипотезе, тогда вера исследователя в гипотезу подкрепляется. Дело даже может зайти настолько далеко, что гипотеза превратится в закон. Например, гипотеза может звучать так: «Если цены на золото упали, то через две недели упадут цены на серебро». Если данные противоречат гипотезе, от нее отказываются. Если данные подкрепляют гипотезу, исследование развивается дальше, гипотеза уточняется и подправляется.
Применение зависимых и независимых переменных имеет свои достоинства и недостатки. Перечислим некоторые из них. Неудачны сами термины, так как возможна путаница с фундаментальным понятием независимости в теории вероятности1. На разных этапах исследования одни и те же переменные могут быть то зависимыми, то независимыми. Кроме того, суще-
'В результате сплошь и рядом изучают характер зависимости независимых переменных. Так получается, когда зависимость понимается в вероятностном смысле, а независимость — как в обсуждаемом определении.
ствуют методы, например кластерный анализ или многомерное шкалирование, в которых все переменные независимые. В факторном анализе и анализе главных компонент зависимые переменные являются целью исследования.
При этом, выделение зависимых и независимых переменных помогает новичку при выборе метода анализа.
При проведении исследований независимые переменные часто служат для разделения объекта исследования на группы. Например, если изучается отличие реакции на новый товар покупателей с высшим и средним образованием, то при статистической обработке результатов переменная «образование» может считаться независимой, а переменная «предпочтение товара» — зависимой.
Вернемся к данным, приведенным в табл. 1. В этом случае независимыми переменными являются пол покупателя, образование, заработная плата. Зависимой переменной является тип выбранного покупателем телефона.
Если аналитика интересует, как зависит выбор марки телефона от социальных и демографических характеристик покупателя, то переменные «пол», «заработная плата» и «образование» будут объявлены независимыми переменными, а переменная «тип мобильного телефона» — зависимой.
Рассмотрим теперь другую ситуацию, когда исследователь пытается спрогнозировать, какой тариф выберет абонент. В этом случае переменная «тариф» станет зависимой, а переменные «пол», «заработная плата», «образование» и «тип мобильного телефона» будут независимыми. Таким образом, в зависимости от решаемой задачи отношение аналитика к переменным может меняться: в разных ситуациях одна и та же переменная может быть как зависимой, так и независимой.