Шкалирование

В пакете SPSS для каждой переменной надо определить одну из трех шкал. Аналитик задает для переменной тип шкалы, для того чтобы указать пакету SPSS, какие операции разрешены, а какие нет при анализе данной переменной.

Почему некоторые операции могут быть запрещены?

Если ученик решает на уроке математики задачу и получает ответ «Для выполнения работы в течение часа требуется пол­тора землекопа», то он понимает, что с решением что-то не так.

С другой стороны, ответ «Работа будет выполнена за полтора часа» не будет абсурдным. Получается, что иногда число 1,5 допустимо, разрешено, а иногда запрещено.

Приведем другой пример. При опросе покупателей регист­рировалось место жительства респондента, при этом ответ «Я житель Всеволожска» кодировался числом 1, ответ «Я житель Выборга» — числом 2, а ответ «Я житель Петербурга» — чис­лом 3. Вдобавок во всех городах было опрошено одинаковое количество респондентов. Среднее арифметическое ответов на вопрос «В каком городе вы живете?» будет равно 2, т.е. в сред­нем все опрошенные живут в Выборге. Ответ бессмысленный, в такой ситуации нельзя вычислять среднее арифметическое, да и складывать коды городов тоже нельзя. Подобные случаи всем вполне понятны.

Итак, есть ситуации, когда человек принимает решение «ав­томатически». Но статистический анализ проводится вместе с пакетом SPSS, а у пакета нет вашего житейского опыта. На многое ему надо указывать. Чтобы предупредить возможные ошибки с запрещенными числами и операциями, введено поня­тие шкалы, в которой измерена переменная.

Номинальная шкала задается для переменных, значения ко­торых являются условными именами. Обычно эти имена могут быть пронумерованы, номера используются в качестве кодов.- При этом сам номер не несет никакой смысловой нагрузки.

Типичные примеры переменных, измеренных в номиналь­ной шкале, — имя, фамилия, пол, национальность, цвет, город, номер страхового полиса и т.д. Если переменная измерена в но­минальной шкале, то те коды, которые используются для зна­чений этой переменной, никак не характеризуют количествен­ные свойства рассматриваемого объекта. Очевидно, что, сравнивая номера, присвоенные нескольким универмагам, не­возможно выяснить, какой из универмагов лучше или хуже ос­тальных. Бессмысленно также искать среднее значение номера универмага. Иногда в литературе вместо термина «номиналь­ная шкала» используется термин «шкала наименований».

При использовании номинальной шкалы единственно дос­тупная операция — это подсчет. Например, рассмотрим выбор­ку из 60 мужчин и 40 женщин, для мужчин выбран код 1, а для

женщин — код 2. В такой ситуации не имеет смысла говорить что среднее значение пола равно 1,4, хотя расчет даст нам именно число 1,4 = (60 ■ 1 + 40 • 2) : 100. Мы можем заключить только, что в выборке больше мужчин или ЧТО 60% выборки составляют мужчины.

В программе SPSS номинальная шкала называется Nominal (Номинальная).

Говорят, что переменная измерена в порядковой (ранговой) шкале, если значения переменной можно сравнивать между со­бой, но величина разности значений не имеет смысла.

Примерами переменных, измеренных в порядковой шкале, являются сорта товаров (высший сорт, первый сорт, второй сорт); ранги предпочтений покупателей (1 — наиболее привле­кательный товар, 2 — малопривлекательный, 3 — непривлека­тельный товар).

В программе SPSS порядковая шкала называется Ordinal (Порядковая).

Например, в маркетинге часто используется выставление оценок некоторым показателям (товаров, услуг и т.д.) в соот­ветствии с определенной оценочной шкалой. Всевозможные рейтинги, оценка качества услуг в баллах измеряются в поряд­ковой шкале.

Различия между номинальной и порядковой шкалами хоро­шо видны на примере с тремя переменными — стартовый но­мер спортсменов-бегунов, место, которое спортсмен занял в ре­зультате соревнований

, и время, за которое он пробежал дистанцию. Номера получены спортсменами при жеребьевке до начала соревнования и ничего не означают. Это просто чис­ла, которые произвольным образом приписаны спортсменам, чтобы проще было отличать их друг от друга. Эти числа не имеют никакого отношения к месту, которое позднее займет спортсмен. Переменная «номер» измеряется в номинальной шкале. По окончании забега каждый бегун занимает опреде­ленное место среди спортсменов. Переменная «место спортсме­на, занятое им на данных соревнованиях» измеряется в поряд­ковой шкале. Важно понимать, что сами по себе места не характеризуют качество спортивного результата. Школьник, занявший первое место на школьных соревнованиях, показы­вает результат, который будет намного хуже результата, пока­занного олимпийским чемпионом на такой же дистанции. Бо­лее того, на одном соревновании разница во времени между первым и вторым и между вторым и третьим может сильно различаться, хотя разность между местами одна и та же... Обра­щаем внимание: разность мест дает мало информации о разни­це результатов. Результаты бегунов (время преодоления дис­танции) измеряются в количественной шкале.

Достаточно часто значения переменной носят условный ха­рактер. Например, данные о предпочтениях по отношению к различным товарам среди опрошенных людей. Анализ таких данных требует особой осторожности, так как многие требова­ния классических статистических методов (например, предпо­ложение о каком-либо конкретном (скажем, нормальном) зако­не распределения) для них не выполняются. Например, при анализе анкет с данными о симпатиях к торговым маркам мы можем сказать, что товарная марка, получившая больший балл в анкете, более симпатична респонденту, чем товарная марка (или товар), получившая меньший балл. Но насколько или во сколько раз он более привлекателен, сказать нельзя, так как для предпочтений нет объективной единицы измерения. В этих случаях имеет смысл вообще отказаться от конкретных зна­чений данных, а исследовать только информацию об их вза­имной упорядоченности (какое больше, какое меньше). Неко­торые статистические методы, например «Совместный ана­лиз», созданы специально для того, чтобы преодолеть такой недостаток.

Другими примерами величин, измеренных в ранговой шка­ле, будут рейтинги, например место компании в списке 100 лучших компаний.

Количественная шкала позволяет отражать количественные характеристики исследуемых объектов.

Примерами данных, отражаемых в количественной шкале, являются суммы денег, потраченные на покупки в одном уни­вермаге, возраст, рост респондентов, размер их заработной пла-

ты. Чаще всего это характеристики, измеренные в рублях, мет­рах, секундах, килограммах.

В программе SPSS количественная шкала называется Scale (Количественная).

Часто от исходных числовых данных, измеренных в количе­ственной шкале, переходят к их рангам, т.е. переходят к поряд­ковой шкале. Упорядочение проводится от меньших значений к большим или наоборот, для анализа порядок не существенен. Номер места, которое занимает наблюдение в таком упорядо­ченном ряду, называется рангом соответствующего наблюде­ния.

Пример. Выборка состоит из чисел 7, 5, 12, 2, 8, 16. Упоря­дочение проводим от меньшего к большему. Тогда первый ранг будет иметь число 2 (самое маленькое), второй ранг — 5, тре­тий - 7, четвертый — 8, пятый ранг — 16 (самое большое чис­ло).

Процедура перехода от совокупности наблюдений к после­довательности их рангов называется ранжированием. Стати­стические методы, в которых мы делаем выводы о данных на основании их рангов, называются ранговыми (или порядковы­ми). Они получили широкое распространение, так как надежно работают при очень слабых ограничениях на исходные данные (не требуя, например, чтобы эти данные имели какой-либо конкретный закон распределения).

Заметим, что некоторые авторы выделяют несколько вари­антов количественной шкалы. Вслед за разработчиками пакета SPSS мы ограничимся тремя типами переменных.

В табл. 2 приведены основные типы шкал, их характеристи­ки, а также некоторые примеры.

Запоминать коды не нужно, если вы пользуетесь сущест­вующими в SPSS «ярлыками значений», описанными в сле­дующем разделе. В этом случае анализ проводится в оптималь­ном режиме: статистический пакет производит все вычисления с кодами (как ему удобно), а в результатах статистической об­работки каждый код будет заменен на соответствующее тексто­вое описание значения переменной, понятное человеку, анали­зирующему данные.

Таблица 2

Основные типы шкал

Шкала

Основные характеристики

Примеры

примеры ИЗ экономики |

Номинальная

Числа обозна­чают или клас­сифицируют объекты

Номера спорт­сменов, номера домов

Обозначения ! марок товаров, типов магази- ; нов, пол ,

Порядковая

Числа позво­ляют сравни­вать объекты друг с другом, но не характе­ризуют вели­чину различий между ними

Ранги качеств, места команд в турнире

I

Ранги пред- | почтений, ры­ночная пози- ' ция, социаль- | ный класс, от- ! ношение К ; товару

Количест­венная

Числа соответ­ствуют количе­ственным ха­рактеристикам объекта

Длина, темпе­ратура, время

Возраст, доход, \ затраты, объе- ! мы продаж, до­ли рынка !

 

Примеры:

1.       Задавая вопрос «В среднем сколько сигарет вы выкури­ваете в день?», мы получим ответ, измеренный в количествен­ной шкале. Если респондент упорядочивает сорта сигарет в со­ответствии со своими предпочтениями, то мы получаем ответ в порядковой (ранговой) шкале. Если респондент называет свой любимый сорт сигарет, то мы получаем ответ в номинальной шкале.

2.       На вопрос «Сколько времени вам надо, чтобы добраться от вашего места жительства до ближайшего магазина нашей фирмы?» мы получим ответ, измеренный в количественной шкале. Если мы спрашиваем респондента, до какого магазина ему удобнее добираться — нашего или магазина конкурента, то мы получаем ответ в порядковой (ранговой) шкале.

Переменные, измеренные в непрерывной шкале, могут быть преобразованы в порядковую шкалу или в номинальную шкалу.

Для преобразования в номинальную шкалу переменной, ра­нее измеренной в непрерывной шкале, проводят группировку значений переменной.

Например, непрерывную переменную «возраст» можно пре­образовать в номинальную переменную, образуя следующие категории: от 18 до 24, от 25 до 34, от 35 до 44 и т.д.

Для преобразования в порядковую шкалу переменной, ра­нее измеренной в непрерывной шкале, проводят ранжирование значений переменной.

1 2 3 4 5 6 7 8 9  Наверх ↑