Контрольные вопросы

1.       В чем отличие номинальной шкалы от количественной?

Приведите свои примеры.

2.       К какому типу шкалы относится цена товара? К какому типу

шкалы относится номер телевизионного канала?

3.       Вам предлагаются три варианта анкеты по оценке потреби­

тельского отношения к безалкогольным напиткам. Опреде­лите, к какому типу относятся ответы на варианты анкет.

а.  Какой безалкогольный напиток из приведенного списка

вам нравится? Pepsi, Seven Up, Sprite, «Буратино».

б.  Пожалуйста, расставьте напитки из прилагаемого списка

по степени вашего расположения к ним, оценивая наибо­лее привлекательный как 1, а наименее предпочтитель­ный как 4. Pepsi Seven Up Sprite

«Буратино»

в. Пожалуйста, укажите степень вашего расположения к ка­ждому из напитков в следующем списке, указав подходя­щую позицию на шкале:

Очень не нравится Не нравится Нравится Очень нравится

Pepsi

Seven Up

Sprite

«Буратино»

г. Пожалуйста, распределите 100 очков между каждым из напитков из прилагаемого списка в соответствии с ва­шим расположением к ним. Pepsi Seven Up Sprite

«Буратино» Описание и ввод данных

Запустите программу SPSS. Это можно сделать стандартной командой IIycK\IIporpaMMbi\SPSS for Windows. После запус­ка программы SPSS появится окно, представленное на рис. 1. Начинающим пользователям мы рекомендуем нажать кнопку Cancel (Отмена), нажатие на нее уберет это окно и активизиру­ет основное окно программы SPSS Data Editor, представленное на рис. 2.

Окно SPSS имеет строку меню, панель инструментов, стро­ку редактирования. Внизу окна SPSS существуют два ярлыка с названиями Data View (Данные) и Variable View (Перемен­ные). Эти ярлыки соответствуют двум представлениям окна. Внешне эти представления похожи на листы рабочей книги программы Microsoft Excel. Однако в отличие от Microsoft Excel это не листы рабочей книги, а два вида окна редактора данных SPSS, в одном из которых — Variable View — описыва­ются все обрабатываемые переменные, в другом — окне Data View — задаются их значения.

Файлы данных SPSS организованы по наблюдениям (стро­кам) и переменным (столбцам). Например, в маркетинговых исследованиях достаточно часто наблюдения представляют от­веты отдельных респондентов опроса, а переменные представ­ляют ответы на вопросы, задававшиеся в ходе опроса.

Каждая строка имеет номер, а каждый столбец имеет имя по умолчанию var. Это имя можно и нужно изменить для тех пе­ременных, которые бу­дут обрабатываться (как это сделать будет описано ниже). До тех пор, пока файл не бу­дет сохранен с опреде­ленным именем, в верхней части окна фигурирует надпись «Untitled - SPSS Data Editor» (безымян­ный).

Рассмотрим снача­ла ситуацию, когда пользователю надо ввести данные само­стоятельно. Если не­обходимо открыть уже созданный файл в формате SPSS, то выполняется стандартная команда File\Open (Файл\Открыть) Опишем, как вводятся данные в SPSS. На первом шаге описывают каждую из переменных — с ука­занием ее имени, типа и т.д. Для этого щелкните

 на закладке Variable View (Вид Переменной). Окно программы SPSS при­мет вид, представленный на рис. 3.

-si!

Описание каждой переменной производится в отдельной строке таблицы, представленной на рис. 3. Для каждой пере­менной нужно указать:

• Имя переменной — Name;

латинского и русского алфавита, цифры, а также символы: «_» (нижнее подчеркивание), «.» (точка), «@», «#».

Замечание: Для специалистов заметим, что проблемы с русским шрифтом в SPSS решаются, если за- CjP^5      дать правильные шрифты «по умолчанию».

Шрифты можно изменять командой Edit\ Options. В случае неудачного выбора набора шрифтов на экране появится нечитаемый текст. Возможно, придется поэкспериментировать, подбирая правильный набор шрифтов. Если не­обходимость подбора шрифтов вас смущает, пользуйтесь латинским алфавитом.

Важно1 Имя переменной обязательно должно начи­наться с буквы. В именах переменных не разре­шается использовать пробелы, знаки !, ?, «, *, скобки. Имя каждой переменной должно быть уникально. Программа SPSS не различает строчные и прописные буквы, поэтому имена SALARY, Salary и salary будут считаться иден­тичными.

Примерами допустимых имен переменных являются: salary, sex, shopl, region2.

В столбце Туре (Тип) следует указать, какой тип имеет пе­ременная. Для этого нужно щелкнуть в клетке с соответствую­щим названием. В правой части клетки появится кнопка с тре­мя точками. Нажмите на нее. В ответ появится окно Variable Туре (Тип переменной), представленное на рис. 4. Щелчком мыши выберите нужный тип переменной. Нажмите кнопку ОК.

Мы опишем наиболее часто используемые типы перемен­ных.

Numeric (Числовая). К этому типу данных относятся все числа со знаком «плюс» или «минус», целые или дробные. При

Variable Туре

выборе этого типа данных следует указать ширину — Width числа и количество знаков после занятой — Decimal Places.

Date (Дата). К допустимым значениям этого типа данных относятся даты и время.

String (Текстовая). Этот тип переменных описывает все символьные или текстовые переменные. Допустимыми значе­ниями являются буквы, цифры и специальные символы. При­мерами строковых переменных могут быть названия (напри­мер, названия универмагов ГД, ДЛТ и т.д.), коды товаров 01, 02, 03, 11, 12 и т.д. (Использование этого типа новичками опасно!)

ВниманиеI В числовых форматах десятичным разделителем может быть либо точка, либо запятая. Тип деся- Cj-F^         тичного разделителя является настройкой опе­

рационной системы Windows и зависит от на­строек диалогового окна «Язык "и региональные стандарты» на панели управления. (Панель управления вызывается командой Пуск\Панель управления.)

В столбце Width (Ширина) указывается количество симво­лов в описываемой переменной.

В столбце Decimals (Десятичные) следует указать количест­во знаков после запятой для дробных чисел.

В столбце Label (Метка) указывается название переменной. Например, переменной sex можно дать русское название «пол опрашиваемых покупателей». Надпись появляется только при создании отчетов и построении графиков, заменяя в них имя переменной.

В столбце Values (Значения) указываются возможные зна­чения переменной.

По существу эти значения являются расшифровками вве­денных кодов. Они упрощают восприятие данных пользовате­лем.

Например, значениями переменной sex будут только два значения: 1 мужской или 2 - женский. Для того чтобы их внести, необходимо в той строке, где описывается переменная

«пол», щелкнуть сначала в столбце «Значения», а зачем на кнопке с тремя точками в клетке Values (Значения). Появится диалоговое окно Value Labels (Метки значений), представлен­ное на рис. 5. В окне Values следует ввести 1, а в окне Value Label — мужской. Нажмите кнопку Add (Добавить). В окне Values следует ввести 2, а в окне Value Label - женский. На­жмите кнопку Add, а потом кнопку ОК.

Рис. 5. Диалоговое окно Value Labels (метки значений)

Для того чтобы увидеть расшифровки кодов переменной, следует переключиться в режим Data View (Панель данных), ввести для описанной переменной несколько значений и на­жать на панели инструментов кнопку Value Labels: . Вме­сто кодов переменной появятся их соответствующие расшиф­ровки.

Пример 1. Создайте переменную QUALITY (КАЧЕСТВО). Для этого переключитесь в представление Variable View. Вве­дите имя переменной. Укажите ее тип - Numeric. Укажите ко­личество знаков после запятой (Decimals)- 0, ширину пере­менной (Width) — 1. Задайте значения этой переменной: 5 — «отлично», 4 — «хорошо», 3 — «удовлетворительно», 2 - «пло­хо». Для этого щелкните на кнопке с тремя точками в клетке

VALUES. Появится диалоговое окно, представленное на рис. 5. В окне Values введите 5, а в окне Value Label — «отлично». На­жмите кнопку Add. Затем в окне Values следует ввести 4, а в окне Value Label — «хорошо». Нажмите кнопку Add и т.д. На­жмите кнопку ОК.

Если анализ обрабатываемых данных несложный, прово­дится лишь один раз и интересен лишь его результат, то можно не тратить время на значения параметров Label и Values. Если результаты будут включаться в отчет и/или презентацию, то без этих параметров не обойтись. Название переменной лучше придумать недлинное, но при этом редко можно подобрать ко­роткое и информативное название. Например, трудно приду­мать короткое название для переменной «Средний процент удачных сделок, заключенных менеджером до обучения». Можно предложить имя, аналогичное «проц до», которое бу­дет присутствовать в результатах анализа переменной. В ана­литическую записку результаты с таким сокращением вклю­чать не стоит. Если же в поле Label внести полное название «Средний процент удачных сделок, заключенных менеджером до обучения», то во ВСЕХ результатах анализа имя перемен­ной будет заменено на полное, понятное, хоть и чуть длинное название.

То же самое справедливо для значений переменной. Более того, если это поле не будет заполнено и к анализу придется вернуться через пару месяцев, то кодировка будет забыта. Придется потратить много времени, чтобы разобраться с ней заново. (Если только у вас нет абсолютной фотографической памяти.)

И наконец, следует задать последний важный параметр, описывающий переменную, — Measure (Шкала). Этот пара­метр определяет вид шкалы переменной и имеет три значе­ния: Scale (Количественная), Ordinal (Порядковая), Nominal (Номинальная). Щелкните на стрелку в столбце Measure (рис. 6).

В открывшемся списке шкал (рис. 7) выберите нужную.

Пример 2. Опишем переменные sex (пол), salary (зарплата), education (образование) (рис. 8).

1 Measure


Measure


 

Работа с пропущенными данными

Внимательный читатель заметил, что при описании полей, ха­рактеризующих переменные, мы пропустили столбец Missing (Пропущенные). Это связано с более громоздким обсуждением проблемы пропущенных значений. Рассмотрим, почему возни­кают пропущенные значения и как с ними поступают при ана­лизе статистических данных.

Часть значений оказывается пропущенной, например, из-за того, что респонденты отказываются отвечать на поставленные вопросы или дают недопустимые ответы. При сборе данных о конкурентах часть информации может оказаться недоступной. Мы встречали ситуации, когда из-за халатности персонала ин­формация неаккуратно вводилась или попросту терялась, что приводило к отсутствию некоторых значений тех или иных пе­ременных. Как правило, пропущенных или недопустимых дан­ных слишком много, чтобы их игнорировать.

Если не отфильтровать и не обозначить такие данные, ре­зультаты анализа могут оказаться некорректными. Кроме того, причина, по которой значение пропущено, возможно, является важной для анализа. Например, может оказаться полезным различать тех, кто отказался отвечать на вопрос, и тех, кто за­труднился ответить на вопрос.

Для числовых данных пустые поля и поля, содержащие не­допустимые значения, автоматически конвертируются в сис­темные пропущенные значения, обозначаемые точкой. Для то­го чтобы все пропущенные значения объединялись в группу и исключались из анализа (а иногда подлежали специальному анализу, например, при изучении анкет), необходимо их опи­сать. Это делается следующим образом:

1.       Перейдите в представление Variable View (Переменные).

2.  В ячейке Missing (Пропущенные) для соответствующей переменной щелкните на кнопку с тремя точками, чтобы от­крыть диалоговое окно Missing Values (Пропущенные значе­ния) (см. рис. 11).

3.  Выберите опцию Discrete missing values (Отдельные пр0' пущенные значения).

4.           Введите «НО» в первом текстовом поле

5.         .

6.         Нажмите кнопку ОК.

Для удобства работы с пропущенными значениями мы очень рекомендуем добавить им метки.

Щелкните в ячейке Values (Значения) в строке с описанием соответствующей переменной и нажмите появившуюся в ячей­ке кнопку, чтобы открыть диалоговое окно Value labels (Метки значений).

1.         Введите «НО» в поле Value (Значение).

2.      Введите «Нет ответа» в поле Value label (Метка значе­ния).

3.      Нажмите Add (Добавить), чтобы добавить метку в список меток значений переменной.

4.         Нажмите кнопку ОК.

Вернемся к кодам пропущенных значений, в нашем приме­ре это — 99999. Если аналитик различает причины пропуска значения, то для каждой причины использует свой код. К со­жалению, SPSS допускает не больше трех разных кодов пропу­щенных значений.

1 2 3 4 5 6 7 8 9  Наверх ↑