Контрольные вопросы
1. В чем отличие номинальной шкалы от количественной?
Приведите свои примеры.
2. К какому типу шкалы относится цена товара? К какому типу
шкалы относится номер телевизионного канала?
3. Вам предлагаются три варианта анкеты по оценке потреби
тельского отношения к безалкогольным напиткам. Определите, к какому типу относятся ответы на варианты анкет.
а. Какой безалкогольный напиток из приведенного списка
вам нравится? Pepsi, Seven Up, Sprite, «Буратино».
б. Пожалуйста, расставьте напитки из прилагаемого списка
по степени вашего расположения к ним, оценивая наиболее привлекательный как 1, а наименее предпочтительный как 4. Pepsi Seven Up Sprite
в. Пожалуйста, укажите степень вашего расположения к каждому из напитков в следующем списке, указав подходящую позицию на шкале:
Очень не нравится Не нравится Нравится Очень нравится
Pepsi
Seven Up
Sprite
«Буратино»
г. Пожалуйста, распределите 100 очков между каждым из напитков из прилагаемого списка в соответствии с вашим расположением к ним. Pepsi Seven Up Sprite
«Буратино» Описание и ввод данных
Запустите программу SPSS. Это можно сделать стандартной командой IIycK\IIporpaMMbi\SPSS for Windows. После запуска программы SPSS появится окно, представленное на рис. 1. Начинающим пользователям мы рекомендуем нажать кнопку Cancel (Отмена), нажатие на нее уберет это окно и активизирует основное окно программы SPSS Data Editor, представленное на рис. 2.
Окно SPSS имеет строку меню, панель инструментов, строку редактирования. Внизу окна SPSS существуют два ярлыка с названиями Data View (Данные) и Variable View (Переменные). Эти ярлыки соответствуют двум представлениям окна. Внешне эти представления похожи на листы рабочей книги программы Microsoft Excel. Однако в отличие от Microsoft Excel это не листы рабочей книги, а два вида окна редактора данных SPSS, в одном из которых — Variable View — описываются все обрабатываемые переменные, в другом — окне Data View — задаются их значения.
Файлы данных SPSS организованы по
наблюдениям (строкам) и переменным (столбцам). Например, в маркетинговых
исследованиях достаточно часто наблюдения представляют ответы отдельных
респондентов опроса, а переменные представляют ответы на вопросы, задававшиеся
в ходе опроса.
Каждая строка имеет номер, а каждый столбец имеет имя по умолчанию var. Это имя можно и нужно изменить для тех переменных, которые будут обрабатываться (как это сделать будет описано ниже). До тех пор, пока файл не будет сохранен с определенным именем, в верхней части окна фигурирует надпись «Untitled - SPSS Data Editor» (безымянный).
Рассмотрим сначала ситуацию, когда пользователю надо ввести данные самостоятельно. Если необходимо открыть уже созданный файл в формате SPSS, то выполняется стандартная команда File\Open (Файл\Открыть) Опишем, как вводятся данные в SPSS. На первом шаге описывают каждую из переменных — с указанием ее имени, типа и т.д. Для этого щелкните
на закладке Variable View (Вид Переменной). Окно программы SPSS примет вид, представленный на рис. 3.
-si! |
Описание каждой переменной производится в отдельной строке таблицы, представленной на рис. 3. Для каждой переменной нужно указать:
• Имя переменной —
Name;
латинского и русского алфавита, цифры, а также символы: «_» (нижнее подчеркивание), «.» (точка), «@», «#».
Замечание: Для специалистов заметим, что проблемы с русским шрифтом в SPSS решаются, если за- CjP^5 дать правильные шрифты «по умолчанию».
Шрифты
можно изменять командой Edit\ Options. В случае неудачного
выбора набора шрифтов на экране появится нечитаемый текст. Возможно, придется
поэкспериментировать, подбирая правильный набор шрифтов. Если необходимость
подбора шрифтов вас смущает, пользуйтесь латинским алфавитом.
Важно1 Имя переменной обязательно должно начинаться с буквы. В именах переменных не разрешается использовать пробелы, знаки !, ?, «, *, скобки. Имя каждой переменной должно быть уникально. Программа SPSS не различает строчные и прописные буквы, поэтому имена SALARY, Salary и salary будут считаться идентичными.
Примерами допустимых имен переменных являются: salary, sex, shopl, region2.
В столбце Туре (Тип) следует указать, какой тип имеет переменная. Для этого нужно щелкнуть в клетке с соответствующим названием. В правой части клетки появится кнопка с тремя точками. Нажмите на нее. В ответ появится окно Variable Туре (Тип переменной), представленное на рис. 4. Щелчком мыши выберите нужный тип переменной. Нажмите кнопку ОК.
Мы опишем наиболее часто используемые типы переменных.
Numeric (Числовая). К этому типу данных относятся все числа со знаком «плюс» или «минус», целые или дробные. При
выборе этого типа данных следует указать ширину — Width числа и количество знаков после занятой — Decimal Places.
Date (Дата). К допустимым значениям этого типа данных относятся даты и время.
String (Текстовая). Этот тип переменных описывает все символьные или текстовые переменные. Допустимыми значениями являются буквы, цифры и специальные символы. Примерами строковых переменных могут быть названия (например, названия универмагов ГД, ДЛТ и т.д.), коды товаров 01, 02, 03, 11, 12 и т.д. (Использование этого типа новичками опасно!)
ВниманиеI В числовых форматах десятичным разделителем может быть либо точка, либо запятая. Тип деся- Cj-F^ тичного разделителя является настройкой опе
рационной системы Windows и зависит от настроек диалогового окна «Язык "и региональные стандарты» на панели управления. (Панель управления вызывается командой Пуск\Панель управления.)
В столбце Width (Ширина) указывается количество символов в описываемой переменной.
В столбце Decimals (Десятичные) следует указать количество знаков после запятой для дробных чисел.
В столбце Label (Метка) указывается название переменной. Например, переменной sex можно дать русское название «пол опрашиваемых покупателей». Надпись появляется только при создании отчетов и построении графиков, заменяя в них имя переменной.
В столбце Values (Значения) указываются возможные значения переменной.
По существу эти значения являются расшифровками введенных кодов. Они упрощают восприятие данных пользователем.
Например, значениями переменной sex будут только два значения: 1 мужской или 2 - женский. Для того чтобы их внести, необходимо в той строке, где описывается переменная
«пол», щелкнуть сначала в столбце «Значения», а зачем на кнопке с тремя точками в клетке Values (Значения). Появится диалоговое окно Value Labels (Метки значений), представленное на рис. 5. В окне Values следует ввести 1, а в окне Value Label — мужской. Нажмите кнопку Add (Добавить). В окне Values следует ввести 2, а в окне Value Label - женский. Нажмите кнопку Add, а потом кнопку ОК.
Рис. 5. Диалоговое окно Value Labels (метки значений)
Для того чтобы увидеть расшифровки кодов переменной, следует переключиться в режим Data View (Панель данных), ввести для описанной переменной несколько значений и нажать на панели инструментов кнопку Value Labels: . Вместо кодов переменной появятся их соответствующие расшифровки.
Пример 1. Создайте переменную QUALITY (КАЧЕСТВО). Для этого переключитесь в представление Variable View. Введите имя переменной. Укажите ее тип - Numeric. Укажите количество знаков после запятой (Decimals)- 0, ширину переменной (Width) — 1. Задайте значения этой переменной: 5 — «отлично», 4 — «хорошо», 3 — «удовлетворительно», 2 - «плохо». Для этого щелкните на кнопке с тремя точками в клетке
VALUES. Появится диалоговое окно, представленное на рис. 5. В окне Values введите 5, а в окне Value Label — «отлично». Нажмите кнопку Add. Затем в окне Values следует ввести 4, а в окне Value Label — «хорошо». Нажмите кнопку Add и т.д. Нажмите кнопку ОК.
Если анализ обрабатываемых данных несложный, проводится лишь один раз и интересен лишь его результат, то можно не тратить время на значения параметров Label и Values. Если результаты будут включаться в отчет и/или презентацию, то без этих параметров не обойтись. Название переменной лучше придумать недлинное, но при этом редко можно подобрать короткое и информативное название. Например, трудно придумать короткое название для переменной «Средний процент удачных сделок, заключенных менеджером до обучения». Можно предложить имя, аналогичное «проц до», которое будет присутствовать в результатах анализа переменной. В аналитическую записку результаты с таким сокращением включать не стоит. Если же в поле Label внести полное название «Средний процент удачных сделок, заключенных менеджером до обучения», то во ВСЕХ результатах анализа имя переменной будет заменено на полное, понятное, хоть и чуть длинное название.
То же самое справедливо для значений переменной. Более того, если это поле не будет заполнено и к анализу придется вернуться через пару месяцев, то кодировка будет забыта. Придется потратить много времени, чтобы разобраться с ней заново. (Если только у вас нет абсолютной фотографической памяти.)
И наконец, следует задать последний важный параметр, описывающий переменную, — Measure (Шкала). Этот параметр определяет вид шкалы переменной и имеет три значения: Scale (Количественная), Ordinal (Порядковая), Nominal (Номинальная). Щелкните на стрелку в столбце Measure (рис. 6).
В открывшемся списке шкал (рис. 7) выберите нужную.
Пример 2. Опишем переменные sex (пол), salary (зарплата), education (образование) (рис. 8).
1 Measure |
Работа с пропущенными данными
Внимательный читатель заметил, что при описании полей, характеризующих переменные, мы пропустили столбец Missing (Пропущенные). Это связано с более громоздким обсуждением проблемы пропущенных значений. Рассмотрим, почему возникают пропущенные значения и как с ними поступают при анализе статистических данных.
Часть значений оказывается пропущенной, например, из-за того, что респонденты отказываются отвечать на поставленные вопросы или дают недопустимые ответы. При сборе данных о конкурентах часть информации может оказаться недоступной. Мы встречали ситуации, когда из-за халатности персонала информация неаккуратно вводилась или попросту терялась, что приводило к отсутствию некоторых значений тех или иных переменных. Как правило, пропущенных или недопустимых данных слишком много, чтобы их игнорировать.
Если не отфильтровать и не обозначить такие данные, результаты анализа могут оказаться некорректными. Кроме того, причина, по которой значение пропущено, возможно, является важной для анализа. Например, может оказаться полезным различать тех, кто отказался отвечать на вопрос, и тех, кто затруднился ответить на вопрос.
Для числовых данных пустые поля и поля, содержащие недопустимые значения, автоматически конвертируются в системные пропущенные значения, обозначаемые точкой. Для того чтобы все пропущенные значения объединялись в группу и исключались из анализа (а иногда подлежали специальному анализу, например, при изучении анкет), необходимо их описать. Это делается следующим образом:
1. Перейдите в представление Variable View (Переменные).
2. В ячейке Missing (Пропущенные) для соответствующей переменной щелкните на кнопку с тремя точками, чтобы открыть диалоговое окно Missing Values (Пропущенные значения) (см. рис. 11).
3. Выберите опцию Discrete missing values (Отдельные пр0' пущенные значения).
4. Введите «НО» в первом текстовом поле
5. .
6. Нажмите кнопку ОК.
Для удобства работы с пропущенными значениями мы очень рекомендуем добавить им метки.
Щелкните в ячейке Values (Значения) в строке с описанием соответствующей переменной и нажмите появившуюся в ячейке кнопку, чтобы открыть диалоговое окно Value labels (Метки значений).
1. Введите «НО» в поле Value (Значение).
2. Введите «Нет ответа» в поле Value label (Метка значения).
3. Нажмите Add (Добавить), чтобы добавить метку в список меток значений переменной.
4. Нажмите кнопку ОК.
Вернемся к кодам пропущенных значений, в нашем примере это — 99999. Если аналитик различает причины пропуска значения, то для каждой причины использует свой код. К сожалению, SPSS допускает не больше трех разных кодов пропущенных значений.