ТЕМА 8. НЕПАРАМЕТРИЧНІ МЕТОДИ ОЦІНКИ ТІСНОТИ ЗВ`ЯЗКУ
Серед непараметричних (емпіричних) методів оцінки тісноти зв’язку найбільше значення мають розрахунки рангових коефіцієнтів Спірмена і Кендалла .
Ці коефіцієнти можуть бути використанні для визначення тісноти зв’язку як між кількісними, так і між якісними ознаками при умові, якщо значення цих показників можуть бути впорядковані або проранговані по спаданню або зростанню ознаки.
Для визначення рангового коефіцієнта кореляції ранжують (тобто записують у зростаючому або спадаючому порядку) всі значення факторної ознаки і разом з тим записують відповідні значення результативної ознаки . Другими словами, визначають ранг по обох ознаках, тобто номер кожної ознаки в рангових рядах.
Ступінь тісноти зв’язку між ознаками визначається ранговим коефіцієнтом кореляції Спірмена по формулі:
(8.1)
де — квадрати різниці рангів зв’язаних величин і ; п —число спостережень (число пар рангів).
У випадку відсутності зв’язку ; при прямому зв’язку коефіцієнт додатній, а при оберненому зв’язку — від’ємний.
Приклад8.1 Визначити, чи існує залежність між стажем роботи та виробітком робітника для наступних даних:
Таблиця 8.1
№ п/п Стаж роботи робітників, х Виробіток на 1 робітника, у
1 2,5 222
2 2,5 223
3 1 200
4 1 202
5 1 205
6 5 244
7 5 250
8 3 234
9 4,5 241
10 4,4 244
11 2,7 230
Рішення.
1. Фактори і ранжуємо (впорядкуємо) в порядку зростання (спадання) їх значень і заповнюємо табл. 8.2
Таблиця 8.2
Ранг ознаки х Ранг ознаки у Рангова різниця,
1 200 4 3 1 1
1 202 4 4 0 0
1 205 4 5 -1 1
2,5 222 1,5 1 0,5 0,25
2,5 223 1,5 2 -0,5 0,25
2,7 230 11 11 0 0
3 234 8 8 0 0
4,4 241 10 9 1 1
4,5 244 9 8 1 1
5 244 6,5 8 -1,5 2,25
5 250 6,5 7 -0,5 0,25
Всього 3,5-3,5=0 7
2. Визначаємо ранги по обох ознаках, тобто номер кожної ознаки в рангованих рядах. Для рівних значень факторів х та у ранг находять шляхом ділення суми рангів, що приходяться на неї, на число рівних значень.
3. Знаходимо рангову різницю та .
4. Розрахуємо коефіцієнт кореляції рангів Спірмена:
Розрахунок рангового коефіцієнта Кендалла відбувається по формулі:
(8.2)
де п — число спостережень; S — сума додатних та від’ємних балів по одній із зв’язаних величин, ранги котрої розміщені у відповідності з впорядкованими рангами другої.
Приклад 8.2.. В табл.6.3 приведені данні про чисельність робітників х та випуск продукції у, по десяти однотипних підприємства. Розрахувати коефіцієнти рангової кореляції Кендалла.
Таблиця 8.3
Підприємство Чисельність робітників Випуск продукції Ранг ознаки Ранг ознаки Бали для рангу у
х у х у від’ємні додатні Всього
1 2 3 4 5 6 7 8 9
1 345 23 1 1 0 0 9 9
2 485 42 4 5,5 2,25 0 4 4
3 515 37 5 3 4 1 6 7
4 622 40 6 4 4 1 5 6
5 417 30 2 2 0 3 5 8
6 450 45 3 7 16 0 3 3
7 655 42 7 5,5 2,25 1 3 4
8 815 64 8 9 1 0 1 1
9 925 73 10 10 0 0 0 0
10 878 50 9 8 1 2 0 2
Всього 30,5 8 35 44
Рішення.
1. Впорядковуємо ранг по ознаці х та у, одержимо графи4, 5 табл.8.3.
2. Підраховуємо бали, починаючи з першого рангу ознаки у, рівного одиниці.
Число рангів, попередніх йому і більших його дорівнює нулю (від’ємні бали), а наступних за ним і більших його дорівнює дев’яти (додатні бали). Аналогічний розрахунок балів проводиться по всім рангам (графи 6,7);
3. Знаходимо суму додатних та від’ємних балів та загальну суму балів (графи 6, 7, 8);
4. Тоді ;
5. Розрахуємо коефіцієнт рангової кореляції Спірмена по даних табл 6.3.
Для визначення тісноти зв’язку між довільним числом рангових ознак використовуються множний коефіцієнт рангової кореляції (коефіцієнт конкордації) W, котрий розраховується по формулі:
(8.3)
де т — кількість факторів; п — число спостережень; S — різниця між сумою квадратів сум по рядках і середнім квадратам суми сум рядків.
Приклад 8.3. Визначити по коефіцієнту тісноту зв’язку між об’єктом реалізованої продукції, сумою накладних витрат на реалізацію, собівартістю одиниці продукції і середньою заробітною платою робітників десяти однотипних підприємств. Статистичні дані приведені в табл. 8.4.
Таблиця 8.4
Реалізація продукції, у Накладні витрат, х Собівартість одиниці продукції, z Середня заробітна плата робітника, V
12,0 462 68,8 168,5
18,8 939 70,2 158,7
11,0 506 71,4 171,7
29,0 1108 78,5 188,9
17,5 872 66,9 160,4
23,4 765 69,7 165,2
35,6 1368 72,3 175,0
15,4 1002 77,5 170,4
26,1 998 65,2 162,7
20,7 804 70,7 163,0
Рішення.
1. Проводимо ранжування факторів у, х, z, V (табл.8.5)
Таблиця 8.5
Сума рядків Квадрати сум
2 1 3 6 12 144
5 6 5 1 17 289
1 2 7 8 18 324
9 9 10 10 38 1444
4 5 2 2 13 169
7 3 4 5 19 361
10 10 8 9 37 1369
3 8 9 7 27 729
8 7 1 3 19 361
6 4 6 4 20 400
Всього 220 5590
Згідно формули (8.3)
Значущість множинного коефіцієнта рангової кореляції перевіряємо по критерію х2 Пірсона
Розрахункове значення критерія:
Табличне значення для імовірності Р=0,95 складає оскільки , то значущість W підтверджується.
Одним із найпростіших показників кореляційної залежності, пов’язаний з іменем відомого німецького вченого психофізика Фехнера.
Коефіцієнт Фехнера базується на застосуванні перших ступенів відхилень всіх значень взаємозв’язаних ознак від середньої величини по кожній ознаці.
Коефіцієнт Фехнера вимірює тісноту зв’язку по наступній формулі:
(8.4)
де — число спів падань та не спів падань знаків відхилень значень фактичної і результативної ознак від свої середніх, тобто При цьому фіксуються співпадання та не співпадання знаків в відхиленнях від середньої у різних пар значень ознак.
Коефіцієнт Фехнера К змінюється в межах від -1 до +1. Якщо зв’язок між ознаками обернений, то К від’ємний; у випадку прямого зв’язку — додатній. Чим ближче К до , тим зв’язок більш тісний.
Приклад 8.4. Розрахувати коефіцієнт Фехнера для наступних даних.
Таблиця 8.6
Стаж роботи, х Виробіток на 1 робітника, у Співпадання чи не співпадання знаків
2,5 - 222 - С
2,5 - 223 - С
1 - 200 - С
1 - 202 - С
1 - 205 - С
5 + 244 + С
5 + 250 + С
3 + 234 + С
4,5 + 241 + С
4,5 + 244 + С
2,7 - 230 + Н
Коефіцієнт Фехнера
Величина К досить близька до величини коефіцієнта рангової кореляції Спірмена, що свідчить про тісний зв’язок між ознаками х і у.
Для визначення тісноти зв’язку двох якісних ознак, кожна із котрих складається тільки із двох груп, використовують коефіцієнти асоціації і контингенції. Для їх розрахунку будується чотирьох клітинна таблиця кореляції, котра виражає зв’язок між двома явищами, кожне із них в свою чергу повинно бути альтернативним, тобто складається із двох якісно відмінних друг від друга значень ознаки (наприклад, хороший, поганий).
Наприклад, при вивчені залежності врожайності від кількості внесених в грунт добрив виділимо по врожайності і по кількості внесених добрив лише по дві групи. При цій умові можна побудувати наступну чотирьох клітинну таблицю.
Таблиця 8.7
Удобрено
Урожайність Добре Погано Всього
Висока а в a+b
Низька с d c+d
Всього à+c b+d
Числа, які стоять на перетині рядків і граф a, в, c, d показують, скільки дільниць зустрічаються з тою або другою кількістю добрив, що внесені в грунт, з тією або другою врожайністю.
Коефіцієнт асоціації Юла і коефіцієнт контингенції розраховується по слідуючих формулах:
асоціації Юла
контингенції
де a, в, c, d— кількісні характеристики досліджувальних груп.
Коефіцієнт контингенції завжди менший коефіцієнта асоціації Юла. Зв’язок рахується підтвердженим, якщо:
або
Приклад 8.5. Дослідити зв’язок між виконанням норм виробітку молодими робітниками і закінченням ними середньої школи. Результати обстеження характеризуються даними (табл. 8.8)
Таблиця 8.8
Групи робітників Виконують норму Не виконують норму Всього
Закінчили середню школу 78 22 100
Не закінчили середню школу 32 68 100
Всього 110 90 200
Рішення. По даних таблиці
Між досліджувальними ознаками спостерігається чіткий зв’язок, що підтверджується досить високими значеннями коефіцієнтів асоціації і контингенції.
Приклад 8.6. Проведено групування студентів по двох ознаках: по росту та вазі. Для цього вибрано ценз: по росту — 167 см і по вазі — 67 кг. Будемо умовно вважати «низькими» студентів, ріст котрих нижче 167 см, і «легкими» — студентів, вага котрих менша 67 кг. Результати групування об’єднанні в таблицю чотирьох полів.
Таблиця 8.9 Розподіл 500 студентів по вазі і росту
Ознака А Число студентів по вазі Всього
Ознака В «легкі» (до 67 кг) «важкі»
(більше 67 кг)
Число студентів по росту «низькі» (до 67 кг) 304 (а) 17 (в) 321 (а+в)
«важкі»
(більше 67 кг) 112 (с) 67 (d) 179 (c+d)
Всього 411 (а+с) 84 (в+d) 500 (a+в+c+d)
Коефіцієнт асоціації Юла:
Коефіцієнт асоціації близький до одиниці, що свідчить про тісний зв’язок між ростом та вагою студентів.
Коефіцієнт взаємної спряженості Пірсона і Чупрова.
Якщо кожна із якісних ознак складається більше ніж із двох груп, то для визначення тісноти зв’язку можна використати коефіцієнт взаємної спряженості Пірсона. Цей коефіцієнт розраховується по наступній формулі:
де q2 — показник взаємної спряженості
Коефіцієнт Чупрова: ;
де К1, К2 — число груп по кожній із ознак.
Розрахунок коефіцієнта взаємної спряженості проводиться по наступній схемі (табл. 8.10)
Таблиця 8.10
Групи ознаки А Групи ознак В Разом
В1 В2 В3
А1 f1 f2 f3 n1
A2 f4 f5 f6 n2
A3 f7 f8 f9 n3
Разом т1 т2 т3
Розрахунок q2:
по першому рядку
по другому рядку
по третьому рядку
Приклад 8.7. .В таблиці приведені згруповані данні вартості основних виробничих фондів вартості (х) і об’єму реалізації продукції у. По кожній ознаці утворено три групи. По основних фондах: перша група < 2,5; друга група — 2,5 - 3,5 і третя група > 3,5 млн. крб. По об’єму реалізації продукції: перша група < 6,5; друга група — 6,5 - 9,5 і третя група > 9,5 мл. крб.
Таблиця 8.11
Групи підприємств по об’єму реалізації Групи підприємств по вартості основних виробничих фондів, млн. крб., х Разом
продукції, млн. крб., у 1,5 - 2,5 2,5 - 3,5 3,5 - 4,5
3,5 - 6,5 48 18 3 69
6,5 - 9,5 15 30 13 58
9,5 - 12,5 — 1 7 8
Разом 63 49 23
Рішення:
Розрахуємо q2:
по першому рядку
по другому рядку
по третьому рядку
Підставляємо у відповідні формули і знаходимо:
коефіцієнт Пірсона: ;
коефіцієнт Чупрова:
Приклад 8.8 . В таблиці 8.12 приведені згруповані дані накладних видатків (х) та собівартості продукції (у). При допомозі коефіцієнта взаємної спряженості дослідити зв’язок між собівартістю продукції та накладними витратами на реалізацію.
Таблиця 8.12.
Накладні Собівартість Разом
витрати нижня середня висока
Нижні 19 12 9 40
Середні 7 18 15 40
Високі 4 10 26 40
Разом 30 40 50
Рішення.
Розрахуємо q2:
по першому рядку
по другому рядку
по третьому рядку
Підставляємо у відповідні формули і знаходимо:
коефіцієнт Пірсона: = ;
коефіцієнт Чупрова:
Досить високе значення с вказує на наявність зв’язку між собівартістю продукції та накладними витратами на реалізацію.
Непараметричні методи вимірювання зв’язку використовуються для перевірки умов використання метода найменших квадратів, незалежності розподілу ознак, однорідності вибірок, наявності тренда в рядах динаміки.
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 Наверх ↑