ТЕМА 8. НЕПАРАМЕТРИЧНІ МЕТОДИ ОЦІНКИ ТІСНОТИ ЗВ`ЯЗКУ

Серед непараметричних (емпіричних) методів оцінки тісноти зв’язку найбільше значення мають розрахунки рангових коефіцієнтів Спірмена  і Кендалла .

Ці коефіцієнти можуть бути використанні для визначення тісноти зв’язку як між кількісними, так і між якісними ознаками при умові, якщо значення цих показників можуть бути впорядковані або проранговані по спаданню або зростанню ознаки.

Для визначення рангового коефіцієнта кореляції ранжують (тобто записують у зростаючому або спадаючому порядку) всі значення факторної ознаки  і разом з тим записують відповідні значення результативної ознаки  . Другими словами, визначають ранг по обох ознаках, тобто номер кожної ознаки в рангових рядах.

Ступінь тісноти зв’язку між ознаками визначається ранговим коефіцієнтом кореляції Спірмена по формулі:

  (8.1)

де  — квадрати різниці рангів зв’язаних величин  і  ; п —число спостережень (число пар рангів).

У випадку відсутності зв’язку  ; при прямому зв’язку коефіцієнт  додатній, а при оберненому зв’язку — від’ємний.

Приклад8.1 Визначити, чи існує залежність між стажем роботи та виробітком робітника для наступних даних:

Таблиця 8.1

№ п/п           Стаж роботи робітників, х      Виробіток на 1 робітника, у

1        2,5        222

2        2,5        223

3        1          200

4        1          202

5        1          205

6        5          244

7        5          250

8        3          234

9        4,5        241

10      4,4        244

11      2,7        230

Рішення.

1. Фактори  і  ранжуємо (впорядкуємо) в порядку зростання (спадання) їх значень і заповнюємо табл. 8.2

Таблиця 8.2

                      Ранг ознаки х  Ранг ознаки у   Рангова різниця,           

1        200       4          3          1          1

1        202       4          4          0          0

1        205       4          5          -1         1

2,5     222       1,5        1          0,5        0,25

2,5     223       1,5        2          -0,5      0,25

2,7     230       11        11        0          0

3        234       8          8          0          0

4,4     241       10        9          1          1

4,5     244       9          8          1          1

5        244       6,5        8          -1,5      2,25

5        250       6,5        7          -0,5      0,25

Всього           3,5-3,5=0          7

2. Визначаємо ранги по обох ознаках, тобто номер кожної ознаки в рангованих рядах. Для рівних значень факторів х та у ранг находять шляхом ділення суми рангів, що приходяться на неї, на число рівних значень.

3. Знаходимо рангову різницю  та  .

4. Розрахуємо коефіцієнт кореляції рангів Спірмена:

 

Розрахунок рангового коефіцієнта Кендалла відбувається по формулі:

 (8.2)

де п — число спостережень; S — сума додатних та від’ємних балів по одній із зв’язаних величин, ранги котрої розміщені у відповідності з впорядкованими рангами другої.

Приклад 8.2.. В табл.6.3 приведені данні про чисельність робітників х та випуск продукції у, по десяти однотипних підприємства. Розрахувати коефіцієнти рангової кореляції Кендалла.

Таблиця 8.3

Підприємство            Чисельність робітників           Випуск продукції         Ранг ознаки     Ранг ознаки                 Бали для рангу у

          х          у          х          у                      від’ємні додатні Всього

1        2          3          4          5          6          7          8          9

1        345       23        1          1          0          0          9          9

2        485       42        4          5,5        2,25      0          4          4

3        515       37        5          3          4          1          6          7

4        622       40        6          4          4          1          5          6

5        417       30        2          2          0          3          5          8

6        450       45        3          7          16        0          3          3

7        655       42        7          5,5        2,25      1          3          4

8        815       64        8          9          1          0          1          1

9        925       73        10        10        0          0          0          0

10      878       50        9          8          1          2          0          2

Всього                                                          30,5      8          35        44

Рішення.

1. Впорядковуємо ранг по ознаці х та у, одержимо графи4, 5  табл.8.3.

2. Підраховуємо бали, починаючи з першого рангу ознаки у, рівного одиниці.

Число рангів, попередніх йому і більших його дорівнює нулю (від’ємні бали), а наступних за ним і більших його дорівнює дев’яти (додатні бали). Аналогічний розрахунок балів проводиться по всім рангам (графи 6,7);

3. Знаходимо суму додатних та від’ємних балів та загальну суму балів (графи 6, 7, 8);

4. Тоді  ; 

5. Розрахуємо коефіцієнт рангової кореляції Спірмена по даних табл 6.3.

 

Для визначення тісноти зв’язку між довільним числом рангових ознак використовуються множний коефіцієнт рангової кореляції (коефіцієнт конкордації) W, котрий розраховується по формулі:

 (8.3)

де т — кількість факторів; п — число спостережень; S — різниця між сумою квадратів сум по рядках і середнім квадратам суми сум рядків.

Приклад 8.3. Визначити по коефіцієнту  тісноту зв’язку між об’єктом реалізованої продукції, сумою накладних витрат на реалізацію, собівартістю одиниці продукції і середньою заробітною платою робітників десяти однотипних підприємств. Статистичні дані приведені в табл. 8.4.

Таблиця 8.4

Реалізація продукції, у           Накладні витрат, х       Собівартість одиниці продукції, z       Середня заробітна плата робітника, V

12,0    462       68,8      168,5

18,8    939       70,2      158,7

11,0    506       71,4      171,7

29,0    1108     78,5      188,9

17,5    872       66,9      160,4

23,4    765       69,7      165,2

35,6    1368     72,3      175,0

15,4    1002     77,5      170,4

26,1    998       65,2      162,7

20,7    804       70,7      163,0

Рішення.

1. Проводимо ранжування факторів у, х, z, V  (табл.8.5)

Таблиця 8.5

                                              Сума рядків      Квадрати сум

2        1          3          6          12        144

5        6          5          1          17        289

1        2          7          8          18        324

9        9          10        10        38        1444

4        5          2          2          13        169

7        3          4          5          19        361

10      10        8          9          37        1369

3        8          9          7          27        729

8        7          1          3          19        361

6        4          6          4          20        400

Всього           220       5590

 

Згідно формули (8.3)

 

Значущість множинного коефіцієнта рангової кореляції перевіряємо по критерію х2 Пірсона

 

Розрахункове значення критерія:

 

Табличне значення  для імовірності Р=0,95 складає  оскільки  , то значущість W підтверджується.

Одним із найпростіших показників кореляційної залежності, пов’язаний з іменем відомого німецького вченого психофізика Фехнера.

Коефіцієнт Фехнера базується на застосуванні перших ступенів відхилень всіх значень взаємозв’язаних ознак від середньої величини по кожній ознаці.

Коефіцієнт Фехнера вимірює тісноту зв’язку по наступній формулі:

  (8.4)

де  — число спів падань та не спів падань знаків відхилень значень фактичної і результативної ознак від свої середніх, тобто  При цьому фіксуються співпадання та не співпадання знаків в відхиленнях від середньої у різних пар значень ознак.

Коефіцієнт Фехнера К змінюється в межах від -1 до +1. Якщо зв’язок між ознаками обернений, то К від’ємний; у випадку прямого зв’язку — додатній. Чим ближче К до  , тим зв’язок більш тісний.

Приклад 8.4. Розрахувати коефіцієнт Фехнера для наступних даних.

Таблиця 8.6

Стаж роботи, х                    Виробіток на 1 робітника, у               Співпадання чи не співпадання знаків

2,5     -           222       -           С

2,5     -           223       -           С

1        -           200       -           С

1        -           202       -          С

1        -           205       -           С

5        +         244       +         С

5        +         250       +         С

3        +         234       +         С

4,5     +         241       +         С

4,5     +         244       +         С

2,7     -           230       +         Н

                                            

Коефіцієнт Фехнера 

Величина К досить близька до величини коефіцієнта рангової кореляції Спірмена, що свідчить про тісний зв’язок між ознаками х і у.

Для визначення тісноти зв’язку двох якісних ознак, кожна із котрих складається тільки із двох груп, використовують коефіцієнти асоціації і контингенції. Для їх розрахунку будується чотирьох клітинна таблиця кореляції, котра виражає зв’язок між двома явищами, кожне із них в свою чергу повинно бути альтернативним, тобто складається із двох якісно відмінних друг від друга значень ознаки (наприклад, хороший, поганий).

Наприклад, при вивчені залежності врожайності від кількості внесених в грунт добрив виділимо по врожайності і по кількості внесених добрив лише по дві групи. При цій умові можна побудувати наступну чотирьох клітинну таблицю.

Таблиця 8.7

Удобрено

Урожайність  Добре  Погано            Всього

Висока          а          в          a+b

Низька          с          d          c+d

Всього           à+c      b+d    

Числа, які стоять на перетині рядків і граф a, в, c, d показують, скільки дільниць зустрічаються з тою або другою кількістю добрив, що внесені в грунт, з тією або другою врожайністю.

Коефіцієнт асоціації Юла і коефіцієнт контингенції розраховується по слідуючих формулах:

асоціації Юла 

контингенції 

де a, в, c, d— кількісні характеристики досліджувальних груп.

Коефіцієнт контингенції завжди менший коефіцієнта асоціації Юла. Зв’язок рахується підтвердженим, якщо:

  або 

Приклад 8.5. Дослідити зв’язок між виконанням норм виробітку молодими робітниками і закінченням ними середньої школи. Результати обстеження характеризуються даними (табл. 8.8)

Таблиця 8.8

Групи робітників      Виконують норму       Не виконують норму  Всього

Закінчили середню школу    78        22        100

Не закінчили середню школу           32        68        100

Всього           110       90        200

Рішення. По даних таблиці 

 

Між досліджувальними ознаками спостерігається чіткий зв’язок, що підтверджується досить високими значеннями коефіцієнтів асоціації і контингенції.

Приклад 8.6. Проведено групування студентів по двох ознаках: по росту та вазі. Для цього вибрано ценз: по росту — 167 см і по вазі — 67 кг. Будемо умовно вважати «низькими» студентів, ріст котрих нижче 167  см, і «легкими» — студентів, вага котрих менша 67 кг. Результати групування об’єднанні в таблицю чотирьох полів.

Таблиця 8.9 Розподіл 500 студентів по вазі і росту

Ознака А       Число студентів по вазі            Всього

Ознака В       «легкі» (до 67 кг)          «важкі»

(більше 67 кг)           

Число студентів по росту      «низькі» (до 67 кг)       304 (а)  17 (в)    321 (а+в)

          «важкі»

(більше 67 кг)            112 (с)  67 (d)   179 (c+d)

Всього           411 (а+с)          84 (в+d)           500 (a+в+c+d)

Коефіцієнт асоціації Юла: 

Коефіцієнт асоціації близький до одиниці, що свідчить про тісний зв’язок між ростом та вагою студентів.

Коефіцієнт взаємної спряженості Пірсона і Чупрова.

Якщо кожна із якісних ознак складається більше ніж із двох груп, то для визначення тісноти зв’язку можна використати коефіцієнт взаємної спряженості Пірсона. Цей коефіцієнт розраховується по наступній формулі:

 

де q2 — показник взаємної спряженості

Коефіцієнт Чупрова:  ;

де К1, К2 — число груп по кожній із ознак.

 

Розрахунок коефіцієнта взаємної спряженості проводиться по наступній схемі (табл. 8.10)

Таблиця 8.10

Групи ознаки А        Групи ознак В Разом

          В1        В2        В3       

А1     f1         f2         f3         n1

A2     f4         f5         f6         n2

A3     f7         f8         f9         n3

Разом            т1         т2         т3        

Розрахунок q2:

по першому рядку 

по другому рядку 

по третьому рядку 

 

Приклад 8.7. .В таблиці приведені згруповані данні вартості основних виробничих фондів вартості (х) і об’єму реалізації продукції у. По кожній ознаці утворено три групи. По основних фондах: перша група < 2,5; друга група — 2,5 - 3,5 і третя група > 3,5 млн. крб. По об’єму реалізації продукції: перша група < 6,5; друга група — 6,5 - 9,5 і третя група > 9,5 мл. крб.

Таблиця 8.11

Групи підприємств по об’єму реалізації        Групи підприємств по вартості основних виробничих фондів, млн. крб., х            Разом

продукції, млн. крб., у           1,5 - 2,5            2,5 - 3,5            3,5 - 4,5           

3,5 - 6,5          48        18        3          69

6,5 - 9,5          15        30        13        58

9,5 - 12,5        —        1          7          8

Разом            63        49        23       

Рішення:

Розрахуємо q2:

по першому рядку 

по другому рядку 

по третьому рядку 

 

Підставляємо  у відповідні формули і знаходимо:

коефіцієнт Пірсона:  ;

коефіцієнт Чупрова: 

Приклад 8.8 . В таблиці 8.12 приведені згруповані дані накладних видатків (х) та собівартості продукції (у). При допомозі коефіцієнта взаємної спряженості дослідити зв’язок між собівартістю продукції та накладними витратами на реалізацію.

Таблиця 8.12.

Накладні        Собівартість    Разом

витрати         нижня  середня            висока 

Нижні            19        12        9          40

Середні         7          18        15        40

Високі           4          10        26        40

Разом            30        40        50       

Рішення.

Розрахуємо q2:

по першому рядку 

по другому рядку 

по третьому рядку 

 

Підставляємо  у відповідні формули і знаходимо:

коефіцієнт Пірсона:  = ;

коефіцієнт Чупрова: 

Досить високе значення с вказує на наявність зв’язку між собівартістю продукції та накладними витратами на реалізацію.

Непараметричні методи вимірювання зв’язку використовуються для перевірки умов використання метода найменших квадратів, незалежності розподілу ознак, однорідності вибірок, наявності тренда в рядах динаміки.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46  Наверх ↑