Тема 2.3.  -критерій Розенбаума

Призначення критерію. Критерій використовується для оцінки розбіж¬ностей між двома вибірками за рівнем будь-якої досліджуваної ознаки, яка кількісно виміряна і у кожній з вибірок повинно бути не менше 11 піддослідних.

Опис критерію. Це досить простий непараметричний критерій, який дозволяє швидко оцінити розбіжності між двома вибірками за якою-небудь ознакою. Однак, якщо критерій  не виявляє достовірних розбіжностей, то це ще не означає, що їх дійсно немає. В цьому випадку слід застосовувати критерій  Фішера. Якщо ж  -критерій виявляє достовірні розбіжності між вибірками з рівнем значущості  , то можна обмежитись лише ним і уникнути труднощів застосування інших критеріїв. Критерій застосовується у тих випадках, коли дані представлені у крайньому випадку в порядковій шкалі. Ознака повинна варіювати у деякому діапазоні значень, інакше співставлення за допомогою критерію Розенбаума просто неможливі. Даний метод вимагає достатньо точно виміряних ознак.

Застосування критерію розпочинаємо з того, що впорядковуємо значення ознаки в обох вибірках за зростанням (або спаданням) ознаки. Краще якщо дані кожного піддослідного представлені на окремій картці. Тоді неважко впорядкувати два ряди значень за ознакою, що нас цікавить, розкладаючи картки на столі. Таким чином одразу буде видно, чи співпадають діапазони значень, і, якщо ні, то наскільки один ряд значень «вище»  , а другий – «нижче»  . Для того, щоб не заплутатись, у цьому та інших критеріях рекомендується першим рядом (вибіркою, групою) вважати той ряд, де значення вище, а другим – той, де значення нижче.

Гіпотези

 : Рівень ознаки у вибірці 1 не перевищує рівня ознаки у вибірці 2.

 : Рівень ознаки у вибірці 1 перевищує рівень ознаки у вибірці 2.

Графічне представлення критерію 

На рисунку представлені три варіанта співвідношення рядів значень у двох вибірках. У варіанті (а) всі значення першого ряду вище усіх значень другого ряду. Розбіжності, безумовно, достовірні, при дотриманні умови, що 

У варіанті (б), навпаки, обидва ряди знаходяться на одному і тому ж рівні: розбіжності недостовірні. У варіанті (в) ряди частково перекриваються, але все ж таки перший ряд виявляється суттєво вище другого. Чи достатньо великі зони  і  , які у сумі складають  , можна визначити за таблицею критичних значень в залежності від значень  . Чим величина  більша, тим більш достовірні розбіжності можна констатувати.

а)   б) в)

 

Обмеження критерію

1. У кожній з вибірок, що співставляються, повинно бути не менше 11 спостережень. При цьому об’єми вибірок повинні відповідати наступним правилам:

1) якщо в обох вибірках менше 50 спостережень, то абсолютна величина різниці між  і  не повинна бути більша 10 спостережень;

2) якщо в кожній з вибірок більше 51 спостереження, але менше 100, то абсолютна величина різниці між  і  не повинна бути більша 20 спостережень;

3) якщо в кожній з вибірок більше 100 спостережень, то допускається, щоб одна з вибірок була більше другої, але не більше ніж в 1,5-2 рази.

2. Діапазони розкидання значень у двох вибірках повинні не співпадати між собою, у пролежаному випадку застосування критерію не має змісту. Між іншим, можливі випадки, коли діапазони розкидання значень співпадають, але, внаслідок різносторонньої асиметрії двох розподілів, розбіжності у середніх величинах ознак істотні.

Правило ранжування

1. Меншому значенню нараховується менший ранг. Найменшому значенню нараховується ранг 1. Найбільшому значенню нараховується ранг, що дорівнює кількості ранжованих значень.

2. У випадку, якщо кілька значень рівні, їм нараховується ранг, що є середнім значенням із тих рангів які вони би дістали, якби не були рівними.

3. Загальна сума рангів має співпадати з розрахунковою, яка обчислю¬ється за формулою:

 

де  – загальна кількість ранжованих значень.

Алгоритм підрахунку критерію  Розенбаума

1. Перевірити, чи виконуються обмеження: 

  2. Впорядкувати значення окремо у кожній виборці за ступенем зростання ознаки. Вважати вибіркою 1 ту вибірку, значення у якій дещо вище, а вибіркою 2 – ту, де значення за припущенням нижчі.

  3. Визначити саме високе (максимальне) значення вибірки 2.

  4. Підрахувати кількість значень у вибірці 1, які вище максимального значення у вибірці 2. Позначити одержану величину як  .

  5. Визначити саме низьке (мінімальне) значення у вибірці 1.

  6. Підрахувати кількість значень у вибірці 2, які нижче мінімального значення вибірки 1. Позначити одержану величину через  .

  7. Підрахувати емпіричне значення  за формулою:  .

  8. За таблицею критичних значень знаходимо критичне значення критерію  для даних  і  . Якщо  дорівнює  або перевищує його, то  відкидається.

  9. При  співставляти одержане емпіричне значення з   і  . Якщо  перевищує або дорівнює  , то  відкидається.

Тема 2.4.  –критерій Манна–Уїтні

Призначення критерію. Критерій призначений для оцінки розбіжностей між двома вибірками за рівнем якої-небудь ознаки, яка кількісно вимірюється. Він дозволяє виявити відмінності між двома малими вибірками, коли  або  ,  і є більш потужним, ніж критерій Розенбаума.

Опис критерію. Даний метод визначає, чи достатньо мала зона накладання значень між двома рядами. 1-ий ряд – це той ряд значень, у якому значення, за попередньою оцінкою, вище, а 2-ий ряд – той, де значення за припущенням нижчі.

Чим менша область накладання значень, тим більш ймовірно, що відмінності достовірні. Інколи ці розбіжності називають розбіжностями у розташуванні двох вибірок.

Емпіричне значення критерію  відображає те, наскільки велика зона співпадання між рядами. Тому чим менше  , тим більш ймовірно, що відмінності достовірні.

Гіпотези

 : Рівень ознаки у групі 2 не нижче рівня ознаки у групі 1.

 : Рівень ознаки у групі 2 нижче рівня ознаки у групі 1.

Графічне представлення критерію 

На рисунку представлені три можливих варіанти співвідношення двох рядів значень.

У варіанті (а) другий ряд нижче першого, і ряди майже не накладаються. Область накладання занадто мала, тому є шанс, що розбіжності між рядами достовірні. Точно визначити це можна за допомогою критерію  .

У варіанті (б) другий ряд теж нижче першого, але і область накладання значень у двох рядів достатньо велика. Вона може ще не досягати критичної величини, коли розбіжності необхідно визнати неістотними. Але чи так це, можна визначити лише шляхом точного підрахунку критерію  .

У варіанті (в) другий ряд нижче першого, але область накладання настільки велика, що відмінності між рядами зникають.

  а)  б)  в)

 

  Обмеження критерію

  1. У кожній вибірці повинно бути не менше 3 спостережень:  ; припускається, щоб в одній виборці було 2 спостереження, але тоді у другій їх повинно бути не менше 5.

  2. У кожній вибірці повинно бути не більше 60 спостережень;  .Однак вже при  ранжування стає досить трудомістким. У цьому випадку краще використовувати критерій кутове перетворення Фішера.

Алгоритм підрахунку критерію  Манна–Уітні

1. Перенести всі дані піддослідних на індивідуальні картки.

2. Помітити картки піддослідних вибірки 1 одним кольором (наприклад, червоним), а усі картки з вибірки 2 – іншим (синім).

3. Розкласти усі картки в єдиний ряд за ступенем зростання ознаки, не враховуючи те, до якої вибірки вони відносяться, тобто так, як би працювали з однією великою вибіркою.

4. Проранжувати значення на картках, приписуючи меншому значенню менший ранг. Усього рангів одержиться  . У випадку, якщо декілька значень рівні між собою, їм нараховується ранг, який представляє собою середнє значення з тих рангів, які б вони одержали, якщо б не були рівні.

5. Знову розкласти картки на дві групи, орієнтуючись на кольорові позначення: червоні картки в один ряд, а сині – в інший.

6. Підрахувати суму рангів окремо на червоних картках і окремо на синіх картках. Перевірити, чи співпадає загальна сума рангів з розрахунковою, яка обраховується за формулою:

 ,

де  – загальна кількість значень, що ранжуються.

7. Визначити більшу з двох рангових сум.

8. Визначити значення  за формулою:

 ,

де  – кількість піддослідних у вибірці 1;  – кількість піддослідних у вибірці 2;  – кількість піддослідних у групі з більшою ранговою сумою;  – більша з рангових сум.

9. Визначити критичні значення  за таблицею критичних значень. Якщо  , то  приймається. Якщо  , то  відкидається, приймається  . Чим менше  , тим достовірність розбіжностей вища.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27 28 29 30  Наверх ↑