Тема 1.9. Статистичний розподіл вибірки.

Інтервальний варіаційний ряд

• поняття статистичного розподілу вибірки

• побудова інтервального варіаційного ряду

Основні терміни теми: варіанта, варіаційний ряд, частота, відносна частота, статистичний розподіл вибірки, інтервальний варіаційний ряд, розмах вибірки.

Приклад 1. Для перевірки знань студентів з математичної статистики був запропоно¬ваний тест із 10 запитань. Після тестування 60 студентів спостеріга¬лись такі значення ознаки  (кількості правильних відповідей у тесті): 3; 5; 8; 3; 2; 1; 6; 8; 9; 10; 5; 4; 3; 7; 3; 8; 5; 6; 5; 7; 1; 9; 4; 0; 8; 7; 4; 6; 5; 5; 6; 2; 10; 1; 2; 4; 6; 4; 5; 6; 5; 7; 5; 6; 9; 3; 5; 7; 2; 5; 4; 6; 5; 5; 7; 3; 6; 5; 8; 5.

Записати варіаційний ряд і статистичний розподіл вибірки.

 Розв’язання. Тут ознака  є дискретною випадковою величиною, а одержані про неї відомості є статистичними (спостережуваними) даними. Варіаційний ряд одержимо, впорядкувавши наведені статистичні дані у порядку зростання їх значень: 0; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 6; 6; 6; 6; 6; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 8; 9; 9; 9; 10; 10.

Із одержаного варіаційного ряду видно, що всі 60 значень випадкової величини  розбиті на 11 груп; в межах кожної групи всі значення випадкової величини одна¬кові. Таким чином, маємо 11 різних значень випадкової величини  : 0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10. Кожне таке значення і називається варіантом. Виберемо такі позначення варіантів:  ,  , ...,  .

Підрахуємо кількість спостережень (частоту) кожного варіанта. Варіант  зу¬ст¬річався 1 раз;  – 3 рази  – 4 рази;  – 6 разів;  – 6 разів;  – 15 разів;  – 9 разів;  – 6 разів;  – 5 разів;  – 3 рази;  – 2 рази; загалом маємо  спостережень.

 Підрахуємо відносну частоту кожного варіанта:  ;  ;  ;  ;  ;  ;  ;  ;  ;  ;  .

Тоді статистичний розподіл вибірки матиме вигляд:

Таблиця 1.1.

          0          1          2          3          4          5          6          7          8          9          10

          1          3          4          6          6          15        9          6          5          3          2

          1/60     1/20     1/15     1/10     1/10     1/4      3/20     1/10     1/12     1/20     1/30

У випадку, коли ознака  є неперервною випадковою величиною, то впорядку¬вання і групування її спостережуваних значень часто не дозволяє виділити характерні риси її зміни. Це пояснюється тим, що окремі варіанти можуть як завгодно мало відрізнятися один від одного, їх однакові значення у масиві статистичних даних можуть зустрічатися рідко, а частоти мало відрізняються одна від одної.

Не доцільною побудова статистичного ряду є також для дискретної випадкової величини, кількість можливих значень якої досить велика. У таких випадках будують інтервальний варіаційний ряд розподілу.

Інтервальний варіаційний ряд розподілу задають у вигляді послідовності впорядкованих інтервалів та відповідних їм частот. За частоту, що відповідає інтервалу, приймають суму частот, які потрапили в цей інтервал. Інтервальний варіаційний ряд може бути побудований і для відносних частот.

Для побудови інтервального варіаційного ряду необхідно визначити довжину частин¬них інтервалів, на які розбивається весь інтервал варіації (зміни) спостережу¬ваних значень випадкової величини. Вважаючи, що всі частинні інтервали мають одну і ту ж довжину, для кожного інтервалу слід встановити його верхню та нижню межі, а потім у відповідності із одержаною послідовністю частинних інтервалів згрупувати результати спостережень. Довжину частин¬ного інтервалу  слід вибирати такою, щоб одержаний ряд не був громіздким і в той же час правильно відображав характерні риси явища, що вивчається.

Для визначення довжини частинного інтервалу визначають розмах вибірки  як різницю між найбільшим і найменшим варіантом:  .

Тепер визначаємо кількість інтервалів  . Щоб варіаційний не був досить громіздким, рекомендується кількість інтервалів вибирати від 7 до 11. Тоді довжина частинного інтервала  .

Для більш точного визначення довжини частинного інтервалу можна скористатися формулою Стерджеса за якою  , або ще однією рекомендацією, згідно якої  .

За початок першого інтервалу рекомендується брати величину  . При цьому кінець останнього інтервалу ( ) повинен задовольняти умові:  .

При групуванні статистичних даних у кожен частинний інтервал вклю¬чають значення випадкової величини, більші або рівні нижньої границі та менші верхньої.

Іноді інтервальний варіаційний ряд замінюють дискретним. У цьому випадку середину  -го інтервалу приймають за варіант  , а відповідну інтер¬вальну частоту – за частоту цього варіанта.

Приклад 2. При дослідженні діаметра деталі після шліфування спостерігались такі значення ознаки  (контрольований розмір деталі, мм):

6,75;   6,77;     6,77;     6,73;     6,76;     6,74;     6,70;     6,75;     6,71;     6,72;     6,77;     6,79;     6,71;     6,78;

6,73;   6,70;     6,73;     6,77;     6,75;     6,74;     6,71;     6,70;     6,78;     6,76;     6,81;     6,69;     6,80;     6,80;

6,77;   6,68;     6,74;     6,70;     6,70;     6,74;     6,77;     6,83;     6,76;     6,76;     6,82;     6,77;     6,71;     6,74;

6,77;   6,75;     6,74;     6,75;     6,77;     6,72;     6,74;     6,80;     6,75;     6,80;     6,72;     6,78;     6,70;     6,75;

6,78;   6,78;     6,76;     6,77;     6,74;     6,74;     6,77;     6,73;     6,74;     6,77;     6,74;     6,75;     6,74;     6,76;

6,76;   6,74;     6,74;     6,74;     6,74;     6,76;     6,74;     6,72;     6,80;     6,76;     6,78;     6,73;     6,70;     6,76;

6,76;   6,77;     6,75;     6,78;     6,72;     6,76;     6,78;     6,68;     6,75;     6,73;     6,82;     6,73;     6,80;     6,81;

6,71;   6,82;     6,77;     6,80;     6,80;     6,70;     6,70;     6,82;     6,72;     6,69;     6,73;     6,76;     6,74;     6,77;

6,72;   6,76;     6,78;     6,78;     6,73;     6,76;     6,80;     6,76;     6,72;     6,76;     6,76;     6,70;     6,73;     6,75;

6,77;   6,77;     6,70;     6,81;     6,74;     6,73;     6,77;     6,74;     6,78;     6,69;     6,74;     6,71;     6,76;     6,76;

6,77;   6,70;     6,81;     6,74;     6,74;     6,77;     6,75;     6,80;     6,74;     6,76;     6,77;     6,77;     6,81;     6,75;

6,78;   6,73;     6,76;     6,76;     6,76;     6,77;     6,76;     6,80;     6,77;     6,74;     6,77;     6,72;     6,75;     6,76;

6,77;   6,81;     6,76;     6,76;     6,76;     6,80;     6,74;     6,80;     6,74;     6,73;     6,75;     6,77;     6,74;     6,76;

6,77;   6,77;     6,75;     6,76;     6,74;     6,82;     6,76;     6,73;     6,74;     6,75;     6,76;     6,72;     6,78;     6,72;

6,76;   6,77;     6,75;     6,78.                                                                                                              

 Побудувати інтервальний варіаційний ряд.

Розв’язання. Визначимо довжину  частинних інтервалів. Переглядаючи наведені результати спостережень, помічаємо, що  , а  . Тоді розмах вибірки  . Для визначення довжини частинного інтервалу скористаємося формулою Стерджеса

 .

За початок першого інтервалу беремо величину

 .

           

Проміжні інтервали визначаємо, додаючи до кінця попереднього інтервалу довжину частинного інтервалу  . Далі підраховуємо скільки значень ознаки потрапило в кожен частинний інтервал. Підрахунок частот зручно проводити методом "конвертів". Суть цього методу полягає в тому, що потрапляння відповідного зна¬чення в той чи інший інтервал відмічається крапкою і рискою. В результаті кожному десятку буде відповідати фігура, схожа на конверт.

Шкала інтервалів і групування результатів спостережень методом "конвертів" для розглядуваного випадку наведені у таблиці, яка і задає інтервальний варіаційний ряд розподілу.

Таблиця 1.2.

№ п/п           Частинні інтервали      Робоча область           Частота,           Відносна частота 

1        6,67–6,69                     2          0,010

2        6,69–6,71                      15        0,075

3        6,71–6,73                      17        0,085

4        6,73–6,75                      44        0,220

5        6,75–6,77                      52        0,260

6        6,77–6,79                      44        0,220

7        6,79–6,81                      14        0,070

8        6,81–6,83                      11        0,055

9        6,83–6,85                     1          0,005

                              200       1,000

При обчисленні відносних частот округлення слід поводити так, щоб загальна сума відносних частот була рівною 1.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27 28 29 30  Наверх ↑