Тема 1.9. Статистичний розподіл вибірки.
Інтервальний варіаційний ряд
• поняття статистичного розподілу вибірки
• побудова інтервального варіаційного ряду
Основні терміни теми: варіанта, варіаційний ряд, частота, відносна частота, статистичний розподіл вибірки, інтервальний варіаційний ряд, розмах вибірки.
Приклад 1. Для перевірки знань студентів з математичної статистики був запропоно¬ваний тест із 10 запитань. Після тестування 60 студентів спостеріга¬лись такі значення ознаки (кількості правильних відповідей у тесті): 3; 5; 8; 3; 2; 1; 6; 8; 9; 10; 5; 4; 3; 7; 3; 8; 5; 6; 5; 7; 1; 9; 4; 0; 8; 7; 4; 6; 5; 5; 6; 2; 10; 1; 2; 4; 6; 4; 5; 6; 5; 7; 5; 6; 9; 3; 5; 7; 2; 5; 4; 6; 5; 5; 7; 3; 6; 5; 8; 5.
Записати варіаційний ряд і статистичний розподіл вибірки.
Розв’язання. Тут ознака є дискретною випадковою величиною, а одержані про неї відомості є статистичними (спостережуваними) даними. Варіаційний ряд одержимо, впорядкувавши наведені статистичні дані у порядку зростання їх значень: 0; 1; 1; 1; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 6; 6; 6; 6; 6; 6; 6; 6; 6; 7; 7; 7; 7; 7; 7; 8; 8; 8; 8; 8; 9; 9; 9; 10; 10.
Із одержаного варіаційного ряду видно, що всі 60 значень випадкової величини розбиті на 11 груп; в межах кожної групи всі значення випадкової величини одна¬кові. Таким чином, маємо 11 різних значень випадкової величини : 0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10. Кожне таке значення і називається варіантом. Виберемо такі позначення варіантів: , , ..., .
Підрахуємо кількість спостережень (частоту) кожного варіанта. Варіант зу¬ст¬річався 1 раз; – 3 рази – 4 рази; – 6 разів; – 6 разів; – 15 разів; – 9 разів; – 6 разів; – 5 разів; – 3 рази; – 2 рази; загалом маємо спостережень.
Підрахуємо відносну частоту кожного варіанта: ; ; ; ; ; ; ; ; ; ; .
Тоді статистичний розподіл вибірки матиме вигляд:
Таблиця 1.1.
0 1 2 3 4 5 6 7 8 9 10
1 3 4 6 6 15 9 6 5 3 2
1/60 1/20 1/15 1/10 1/10 1/4 3/20 1/10 1/12 1/20 1/30
У випадку, коли ознака є неперервною випадковою величиною, то впорядку¬вання і групування її спостережуваних значень часто не дозволяє виділити характерні риси її зміни. Це пояснюється тим, що окремі варіанти можуть як завгодно мало відрізнятися один від одного, їх однакові значення у масиві статистичних даних можуть зустрічатися рідко, а частоти мало відрізняються одна від одної.
Не доцільною побудова статистичного ряду є також для дискретної випадкової величини, кількість можливих значень якої досить велика. У таких випадках будують інтервальний варіаційний ряд розподілу.
Інтервальний варіаційний ряд розподілу задають у вигляді послідовності впорядкованих інтервалів та відповідних їм частот. За частоту, що відповідає інтервалу, приймають суму частот, які потрапили в цей інтервал. Інтервальний варіаційний ряд може бути побудований і для відносних частот.
Для побудови інтервального варіаційного ряду необхідно визначити довжину частин¬них інтервалів, на які розбивається весь інтервал варіації (зміни) спостережу¬ваних значень випадкової величини. Вважаючи, що всі частинні інтервали мають одну і ту ж довжину, для кожного інтервалу слід встановити його верхню та нижню межі, а потім у відповідності із одержаною послідовністю частинних інтервалів згрупувати результати спостережень. Довжину частин¬ного інтервалу слід вибирати такою, щоб одержаний ряд не був громіздким і в той же час правильно відображав характерні риси явища, що вивчається.
Для визначення довжини частинного інтервалу визначають розмах вибірки як різницю між найбільшим і найменшим варіантом: .
Тепер визначаємо кількість інтервалів . Щоб варіаційний не був досить громіздким, рекомендується кількість інтервалів вибирати від 7 до 11. Тоді довжина частинного інтервала .
Для більш точного визначення довжини частинного інтервалу можна скористатися формулою Стерджеса за якою , або ще однією рекомендацією, згідно якої .
За початок першого інтервалу рекомендується брати величину . При цьому кінець останнього інтервалу ( ) повинен задовольняти умові: .
При групуванні статистичних даних у кожен частинний інтервал вклю¬чають значення випадкової величини, більші або рівні нижньої границі та менші верхньої.
Іноді інтервальний варіаційний ряд замінюють дискретним. У цьому випадку середину -го інтервалу приймають за варіант , а відповідну інтер¬вальну частоту – за частоту цього варіанта.
Приклад 2. При дослідженні діаметра деталі після шліфування спостерігались такі значення ознаки (контрольований розмір деталі, мм):
6,75; 6,77; 6,77; 6,73; 6,76; 6,74; 6,70; 6,75; 6,71; 6,72; 6,77; 6,79; 6,71; 6,78;
6,73; 6,70; 6,73; 6,77; 6,75; 6,74; 6,71; 6,70; 6,78; 6,76; 6,81; 6,69; 6,80; 6,80;
6,77; 6,68; 6,74; 6,70; 6,70; 6,74; 6,77; 6,83; 6,76; 6,76; 6,82; 6,77; 6,71; 6,74;
6,77; 6,75; 6,74; 6,75; 6,77; 6,72; 6,74; 6,80; 6,75; 6,80; 6,72; 6,78; 6,70; 6,75;
6,78; 6,78; 6,76; 6,77; 6,74; 6,74; 6,77; 6,73; 6,74; 6,77; 6,74; 6,75; 6,74; 6,76;
6,76; 6,74; 6,74; 6,74; 6,74; 6,76; 6,74; 6,72; 6,80; 6,76; 6,78; 6,73; 6,70; 6,76;
6,76; 6,77; 6,75; 6,78; 6,72; 6,76; 6,78; 6,68; 6,75; 6,73; 6,82; 6,73; 6,80; 6,81;
6,71; 6,82; 6,77; 6,80; 6,80; 6,70; 6,70; 6,82; 6,72; 6,69; 6,73; 6,76; 6,74; 6,77;
6,72; 6,76; 6,78; 6,78; 6,73; 6,76; 6,80; 6,76; 6,72; 6,76; 6,76; 6,70; 6,73; 6,75;
6,77; 6,77; 6,70; 6,81; 6,74; 6,73; 6,77; 6,74; 6,78; 6,69; 6,74; 6,71; 6,76; 6,76;
6,77; 6,70; 6,81; 6,74; 6,74; 6,77; 6,75; 6,80; 6,74; 6,76; 6,77; 6,77; 6,81; 6,75;
6,78; 6,73; 6,76; 6,76; 6,76; 6,77; 6,76; 6,80; 6,77; 6,74; 6,77; 6,72; 6,75; 6,76;
6,77; 6,81; 6,76; 6,76; 6,76; 6,80; 6,74; 6,80; 6,74; 6,73; 6,75; 6,77; 6,74; 6,76;
6,77; 6,77; 6,75; 6,76; 6,74; 6,82; 6,76; 6,73; 6,74; 6,75; 6,76; 6,72; 6,78; 6,72;
6,76; 6,77; 6,75; 6,78.
Побудувати інтервальний варіаційний ряд.
Розв’язання. Визначимо довжину частинних інтервалів. Переглядаючи наведені результати спостережень, помічаємо, що , а . Тоді розмах вибірки . Для визначення довжини частинного інтервалу скористаємося формулою Стерджеса
.
За початок першого інтервалу беремо величину
.
Проміжні інтервали визначаємо, додаючи до кінця попереднього інтервалу довжину частинного інтервалу . Далі підраховуємо скільки значень ознаки потрапило в кожен частинний інтервал. Підрахунок частот зручно проводити методом "конвертів". Суть цього методу полягає в тому, що потрапляння відповідного зна¬чення в той чи інший інтервал відмічається крапкою і рискою. В результаті кожному десятку буде відповідати фігура, схожа на конверт.
Шкала інтервалів і групування результатів спостережень методом "конвертів" для розглядуваного випадку наведені у таблиці, яка і задає інтервальний варіаційний ряд розподілу.
Таблиця 1.2.
№ п/п Частинні інтервали Робоча область Частота, Відносна частота
1 6,67–6,69 2 0,010
2 6,69–6,71 15 0,075
3 6,71–6,73 17 0,085
4 6,73–6,75 44 0,220
5 6,75–6,77 52 0,260
6 6,77–6,79 44 0,220
7 6,79–6,81 14 0,070
8 6,81–6,83 11 0,055
9 6,83–6,85 1 0,005
200 1,000
При обчисленні відносних частот округлення слід поводити так, щоб загальна сума відносних частот була рівною 1.
25 26 27 28 29 30 Наверх ↑