Тема 3.1. Основні поняття
кореляційного та регресійного аналізу
• види зв’язку між випадковими величинами
• основні поняття кореляційного та регресійного аналізу
Основні терміни теми: функціональний, стохастичний зв’язки, факторна, результативна ознаки, кореляційний та регресійний аналіз, поле кореляції, теоретична та емпірична лінії регресії.
У природі, суспільстві, економіці багато явищ, процесів, об’єктів знахо¬дяться між собою в причинній залежності.
Зв’язок між двома величинами називається функціональним, якщо довільному визначеному значенню величини х (із множини її можливих значень) відповідає одне і тільки одне визначене значення у, тобто у є функцією від х:
.
Зв’язок між двома величинами називається стохастичним, якщо після визначення величини х величина у залишається випадковою і може приймати різні значення з обумовленими ймовірностями.
При вивченні зв’язку між явищами стохастична залежність частково вказує на відповідну причинну залежність (наприклад, залежність продуктивності праці від стажу роботи за даною спеціальністю). Але при наявності стохас¬тичного зв’язку між явищами може і не бути причинної залежності. Це виникає тому, що обидва явища окремо залежать від загальних факторів. Так, зв’язок між фондовіддачею і собівартістю є стохастичним і непричинним, так як обидва ці показники залежать від фондоозброєння, електроозброєння тощо.
Окремим випадком стохастичної форми зв’язку може бути кореляційний зв’язок. Дві випадкові величини є кореляційно залежними, якщо математичне сподівання однієї з них залежить від значень іншої випадкової величини.
Методи математичної статистики, що вивчають кореляційні зв’язки між явищами, називаються кореляційним аналізом. Кореляційний аналіз пред¬ставляє собою інструмент, який дозволяє кількісно оцінити зв’язки між великим числом взаємодіючих явищ – при цьому деякі з них невідомі. Застосування кореляційного аналізу дає можливість перевірити різні гіпотези про наявність і силу зв’язку між двома явищами або одним явищем та групою явищ, а також гіпотезу про форму зв’язку.
При виконанні кореляційних розрахунків необхідно розрізняти факторну та результативну ознаки. Факторною називається така ознака, від якої залежить інша ознака, а вона сама є незалежною. На відміну від неї залежна ознака називається результативною. Факторна ознака позначається через X, а результативна – через Y, тобто умовно можна сказати, що факторна ознака виражає аргумент, а результативна – функцію.
Факторна ознака або фактор – це технічні, технологічні, природні, кліма¬тичні, економічні, організаційні, соціально-демографічні та інші показники, що проявляють вплив на окремий результативний показник: прибуток, собівартість, продуктивність праці та ін. Задача математичного моделювання полягає у виявленні кількісного зв’язку між факторами та результативним економічним показником.
Кореляційний зв’язок класифікують за ознаками: за типом – на прямий та зворотній; за формою – на лінійний та нелінійний; за тіснотою зв’язку – на слабий, помірний, помітний, сильний, дуже сильний; за участю факторних ознак – на парний, множинний.
Кількісний вплив фактора X на результативний показник Y вивчається за допомогою регресійного аналізу, який дозволяє встановити вид аналітичної залежності між ознаками X та Y i оцінити параметри моделі.
При виборі форми кореляційної залежності виходять перш за все із економічної природи явищ, простоти функції та вимоги на обмеження числа параметрів. Форму кореляційного зв’язку можна визначити як графічним так і аналітичним методами.
У випадку парної кореляції вхідними даними є n пар точок , які в прямокутній декартовій системі координат утворюють кореляційне поле (рис. 4.1). Розміщення точок на кореляційному полі дозволяє судити про характер залежності (рис. 4.1 а)-б) – лінійна; в) – парабо¬лічна; г) – гіперболічна; д) – логістична; е) – відсутня). Якщо різні , то точки кореляційного поля з’єднують в послідовності зростання абсцис і одержують так звану емпіричну лінію регресії (рис. 4.2). При цьому графік функції нази¬вають теоре¬тич¬ною лінією рег¬ресії.
Для вибору тієї чи іншої форми кореляційної залежності, слід порівняти кореляційне поле або емпіричну лінію регресії з графіками відомих функцій. Для більш точного встановлення форми зв’язку вихідні дані обробляють на ЕОМ за допомогою програм кореляційного аналізу. При цьому аналізують кілька функцій і вибирають ту, для якої кореляційне відношення або коефіцієнт парної кореляції r є найбільшим (або середня похибка апроксимації най¬менша).
25 26 27 28 29 30 Наверх ↑