3.7. Оцінка значущості коефiцiєнта регресiї i перевірка адекватності модель.

Якщо рівняння регресiї підібрано досить добре, то хоч би приблизно виконується умова нормального розподілу відхилень фактичних значень залежної змінної вiд її розрахункових значень  ;  це дозволить побудувати довірчі інтервали для коефiцiєнтiв регресiї. Приймемо в якості досліджуваної гіпотезу про ревність нулю коефiцiєнтiв регресiї в генеральній сукупності. Величина   розподілена по закону Стьюдента з  ступенями свободи. Середньоквадратична похибка коефіцієнта регресiї  визначається за формулою:

  (3.43),

 - визначник матриці  нормальних  рівнянь (3.1 );

 - алгебраїчне доповнення  до  елемента  матриці  нормальних  рівнянь  (3.1),  що  знаходиться на  перетині  го  рядка та  стовпця.

Емпіричне значення  порівнюється з квантилем розподілу Стьюдента  для заданого рiвнi значущості  та заданого числа ступенів свободи  . Гіпотеза про ревність коефіцієнта регресiї нулю відкидається, якщо  .

Довірчий інтервал, в який з заданою iмовiрнiстю  попадає “істинне” значення регресiї  дорівнює:

 (3.44).

Для оцінки адекватності одержаного рiвняння регресії необхідно порівняти залишкову дисперсію з  факторною дисперсією залежної змінної, тобто скористуватись F-критерієм Фішера: 

  (3.45),

де

 , 

Емпіричне значення  порівнюють з табличним  для заданого рiвнi значущості  i заданого числа ступенів свободи  та  .

При  відкидається нульова гіпотеза, яка заключається в тім, що вирівнювання по одержаному рiвняння регресiї дає такі ж результати, як i вирівнювання по прямій  .

Приклад 3.7. Для вхідних даних, приведених у таблиці, побудувати трохфакторну лінійну  регресійну модель  у  стандартизованому  масштабі.

Таблиця 1

                                            

Для трьох змінних   система  нормальних рiвнянь в стандартизованому масштабi буде мати вигляд:

  (3.45)

Після підстановки відповідних числових значень коефiцiєнтiв парної кореляцiї iз табл. будемо мати:

 

Для рішення системи нормальних рiвнянь (3.45) використаємо метод повного виключення Жордана-Гауса. Цей метод полягає  в тім, що обидві частини системи (3.45) множаться на обернену матрицю  , в результаті чого визначається рішення:

 

Якщо записати розширену матрицю (А/В) i використати до неї метод повного виключення, то одержимо:

  ¦  ¦

де  - одинична матриця;

  - вектор рішення системи;

 - матриця системи нормальних рiвнянь;

  - вектор - стовпець вільних членів.

Якщо в розширеній матриці (А/В) перетворити матрицю А в одиночну, одночасно проводячи аналогічні перетворення матриці В, то на масці вектора-стовпця В буде вектор рішення системи Х.

Вказані перетворення еквівалентні множенню системи (3.45) на  .

Перейдемо безпосередньо до обчислень. Розширена матриця має вигляд

 

Складемо таблицю та зробимо відповідні перетворення:

3.5.Рiвняння множинної лiнiйної регресiї в натуральному масштабi

Рiвняння множинної лiнiйної регресiї у  стандартизованому масштабi має велике значення при проведеннi економічного аналiзу, так як показує порiвняльну силу впливу факторiальних ознак на величину результативного показника. Для використання цього рiвняння в практичних розрахунках його параметри повиннi бути переведенi iз сігматичного у натуральний масштаб.

З цiєю метою використовують формулу переходу:

  (3.28),

де  - коефіцієнти рiвняння регресiї в стандартизованому масштабi;

 - середнє квадратичне вiдхилення (сігма) результативної ознаки;

  - середнє квадратичне вiдхилення (сігма)  - oї  факторної ознаки.

Вальний член рiвняння регресiї  одержують із виразу:

  (3.29).

Шукане рівняння регресії  у натуральному масштабi має вигляд:

 (3.30).

Коефіцієнт регресії   показує, на скельки одиниць в середньому зміниться  із змінного  на одиницю, при умовi, що iншi дiючi фактори закрiпленi на постiйному рiвнi.

3.6.Коефiцiєнт множинної кореляцiї i детермiнацiї.

В процесi багатофакторного аналiзу рiшається i друга не менш важлива задача - визначення тiсноти зв’язку мiж результативною i факторiальними ознаками. Тiсноту зв’язку при множинній кореляційній залежності характеризує множинний, або сукупний, коефіцієнт кореляцiї R, котрий розраховується по наступній формула:

 , (3.30),

де  - залишкова дисперсія ;  ;  (3.31),

 - загальна дисперсія ;  (3.32).

Множинний коефіцієнт кореляцiї можливо також розрахувати,  виходячи iз стандартизованих коефiцiєнтiв множинної регресії  та коефіцієнтів парної кореляції  :

  (3.33).

Коефiцiєнт множинної кореляцiї, якщо число факторних ознак бiльше трьох, можливо також розрахувати на основi обчислень визначникiв, складених iз парних коефiцiєнтiв кореляцiї:

   (3.34),

 

  (3.35).

Тоді

  (3.36)

 - визначник матриці коефіцієнтів парних кореляцій ;

 - визначник, який утворюється із визначника  шляхом  викреслення першого рядка та першого стовпця .

Коефiцiєнт множинної кореляцiї зманюється в межах вiд 0 до  та по визначенню додатний:

  (3.37)

Розрахований коефіцієнт  обов’язково повинен корегуватись на число спостережень, так як при малому числі спостережень значення  буде завищеним. Як би число факторних ознак дорівнювало числу спостережень, то гіперплощина, побудована по методу найменших квадратів, пройшла би через всі точки  і множинний коефіцієнт кореляцiї був би рiвний 1, хоч зв’язок мiж результативною i факторними ознаками міг бути дуже слабким.

Величина множинного коефіцієнта кореляції корегується на основi наступного виразу:

 (3.38).

Корегування  не проводиться при умовi, якщо

  (3.39).

Емпірично встановлено, що число спостережень повинно перебільшувати число факторних ознак приблизно у вісім раз.

Суттєвість  визначається по критерію F ( Фішера )

  (3.40),

з числом ступенів свободи , де  - розрахункове значення критерія  . Коефiцiєнт  суттєвий, якщо  .

Величина  називається множинним коефіцієнтом детермiнацiї. Вона показує, яка частина дисперсії функції пояснюється за рахунок варіації лiнiйної комбінації аргументів при даних значеннях коефiцiєнтiв регресiї  .

Для оцінки надійності коефіцієнта кореляцiї вироховують його похибку:

 (3.41).

Тоді довірчі інтервали коефіцієнта множинної кореляцiї розраховують по формулі:

 (3.42),

 - табличне значення  - критерія  Стьюдента ;

Значущість коефіцієнта множинної кореляцiї можна встановити iз співвідношення  . Якщо виконується ця нерівність, то з iмовiрнiстю P=0,99 можна  вважати  значущим.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47  Наверх ↑