ТЕМА 5. УЗАГАЛЬНЕНИЙ МЕТОД НАЙМЕНШИХ КВАДРАТІВ (МЕТОД ЕЙТКЕНА)
5.1 Поняття гетероскедастичності
Одним з основних припущень моделі класичної лінійної регресії є припущення про сталість дисперсії кожної випадкової величини . Це явище називається гомоскедастичністю.
Формалізовано це припущення записується у вигляді:
(5.1)
Якщо це припущення не задовольняється у якомусь окремому випадку, то має місце гетероскедастичність.
Суть припущення гомоскедастичності полягає в тому, що варіація кожної навколо її математичного сподівання залежить від значення х. Дисперсія кожної зберігається сталою незалежно від малих чи великих значень факторів: не є функцією , тобто
Графічно випадок гомоскедастичності для простої лінійної регресії показано випадковою дисперсією у межах сталої відстані навколо лінії регресії (рис. 5.1а).
Якщо не є сталою, а її значення залежить від значення х, можемо записати У цьому випадку маємо справу з гетероскедастичність. Графічна форма розкиду спостережень залежить від форми гетероскедастичності, тобто форми зв’язку між та . На рис.5.1 (б,в,г) показано три різні форми гетероскедастичності.
Таким чином, можна дати наступні визначення гомо - та гетероскедастичності.
Якщо дисперсія залишків стала для кожного спостереження, тобто , то ця її властивість називається гомоскедастичністю.
Якщо дисперсія залишків змінюється для кожного спостереження або групи спостережень, тобто , то це явище називається гетероскедастичністю.
Якщо існує гетероскедастичність залишків, то це спричиняється до того, що оцінки параметрів моделі 1МНК будуть незміщеними, обґрунтованими, але не ефективними. При цьому формулу для стандартної помилки оцінки, чітко кажучи, застосовувати не можна.
Виявити наявність гетероскедастичності можна як графічними, так і аналітичними методами. Серед аналітичних найпростішим методом є тест рангової кореляції Спірмена, який можна використовувати як до малих, так і до великих вибірок.
Запишемо коефіцієнт рангової кореляції Спірмена:
(5.2)
де — різниця між рангами, що приписуються двом характеристикам і-го об’єкта; — кількість об’єктів, що ранжуються.
Розглянемо методику використання коефіцієнта рангової кореляції для визначення гетероскедастичності.
Припустимо,
Етап 1. Будуємо регресію для даних і розраховуємо відхилення .
Етап 2. Нехтуючи знаком , тобто беручи абсолютні значення ранжуємо та х у зростаючому чи спадаючому порядку і підраховуємо коефіцієнт рангової кореляції Спірмена.
Етап 3. Перевіряємо значимість отриманого коефіцієнта рангової кореляції за t-критерієм Стьюдента. Для цього побудуємо t-статистику:
(5.3)
де п — кількість спостережень і, — кількість ступенів вільності. По таблицях знаходимо . Якщо розрахункове значення перевищує критичне , то підтверджується гіпотеза про гетероскедастичність. Якщо , то в регресійній моделі правильним є припущення про гомоскедастичність.
При великих вибірках перевірка гетероскедастичності здійснюється за тестами Гольдфельда та Квандта, тестом Глейсера та іншими.
Коли на базі будь-якого тесту встановлено гетероскедастичність, то для її вилучення змінюють початкову модель таким чином, щоб помилки мали постійну дисперсію. Далі невідомі параметри трансформованої моделі розраховуються за методом найменших квадратів. Трансформація моделі зводиться до зміни первісної форми моделі, причому необхідно враховувати та значеннями незалежних змінних: (5.4)
Розглянемо можливі випадки трансформації моделі на прикладі простої лінійної функції, припустимо, що початкова модель , де випадкова величина гетероскедастична, але відповідає всім іншим припущенням лінійної регресії.
Випадок 1. Припустимо, що гетероскедастичність має форму (де k — скінчена константа), тобто дисперсія зростає пропорційно до . Виражаючи коефіцієнт пропорційності , маємо . Це означає, що трансформація моделі полягає у ділені початкової моделі на . Трансформована таким чином модель має вигляд:
(5.5)
Нове змінене значення випадкової величини є гомоскедастичним, оскільки
(5.6)
Таким чином, ми можемо застосувати класичний МНК для розрахунку невідомих параметрів трансформованої моделі.
Випадок 2. Припустимо, що гетероскедастичність має формулу:
(5.7)
Допустима трансформація полягає в діленні початкової моделі на , тобто:
(5.8)
Випадкова величина є гомоскедастична із сталою дисперсією .
Випадок 3. Припустимо, що форма гетероскедастичності
(5.9)
Допустима трансформація полягає в діленні початкової моделі на , тобто
(5.10)
Нова випадкова величина є гомоскедастичною із сталою дисперсією, рівною .
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 Наверх ↑