Home » Методика статистичного прогнозування

Методика статистичного прогнозування

11 Червня, 2024

Методика статистичного прогнозування.

ПОНЯТТЯ ТА ПОПЕРЕДНІЙ АНАЛІЗ
РЯДІВ ДИНАМІКИ

Тренд, сезонна і циклічна компоненти не є випадковими і називаються систематичними компонентами часового ряду. Складова частина часового ряду, що залишається після вилучення з нього систематичних компонент, являє собою випадкову компоненту (залишки, помилки) ε_t. Оскільки випадкові відхилення неминуче супроводжують будь-яке макроекономічне явище, випадкова компонента є обов’язковою складовою часового ряду і визначає стохастичний характер його елементів у_t. Якщо побудована «якісна» модель прогнозування, то ε_t є близькою до нуля, випадковою, незалежною, нормально розподіленою компонентою, інакше модель вважається поганою.

Аналіз динаміки часового ряду містить такі послідовні завдання:

1) коригування рівнів динамічного ряду, якщо цього вимагають умови порівняльності;

2) визначення систематичних компонент динамічного ряду (функції f_t, s_t, c_t), які присутні у його розкладенні;

3) розрахунок оцінок тих функцій, які входять у розкладення часового ряду;

4) підбір моделі, яка адекватно описує поведінку випадкової компоненти ε_t, і статистичне оцінювання параметрів цієї моделі.

Цей процес прийнято називати ідентифікацією моделі.

Можна записати кілька окремих моделей динамічного ряду, наприклад:

· модель тренду y_t = f_t + ε_t;

· модель сезонності y_t = s_t + ε_t.

Моделі тренду і сезонності (тренд-сезонні) здатні відображати як відносно постійну сезонну хвилю, так і динамічно змінювану залежно від тренду. Перша форма належить до класу адитивних (y_t = f_t + s_t + ε_t), друга — до класу мультиплікативних (y_t =
= f_t · s_t · ε_t) моделей.

Послідовні значення рівнів часового ряду, які залежать один від одного, утворюють авторегресійні процеси. Одним із способів вимірювання зв’язку між поточними та минули-
ми значеннями рівнів ряду є розрахунок коефіцієнтів авто-
кореляції.

Пошук потрібної моделі ведеться в межах двох класів часових рядів: стаціонарних і нестаціонарних. Перевірка стаціонарності та оцінювання наявності тренду в дослідженні часового ряду (ідентифікація тренду) здійснюються за допомогою кількох способів. Стаціонарні ряди не мають тренду або періодичної зміни середнього та дисперсії.

Для ідентифікації трендів використовується метод аналізу автокореляції.

Поширеними методами виявлення тренду є перевірка різниць середніх рівнів і метод Форстера—Стьюарта.

Реалізація методу перевірки різниць середніх рівнів складається з чотирьох наступних кроків.

Крок перший. Вихідний часовий ряд y₁, y₂, y₃, …, y_n розділя-
ється на дві приблизно однакові за кількістю рівнів частини: у першій частині п₁ перших рівнів вихідного ряду, у другій — п₂ решта рівнів (п₁ + п₂ = п).

Крок другий. Для кожної з цих частин розраховуються середні значення і дисперсії:

; ;

; .

Крок третій. Перевірка однаковості (однорідності) дисперсій обох частин ряду за допомогою F-критерію Фішера, що порівнює розрахункове значення цього критерію

(2.1)

з табличним (критичним) значенням критерію Фішера F_α із заданим рівнем значущості (рівнем помилки) α.

Якщо розрахункове значення F менше за табличне F_α, то гіпотеза про рівність дисперсій приймається і слід перейти до четвертого кроку. Якщо F більше або дорівнює F_α, гіпотеза про рівність дисперсій відхиляється і робиться висновок, що даний метод не дає відповіді про наявність тренду.

На четвертому кроці перевіряється гіпотеза про відсутність тренду за допомогою t-критерію Стьюдента. Для цього визнача-
ється розрахункове значення критерію Стьюдента за формулою:

, (2.2)

де σ — середньоквадратичне відхилення різниць середніх:

Якщо розрахункове значення t менше за табличне t_α, то нульова гіпотеза не відхиляється, тобто тренд відсутній, інакше тренд є. Зазначимо, що в даному разі табличне значення t_α береться для числа ступенів свободи, яке дорівнює п₁ + п₂ – 2, при цьому даний метод застосовується тільки для рядів з монотонною тенденцією. Недолік методу полягає у неможливості правильно визначити існування тренду у випадку, коли часовий ряд містить точку зміни тенденції в середині ряду.

Метод Форстера—Стьюарта має більші можливості і дає більш надійні результати, ніж попередній. Крім тренду самого ряду (тренду в середньому), він дозволяє встановити існування тренду дисперсії часового ряду: якщо тренду дисперсії немає, то розкид рівнів ряду постійний; якщо дисперсія збільшується, то ряд «розхитується», тощо. Реалізація методу також складає чотири кроки.

Крок перший. Порівнюється кожний рівень вихідного часового ряду, починаючи із другого рівня, з усіма попередніми, при цьому визначаються дві числові послідовності:

(2.3)

(2.4)

t = 2, 3, …, n.

Крок другий. Розраховуються величини s і d:

; (2.5)

. (2.6)

Неважко помітити, що величина s, яка характеризує зміну часового ряду, набуває значення від 0 (усі рівні ряду однакові) до
п – 1 (ряд монотонний). Величина d характеризує зміну дисперсії рівнів часового ряду і змінюється від – (п – 1) (ряд поступово спадає) до (п – 1) (ряд поступово зростає).

Крок третій. Перевіряється гіпотеза про те, чи можна вважати випадковими: 1) відхилення величини s від μ — математичного сподівання величини s для ряду, в якому рівні розташовані випадково; 2) відхилення величини d від нуля.

Ця перевірка проводиться з використанням розрахункових значень t-критерію Стьюдента для середньої і для дисперсії:

; ; (2.7)

; , (2.8)

де μ — математичне сподівання величини s, визначеної для ряду, в якому рівні розташовані випадково; σ₁ — середньоквадратичне відхилення для величини s; σ₂ — середньоквадратичне відхилення для величини d.

Для зручності розраховані табульовані значення величин μ, σ₁ і σ₂; фрагмент цих значень подано в табл. 2.1.

Таблиця 2.1

Значення	10	20	30	40
μ	3,858	5,195	5,990	6,557
σ₁	1,288	1,677	1,882	2,019
σ₂	1,964	2,279	2,447	2,561

Крок четвертий. Розрахункові значення t_s i t_d порівнюються з табличним значенням t-критерію Стьюдента із заданим рівнем значущості t_α. Якщо розрахункове значення t менше за табличне t_α, то гіпотеза про відсутність відповідного тренду приймається, у протилежному випадку — тренд існує. Наприклад, якщо t_s більше табличного значення t_α, a t_d менше t_α, то для заданого часового ряду існує тренд у середньому, а тренду дисперсії рівнів ряду немає.

Методичні поради до вивчення теми

Методи експертних оцінок використовуються для аналізу об’єктів і проблем, розвиток яких повністю або частково не піддається математичній формалізації, тобто для яких важко розробити адекватну модель. Це пояснюється:

¨ невизначеністю та складністю явищ, що прогнозуються;

¨ необхідністю кількісно оцінити події, для характеристики яких відсутні необхідна інформація і чітке знання тенденції розвитку ситуації;

¨ необхідністю враховувати не тільки об’єктивні тенденції розвитку ситуації, а й реакцію учасників подій на рішення, що приймається.

Типовими проблемами, які потребують проведення експертизи, є, наприклад: визначення мети розвитку об’єкта управління; прогнозування; розроблення сценаріїв; генерування альтернативних варіантів розв’язків; розроблення системи кількісних оцінок; визначення рейтингів тощо.

У всіх цих випадках доводиться звертатися до думки експертів. Прогнозоване експертне оцінювання відбиває індивідуальні погляди фахівців стосовно перспектив розвитку об’єкта і базу-
ється на мобілізації фахового досвіду та інтуїції.

Методи, які застосовуються в прогнозуванні експертної оцінки, поділяють на індивідуальні й колективні.

Індивідуальні експертні методи засновані на використанні думки експертів-фахівців відповідного профілю незалежно один від одного. Найчастіше застосовуються такі два методи формування прогнозу: інтерв’ю та аналітичні експертні оцінки.

Сутність колективної експертної оцінки для розроблення прогнозів полягає у визначенні узгоджених думок експертів про перспективні напрями розвитку об’єкта прогнозування, сформульовані раніше окремими фахівцями, а також в оцінюванні напрямів розвитку об’єкта, що не може бути визначено іншими методами (наприклад, аналітичним розрахунком, експериментом тощо). До колективної експертизи належать методи: «комісій», «колективної генерації ідей («мозкова атака»)», «Дельфі» та побудова сценаріїв.

Для проведення якісної експертизи необхідні такі умови:

· наявність експертної комісії, яка складається з фахівців, котрі знайомі з об’єктом експертизи і мають досвід експертної роботи;

· існування аналітичної групи, яка професійно володіє технологією організації та проведення експертиз, методами отримання та аналізу експертної інформації;

· можливість отримання надійної експертної інформації;

· коректне оброблення та аналіз експертної інформації.

Виокремлюють такі основні етапи експертизи:

1) формулювання мети експертизи;

2) побудова об’єктів оцінювання або їх характеристик (до початку експертизи цей етап може бути вже виконаний);

3) створення експертної групи;

4) визначення способу експертного оцінювання і способу подання експертних оцінок;

5) проведення експертизи;

6) оброблення та аналіз результатів експертизи;

7) повторний тур експертизи, якщо виникає необхідність уточнення або зближення думок експертів;

8) формування варіантів рекомендацій.

Дані експертизи являють собою сукупність оцінок, що даються кожним експертом кожному з оцінюваних ним об’єктів прогнозування. Ці оцінки виражаються в балах (наприклад, від 0 до 100).

Показником узагальненої думки експертів може бути середнє статистичне значення М_і, величини оцінки певного i-го об’єкта (у балах).

Поряд із показниками відносної важливості досить суттєвим є визначення ступеня узгодженості думок експертів. Шляхом розрахунку дисперсії оцінок, даних i-му направленню досліджень, і середньоквадратичного відхилення цих оцінок визначається коефіцієнт варіації V_i. Чим менше значення V_i, тим вище ступінь узгодженості думок про відносну важливість i-го об’єкта.

Показником ступеня узгодженості думок експертів про відносну важливість сукупності всіх запропонованих до оцінок об’єктів служить коефіцієнт конкордації w. Коефіцієнт конкордації може приймати значення в межах від 0 до 1. У разі повної узгодженості поглядів експертів w = 1. Зміна w від 0 до 1 відповідає зростанню ступеня узгодженості поглядів експертів.

Про ступінь узгодженості поглядів кожного експерта з усіма іншими наочне уявлення дає багатокутник, кожна вершина якого відповідає певному експерту, а лінії, що поєднують певну вершину з іншими, — коефіцієнтам парної рангової кореляції. Багатокутник дозволяє також визначити групу експертів, усередині якої узгодженість поглядів велика, тоді як між групами існує неузгодженість.

Чим нижчий рівень статистичної значущості показника узгодженості поглядів експертів, тим більша ймовірність того, що існує невипадкова узгодженість поглядів експертів.

Для визначення довірчої ймовірності коефіцієнтів w та  використовують критерій χ² з (т – 1) ступенями свободи.

ПРОГНОЗУВАННЯ ЧАСОВИХ РЯДІВ

Методи згладжування часових рядів виокремлюються у дві основні групи:

1) механічне згладжування окремих рівнів часового ряду, яке не потребує знань про аналітичний вид згладженої функції;

2) аналітичне згладжування з використанням кривої, проведеної між певними рівнями ряду так, щоб вона відбивала тенденцію, притаманну ряду, і одночасно позбавляла його незначних коливань.

Механічні методи згладжування часових рядів використовують фактичні значення сусідніх рівнів ряду і не досліджують аналітичний вид згладженої функції. До механічних методів належать: згладжування по двох точках, метод простої ковзкої середньої, метод зваженої ковзкої середньої, метод експоненційного згладжування.

Аналітичні методи згладжування часових рядів ґрунтуються на припущенні, що відомий загальний вигляд невипадкової складової часового ряду. Вони реалізуються за допомогою регресійних та адаптивних методів.

Регресійні методи є основою побудови кривих зростання. Щоб правильно підібрати найкращу криву для моделювання і прогнозування економічного явища, необхідно знати особливості кожного виду кривих (табл. 2.2.1 [11]). Універсальним методом попереднього вибору кривих зростання, який дає можливість вибрати криву із широкого класу, є метод характеристик приросту. Він заснований на використанні окремих характерних властивостей кривих. При цьому методі вхідний часовий ряд попередньо згладжується методом простої ковзкої середньої.

Адаптивні методи прогнозування застосовуються в ситуації зміни зовнішніх умов, коли найбільш важливими стають останні реалізації досліджуваного процесу. Загальна схема побудови адаптивних методів може бути подана так:

1) за кількома першими рівнями ряду будується модель і оцінюються її параметри;

2) на основі побудованої моделі розраховується прогноз на один крок вперед, причому його відхилення від фактичного рівня ряду розцінюється як помилка прогнозування, яка враховується відповідно до прийнятої схеми коригування моделі;

3) за моделлю з відкоригованими параметрами розраховується прогнозна оцінка на наступний момент часу тощо.

Таким чином, модель постійно вбирає в себе нову інформацію і до кінця періоду навчання відбиває тенденцію розвитку процесу, що існує на даний момент. Прогноз отримується як екстраполяція останньої тенденції. Численні адаптивні методи відрізняються один від одного лише способами числової оцінки параметрів моделі і визначення параметрів адаптації. Базовими адаптивними методами вважаються методи Хольта, Брауна і Хольта—Уїнтерса.

Методи фільтрації сезонної компоненти s_t. Проблема аналізу сезонності (та/або циклічності) полягає у дослідженні сезонних коливань і у вивченні зовнішнього циклічного механізму, що їх породжує. Для дослідження суто сезонних коливань необхідно виокремити з часового ряду у_t сезонну компоненту s_t і потім аналізувати її динаміку. Більшість методів фільтрації побудовано таким чином, що попередньо виокремлюється тренд, а потім сезонна компонента. Тренд у чистому вигляді необхідний і для аналізу динаміки сезонної хвилі. Оскільки індекси сезонності сезонної хвилі величини безрозмірні і не змінюються з року в рік, то їх можна використовувати для визначення рівня сезонності у часовому ряду. У разі використання квартальних даних їх буде чотири, а місячних спостережень — 12.

Для повного дослідження тренд-сезонного часового ряду потрібно розв’язати сукупність завдань у такій послідовності:

1) визначення наявності тренду і визначення ступеня його гладкості;

2) виявлення наявності у часовому ряду сезонних коливань;

3) здійснення фільтрації сезонної компоненти у разі підтвердження сезонного процесу;

4) проведення аналізу динаміки (еволюції) сезонної хвилі;

5) дослідження чинників, які визначають сезонні коливання;

6) розроблення прогнозу тренд-сезонного процесу.

Найбільш поширеними методами фільтрації є ітераційні та гармонічного аналізу.

Методи прогнозування випадкових компонент. На відміну від прогнозів, які, наприклад, послуговуються класичною регресійною моделлю, у прогнозі часових рядів суттєво використовуються взаємозалежність і прогноз самих випадкових залишків. Отже, мова йде про моделювання не самих часових рядів, а лише їх випадкових залишків. Для описання поведінки випадкових залишків ε_t і прогнозування їх значень використовується клас стаціонарних часових рядів, для яких розроблені спеціальні лінійні параметричні моделі, такі як авторегресійні (AR), ковзної середньої (MA) та ARMA. Однак реальні часові ряди, що зустрічаються в макроекономіці, є у багатьох випадках нестаціонарними. Їх нестаціонарність частіше за все виявляється в наявності невипадкової складової f_t. У таких випадках йдеться про нестаціонарні однорідні часові ряди. Отже, нестаціонарний однорідний часовий ряд y_t може бути перетворений у стаціонарний часовий ряд процедурою віднімання від ряду y_t його невипадкової складової f_t. Для моделювання нестаціонарних часових рядів з означеними властивостями використовується ARIMA-модель (авторегресійна інтегрована модель ковзної середньої), або модель Бокса—Дженкінса. При цьому AR, MA та ARMA моделі являють собою окремі випадки ARIMA-моделі.

Інструменти аналізу ARІMA–моделей. Щоб визначити структуру динамічного процесу, дуже важливо поділити часовий ряд на розглянуті три складові і встановити рівень автокореляції, інтегрованості та порядку ковзної середньої.

Перевірка автокореляції. Для визначення міри автокореляції часових рядів треба визначити силу зв’язку між поточними та минулими значеннями змінної, що аналізується. Способами цього виміру є коефіцієнти автокореляції та Q-критерій Бокса—Пірса. Порядок авторегресії визначається за допомогою розрахунку взаємної кореляційної (автокореляційної) функції (АКФ) між вихідним рядом у_t і цим самим рядом, зрушеним у часі на величину τ (лаг), та часткової автокореляційної функції (ЧАКФ).

Перевірка процесу ковзної середньої. Якщо знати поведінку коефіцієнта автокореляції та часткового коефіцієнта автокореляції, то можна спробувати визначити, чи містить ряд елемент ковзної середньої. Якщо значення часткових коефіцієнтів автокореляції спадає за експонентою, а не різко падає до нуля, то можна припустити, що ряд характеризує процес ковзної середньої, а не AR. Якщо ряд скоріше MA ніж AR, то автокореляція не буде показувати порядок МА-процесу. Для перевірки автокореляції в рядах, де є елементи і авторегресії, і ковзної середньої, використовується критерій Люнга—Бокса (LB).

Перевірка ступеня інтеграції та стаціонарності. Інтеграція показує, до якого ступеня ряд повинен бути перетворений за допомогою різниць будь-якого порядку, щоб стати стаціонарним, що дуже важливо, оскільки багато методів аналізу часових рядів працюють тільки зі стаціонарними рядами.

Простішим способом визначення найбільш відповідного різницевого ряду є розрахунок для кожного ряду його дисперсії, тобто усередненої суми квадратів розходжень його рівнів із середнім значенням Δy_сер. Для подальшого оброблення обирається ряд, в якому величина цього показника є мінімальною.

Перевірка стаціонарності виконується також за допомогою аналізу коренів характеристичного рівняння. Проблеми перевірки на стаціонарність при існуванні автокореляції залишків вирішу-
ється завдяки застосуванню розширеного критерію Дікі—Фуллера[1].

ЕКОНОМЕТРИЧНІ МЕТОДИ
ПРОГНОЗУВАННЯ

Основу математичного апарату для економетричних моделей становлять такі розділи математичної статистики, як кореляційний і регресійний аналізи.

Кореляційний аналіз забезпечує:

· вимірювання ступеня зв’язку двох або більше змінних;

· відбирання чинників, що найбільш суттєво впливають на залежну змінну;

· віднаходження раніше невідомих причинних зв’язків (кореляція безпосередньо не розкриває причинних зв’язків між явищами, але визначає числове значення цих зв’язків та ймовірність суджень щодо їх існування).

Основними засобами аналізу є парні, частинні і множинні коефіцієнти кореляції.

Регресійний аналіз дозволяє розв’язувати такі завдання:

· встановлення форм залежності між однією ендогенною та однією або кількома екзогенними змінними (додатна, від’ємна, лінійна, нелінійна). Ендогенна змінна звичайно позначається Y, а екзогенна (екзогенні), яка ще інакше називається регресором, — X;

· визначення функції регресії. Важливо не тільки вказати загальну тенденцію зміни залежної змінної, а й з’ясувати, який був би вплив на залежну змінну головних чинників, якщо б решта (другорядні, побічні) чинників не змінювалася (перебували на тому самому середньому рівні) і були виключені випадкові елементи;

· оцінювання невідомих значень залежної змінної.

Відомі різні види множинної регресії: лінійна, покрокова, гребенева тощо.

Макропрогнозування на основі регресійної моделі. Коли регресійна модель використовується для прогнозування величини Y, при відомих значеннях Х незміщена оцінка точкового прогнозу запишеться так:

, (5.1)

де X_p — заданий на перспективу рядок матриці екзогенних змінних Х при i = p; Y_р — точковий прогноз ендогенної змінної на основі економетричної моделі.

Якість прогнозу тим вища, чим повніше виконуються допущення моделі в прогнозований період, надійніше оцінені параметри моделі, точніше визначені значення екзогенних змінних для періоду упередження прогнозу.

Зв’язок між ендогенною змінною Y і однією або кількома екзогенними змінними Х може бути нелінійним. Існують два шляхи розв’язання цієї проблеми:

· перетворити дані та застосувати лінійну регресію;

· застосувати методи нелінійної регресії.

За допомогою коефіцієнтів регресії неможливо порівняти вплив чинників на ендогенну змінну через розбіжність одиниць виміру і ступеня коливання. Порівняльні характеристики можна одержати, розрахувавши коефіцієнти еластичності, бета-коефіцієнти. За їх допомогою можна визначити ранги чинників за ступенем їх впливу на залежну змінну, тобто зіставити їх між собою за величиною цього впливу. Разом з тим не можна безпосередньо оцінити частку впливу певного чинника у загальній дії всіх чинників. З цією метою використовуються дельта-коефіцієнти.

Для економічного тлумачення нелінійних зв’язків користуються коефіцієнтом еластичності, який характеризує відносну зміну залежної змінної при зміні пояснюючої змінної на 1 %. Якщо рівняння регресії має вигляд у = f (х), то коефіцієнт еластичності розраховується так:

. (5.2)

Бета-коефіцієнт. Для усунення різниць у вимірі і ступені коливання чинників використовується β-коефіцієнт, або коефіцієнт регресії у стандартизованому вигляді:

, (5.3)

де — коефіцієнт регресії біля j-ї змінної; — оцінка середньоквадратичного відхилення j-ї змінної; — оцінка середньоквадратичного відхилення залежної змінної.

Коефіцієнт показує, на яку частину величини середньоквадратичного відхилення змінюється середнє значення залежної змінної, коли відповідна незалежна змінна збільшується на одне середньоквадратичне відхилення, а решта незалежних змінних залишається сталими.

Дельта-коефіцієнт. Частка кожного чинника у загальному впливі чинників на залежну змінну становить:

(5.4)

де R² — коефіцієнт множинної детермінації; r_j — коефіцієнт парної кореляції мiж j-м чинником і залежною змінною; β_j —
β-коефіцієнт.

За коректно зробленим аналізом величини дельта-коефіцієнтів додатні, тобто всі коефіцієнти регресії мають той самий знак, що й відповідні парні коефіцієнти кореляції. Але у разі значної корельованості пояснюючих змінних деякі дельта-коефіцієнти можуть бути від’ємними, через те що відповідний коефіцієнт регресії має знак, протилежний парному коефіцієнту кореляції.