Основні процедури статистичного аналізу. Вибіркові розподіли. Довірчий інтервал. Статистична перевірка гіпотез. Перевірка гіпотез про ймовірність, дисперсію, законів розподілу. Приклади використання для вирішення фармацевтичних задач – системи підтримки прийняття рішень, експертні системи.
Статистична обробка результатів досліджень в науковій діяльності лікаря і фармацевта 2
1.Методи перевірки статистичних гіпотез. 2
1.1. Поняття про статистичну обробку результатів досліджень. 2
1.2. Перевірка статистичних гіпотез. Загальні принципи. 4
1.2.1. Однобічні і двосторонні критерії 5
1.2.4. Послідовність операцій при виборі критерію.. 7
1.2.6. Визначення класу застосовуваних критеріїв. 9
1.2.7. Визначення додаткових умов для вибору критерію.. 9
2. Характеристика деяких критеріїв перевірки статистичних гіпотез. 11
2.1. Параметричні критерії перевірки гіпотез про середні і дисперсії 11
2.1.2. Аналіз однорідності дисперсій по Кохрену. 11
2.1.4. Перевірка гіпотези про рівність середніх при нерівних дисперсіях вибірок 13
2.1.5. Перевірка гіпотези про рівність середніх при рівних дисперсіях. 14
2.1.6. Перевірка гіпотези про рівність середніх без припущень про дисперсії 14
2.1.7. Перевірка гіпотези про рівність середнього константі 15
2.1.8. Перевірка гіпотези про рівність середніх при зв’язаних вибірках. 15
2.1.9.Парадокси при перевірці гіпотез об середні і деякі зауваження. 16
2.2. Непараметричні критерії перевірки статистичних гіпотез. 17
2.2.1. Поняття про ранги і їхня побудова. 17
2.2.2. Критичні значення статистики W-критерію Уилкоксона. 19
2.2.3. Критерій Краскела — Уоліса (Н-критерий) 19
3.3.4. Критерій Зігеля — Тьюкі 20
2.2.6. Критерій Манна — Уітні (U-критерій Уілкоксона — Манна — Уітні) 22
3. Приклади вирішення задач перевірки статистичних гіпотез. 24
3.1. Методи вирішення задач перевірки статистичних гіпотез за допомогою табличного процесор Еxcel 24
3.2. Вирішення задачі на виявлення ефекту впливу. 25
Статистичні залежності в оцінці економічної ефективності діяльності фармацевтичної фірми. 30
1.Статистичні методи встановлення залежності між змінними. 30
1.1. Зв’язки між факторами. Загальні поняття. 30
1.2. Вибір методу перевірки залежності між змінними. 30
1.3. Поняття про шкали вимірювань. 33
2. Характеристика методів і критеріїв встановлення залежності між змінними. 35
2.1.1. Параметрична кореляція (коефіцієнт кореляції Пірсона) 35
2.2.1. Параметричний дисперсійний аналіз. 40
2.2.2. Непараметричний дисперсійний аналіз Фридмана. 43
2.3. Аналіз таблиць спряженості 44
2.3.1. Чотириклітинкові таблиці 44
3. Приклади вирішення задач. 46
3.1.Методи вирішення задач виявлення зв’язку між змінними за допомогою Еxcel 46
3.2.Вирішення задачі встановлення наявності зв’язку між змінними. 47
Перелік додаткової літератури. 49
Статистична обробка результатів досліджень в науковій діяльності лікаря і фармацевта
1.Методи перевірки статистичних гіпотез
1.1. Поняття про статистичну обробку результатів досліджень
Статистична обробка полягає в пошуку числових характеристик випадкових величин за результатами досліджень. Випадкові величини кількісно описують випадкові події ¾ будь які факти, які внаслідок дослідження можуть відбутися або ні. Наприклад, при статистичному опитуванні населення респонденти вибираються випадково (випадкова подія). При цьому неможливо наперед передбачити їхні відповіді на те чи інше питання, тому отримані внаслідок опитування дані є також випадковими.
Випадкові величини бувають дискретними ¾ мають певне числове значення в даний момент часу, або безперервними ¾ можуть набувати різного значення за певний проміжок часу. Наприклад, концентрація гемоглобіну і кількість еритроцитів в крові є дискретними випадковими величинами, тому що досліджується їх величина в певний момент часу і дослідника може цікавити, чи відрізняються ці показники в осіб різної статі або різних вікових груп. Якщо встановлювати рівень досліджуваних показників протягом певного проміжку часу в однієї особи або в групи осіб з метою з’ясування впливу пори року чи місячного циклу, то такі випадкові величини є безперервними.
Кількісні випадкові величини, які відрізняють один об’єкт від іншого, по іншому ще називаються кількісними ознаками. Характерною числовою характеристикою біологічних ознак є їх варіювання в певних межах при переході від однієї одиниці до іншої. Досліджуваний показник одного пацієнта (одиниця спостереження) називають ще варіантою.
Для оцінки варіативності кількісних ознак використовують варіаційні ряди розподілу ¾ ряди числових значень ознак, розміщені у певному порядку. Вони представляють собою подвійний ряд числе, в першому з яких наводять числові значення ознаки, в другому ¾ їхню повторюванясть у даній статистичній сукупності. Статистична сукупність ¾ сукупність відносно однорідних, але індивідуально відмінних одиниць, об’єднаних для групового вивчення.
Доцільність аналізу варіаційних рядів:
· прискорюють роботу з визначення узагальнюючих числових характеристик ¾ середньої величини і показників варіації;
· демонструють закономірність варіювання дослджуваної ознаки.
При побудові варіаційних рядів ознаки розділяють на інтервали (окремі проміжки) одинакової ширини в діапазоні від мінімального до макисмального значення даної сукупності. Підраховують кількість варіант, які належать до кожного з інтервалів. Кінцевий результат подають графічно у вигляді кривої варіаційного розподілу, де на осі абсцис відкладають інтервали показника, а на осі ординат ¾ частоту їх зустрічання.
До основних числових характеристик кількісних випадкових величин належать:
· середні величини;
· показники варіації.
Серед середніх величин найбільшого поширення набула середня арифметична (позначається ¾ М), яка обчислюється як сума всіх варіант, розділена на їх кількість у статистичній сукупності.
До показників варіативності належать
· варіаційний розмах (позначається DX), розраховується як різниця між максимальним і мінімальним значенням статистичної сукупності;
· дисперсія (позначається d2) ¾ характеризує міру варіювання числової ознаки біля її середньої арифметичної, оцінює внутрішню мінливість ознаки);
· середнє квадратичне відхилення (позначається d) ¾ найкраще характеризує специфіку варіювання ознак, виражається в одиницях середньої арифметичної;
· коефіцієнт варіації (позначається V) ¾ відносний показник, який виражається у % і дозволяє порівнювати варіативність різних статистичних сукупностей. Визначається як відношення d до М (´100 %).
1.2. Перевірка статистичних гіпотез. Загальні принципи
Статистичні гіпотези — це гіпотези, що відносяться до виду чи окремим параметрам розподілу випадкової величини.
Опишемо застосовувану при цьому термінологію.
Нехай f(X, θ) — закон розподілу випадкової величини X з деяким параметром θ. Тоді:
· Н0 (нульова гіпотеза) — θ = θ0,
· Н1 (альтернативна чи конкуруюча гіпотеза) — θ = θ1.
Н0 відхиляється в тому випадку, коли імовірність того, що вона вірна, виявляється нижче деякого рівня, називаного рівнем значимості.
При аналізі гіпотез можливі помилки двох видів:
· Н0 відкидається, коли вона вірна.
· Н0 приймається, коли вірна Н1.
Знижуючи рівень значимості ми зменшуємо імовірність помилки першого роду, але при цьому зростає імовірність помилки другого роду. Тому вводиться поняття потужності критерію, що являє собою імовірність відхилення Н0. Оскільки ця імовірність змінюється при зміні параметрів сукупності (наприклад, розміру вибірки), те звичайно розглядають криву потужності. На мал. 1.1 зображена крива потужності для перевірки біноміальної гіпотези р = 0,5.
На малюнку видно, що коли значення параметра, що перевіряється, відхиляється від 0,5 у ту чи іншу сторону, імовірність зробити помилку другого роду різко збільшується.
Малюнок 1.1. Крива потужності для перевірки біноміальної гіпотези р = 0,5 для різного числа досвідів
Перевірка гіпотез звичайно проходить наступні етапи.
1. Визначення використовуваної статистичної моделі. Тут висувають деякий набір передумов щодо закону розподілу випадкової величини і його параметрів. Наприклад, закон розподілу нормальний, величини незалежні й ін.
2. Формулюють Н0 і Н1.
3. Вибирають критерій (критериальную статистику), що підходить до висунутій статистичній моделі.
4. Вибирають рівень значимості а в залежності від необхідної надійності висновків.
5. Визначають критичну область для перевірки Н0. Якщо значення критерію попадає в цю область, то Н0 відхиляється. За умови, що Н0 вірна, імовірність влучення в критичну область дорівнює а. Вид цієї області (однобічна чи двостороння) залежить від прийнятої Н0.
6. Розраховують значення обраного статистичного критерію для наявних даних.
7. Розраховане значення критерію порівнюють із критичним (іноді називаним табличної) і потім вирішують чи прийняти відхилити Н0.
1.2.1. Однобічні і двосторонні критерії
У випадку, коли H1 сформульована у виді θ ≠ θ0, використовується двосторонній критерій (мал. 1.2).
Малюнок 1.2. Приклад критичної області для двостороннього критерію
Якщо ж ми формулюємо Н1, у виді θ > θ0 (чи θ < θ0), то в цьому випадку використовується однобічний критерій (мал. 1.3).
Малюнок 1.3. Приклад критичної області для однобічного критерію
1.2.2. Стійкість критеріїв
Будь-які гіпотези перевіряють, висуваючи спочатку комплекс деяких передумов про закон розподілу випадкової величини. Невиконання передумов робить висновки з відповідних перевірок не відповідній істині. Тобто імовірність неправильних висновків зростає. Ступінь зменшення надійності висновків у різних критеріїв відрізняється. Стійкими (робастными) називають такі критерії, для яких малі відхилення від прийнятих передумов (статистичної моделі) незначно впливають на надійність висновків, зроблених по них.
1.1.3. Розв’язувані задачі
При виборі критерію необхідно завжди виходити з прикладної постановки задачі і природи даних.
Короткий путівник по статистичних методах перевірки гіпотез про положення і розсіювання, що дозволяє вибрати придатний для вашої задачі, представлений у табл. 1.1.
Таблиця 1.1. Вибір методу для вирішення задачі про порівняння параметрів розпоідлу вибірок
Формулювання задачі з прикладної точки зору |
Формулювання задачі з статистичної точки зору |
Додаткові умови |
Застосовуваний метод |
|
Порівняння показників контрольної та експериментальної вибірок |
Перевірка гіпотези про рівність середніх (центрів розподілу) в двох незалежних вибірках |
Нормальний закон розподілу |
Дисперсії вибірок рівні |
t-критерій (Стьюдента) при рівних дисперсіях |
Дисперсії вибірок не рівні |
t-критерій (Стьюдента) при не рівних дисперсіях |
|||
Без припущення про дисперсії (але при однакових розмірах ви-бірок |
t-критерій (Стьюдента) без припущення про дисперсії |
|||
Закон розподілу відрізняється від нормального, або дані вимірюються по дискретній шкалі |
Дисперсії вибірок рівні |
Манна – Уітні (U-критерій Уілкок-сона – Манна – Уітні) |
||
Без припущення про дисперсії |
Двовибірковий Уілкоксона, медіанний |
|||
Порівняння показників вибірки до і після експерименту |
Перевірка гіпотези про рівність середніх в двох залежних вибірках |
Нормальний закон розподілу |
t-критерій (Стьюдента) для зв’язаних вибірок |
|
Закон розподілу відрізняється від нормального, або дані вимірюються по дискретній шкалі |
Знаковий, одновибірковий критерій Уілкоксона |
|||
Чи можна вважати, що середнє значення показника рівне деякому номінальному? |
Перевірка гіпотези про рівність середнього константі |
Нормальний закон розподілу |
t-критерій (Стьюдента) |
|
Закон розподілу відрізняється від нормального, або дані вимірюються по дискретній шкалі |
Гупта, знаковий |
|||
Порівняння розсіювання показників в двох вибірках |
Перевірка гіпотези про рівність дисперсій (про приналежність дисперсій одній генеральній сукупності) |
Нормальний закон розподілу |
F-критерій (Фішера) |
|
Закон розподілу відрізняється від нормального, або дані вимірюються по дискретній шкалі |
Зігеля – Тьюкі, Мозеса |
|||
Чи можна вважати, що в кількох вибірках має місце одине і те ж значення показника? |
Перевірка гіпотези про рівність дисперсій (про приналежність дисперсій одній генеральній сукупності) |
Нормальний закон розподілу |
G-критерій (Кохрена) при рівних розмірах вибірок, Бартлета |
|
Закон розподілу відрізняється від нормального, або дані вимірюються по дискретній шкалі |
Фрідмана |
|||
Чи можна вважати, що в кількох вибірках має місце одине і те ж значення розсіювання показника? |
Перевірка гіпотези про рівність середніх (про приналежність середніх одній генеральній сукупності) |
Нормальний закон розподілу |
Шеффе, Діксона, дисперсійний аналіз, LSD |
|
Закон розподілу відрізняється від нормального, або дані вимірюються по дискретній шкалі |
Краскела – Уолліса, медіанний, рангових сум Фрідмана |
1.2.4. Послідовність операцій при виборі критерію
1. Сформулювати задачу. Можливі класи задач приведені в табл. 1.1.
2. Визначити клас застосовуваних критеріїв. Необхідно зробити вибір між параметричними і непараметричними критеріями перевірки гіпотез.
3. Визначити додаткові умови для вибору критерію. Багато критеріїв вимагають виконання додаткових умов, без яких їхнє використання буде некоректним.
4. Вибір конкретного критерію. Для багатьох ситуацій існує трохи приблизно рівнозначних критеріїв, придатних для перевірки гіпотези.
Розглянемо рішення задачі вибору критерію більш докладно.
1.2.5. Постановка задачі
Розглянемо кожну можливу прикладну постановку задачі.
· Порівняння показників контрольної й експериментальної вибірок. У нас є дві незалежні вибірки, середні значення деяких параметрів ми хочемо порівняти. Наприклад, дві групи хворих, лікування яких виробляється різними методами.
· Порівняння показників вибірки до і після експерименту. У даному випадку ми маємо справу з так називаними зв’язаними вибірками. Інколи зустрічається також вираз «вибірки, що природним чином розбиваються на пари». Наприклад, значення деякого показника в одній і тій же групі хворих до і після лікування.
· Чи можна вважати, що середнє значення показника дорівнює деякому номінальному значенню? Для якогось показника (наприклад, артеріальний тиск, частота пульсу й ін.) може існувати деяке значення, що вважається нормою. Нам необхідно перевірити, чи можна вважати, що середнє значення показника в досліджуваній групі дорівнює нормі. Після перевірки цієї гіпотези для середнього довірчий інтервал обов’язково варто побудувати і простежити, щоб для вибірки виконувалися необхідні умови.
· Порівняння розсіювання показника в двох вибірках. У деяких біологічних експериментах важливо не середнє значення показника, а його розсіювання. Наприклад, для наступної селекції нових сортів нам необхідно підібрати такий вид впливу на насіння, щоб розсіювання ознак було найбільшим. Чи ж, необхідно вибрати препарат (метод лікування), для яких розсіювання контрольованої ознаки після застосування буде мінімальним.
· Чи можна вважати, що в декількох вибірках має місце те саме значення розсіювання показника? Задача аналогічна попередньої, але порівнюються не два види впливу, а три і більш.
· Чи можна вважати, що в декількох вибірках має місце те саме значення показника? Наприклад, ми застосовуємо для лікування різних груп хворих кілька препаратів-аналогів. Чи можемо ми сказати, що результати лікування статистично не відрізняються?
1.2.6. Визначення класу застосовуваних критеріїв
Необхідно здійснити вибір між параметричними і непараметричними критеріями. Вибір залежить від закону розподілу вибірки і шкали виміру, у якій представлені вихідні дані.
Якщо дані виміряються в шкалі найменувань чи в шкалі порядку (нечислові шкали), то застосовуються рангові (непараметричні) критерії, докладніше шкали описані в наступному розділі. Нагадуємо, коли значення якісне (є/немає; стать; вага захворювання; бали, встановлені експертом і т.п.) ми маємо справу з нечисловою природою шкали, хоча в таблиці можуть бути записані числа (бали, номер препарату і т.п.).
Рангові (непараметричні) критерії застосовуються також і для числових даних, у тому випадку, коли закон розподілу вибірки відрізняється від нормального.
Строга перевірка закону розподілу вимагає великої кількості даних, тому па практиці звичайно застосовують спрощені критерії:
· Метод “трьох сігм” полягає в наступному. Практично всі (99,7%) відхилень від середнього менше 3 сігм (εі <3*σ). Дві третини (68,3%) відхилень менші σ. Половина (50%) відхилень менші 0,625*σ (де σ- середньоквадратичне відхилення даних у вибірці).
· Визначення коефіцієнтів аисметрії (позначається As) і ексцесу (позначається Ex). При нормальному розподілу величини даних коефіцієнтів наближаються до 0 і є меншими критичних, що наводяться в спеціальних довідкових таблицях в залежності від об’єму вибірки (кількості випробувань в одному досліді).
1.2.7. Визначення додаткових умов для вибору критерію
Найбільш розповсюдженими додатковими умовами для вибору критерію є:
· Рівні чи не рівні розміри вибірок?
· Рівні чи не рівні дисперсії порівнюваних вибірок?
· Чи однакові закони розподілу порівнюваних вибірок?
Остання умова є вимогою майже будь-якого критерію, але ніколи реально не піддається перевірці. Воно повиннео бути забезпечено правильним формуванням вибірок.
Перша умова перевіряється простим порівнянням, а для перевірки другого використовуються відповідні критерії, що вибираються аналогічно.
1.2.8. Вимоги до вибірок
При будь-яких дослідженнях ідеально було б перевірити всі можливі ситуації – визначити всі можливі значення досліджуваної ознаки, що складають генеральну сукупність (сукупність, в якій досліджуються всі випадки). Проте дослідити всі випадки не можливо, тому для аналізу використовують вибіркову сукупність (відібрану частину генеральної сукупності). Основним правилом при формуванні достатньо чисельної для дослідження (репрезентативної) вибіркової сукупності є створення рівної можливості попадання у вибірку всіх членів генеральної сукупності ¾ від найменших до найбільших (спосіб рандомізації).
При проведенні досліджень (особливо клінічних) необхідно забезпечити наступні властивості вибірки.
Однорідність. При вибірці вплив досліджуваної сукупності факторів на цікавлячі ознаки не повинне суперечити один одному. Наприклад, при дослідженні впливу кава на організм людини, у вибірці випробуваних одночасно не повинне бути людей, яких кава збуджує, і тих, котрих від нього хилить у сон. У ряді випадків причини неоднорідності можуть бути невідомі і тому перед аналізом даних бажана перевірка вибірки методами кластерного аналізу.
При вибірці не повинне бути значимо впливаючих на досліджуваний параметр факторів, крім тих, котрі ми вивчаємо. Якщо ми припускаємо, що фази Місяця впливають на ефективність дії препарату, то фазу Місяця необхідно враховувати як фактор чи збирати вибірки, у яких фаза Місяця однакова.
Репрезентативність (структурна відповідність). Досліджувана вибірка повинна бути репрезентативна генеральної сукупності. Це означає, що коли ми формуємо вибірку із сукупності, вона повинна відповідати наступним вимогам:
1. Вид статистичного розподілу вибірки повинний відповідати розподілу генеральної сукупності.
2. Величина вибірки повинна бути достатня для відображення структури генеральної сукупності.
У зв’язку з цим вибірка з хворих, що проходили курс лікування в одній чи клініці покупців однієї аптеки не є репрезентативної по своїй структурі. Опитування, проведене по телефону, відбиває думку тільки власників телефонів, а не всього населення, структура захворюваності в різних областях різна. Висновки маркетингового дослідження, проведеного в Києві, не поширюються на невеликі міста.
У тих випадках, коли ми порівнюємо деякі параметри двох вибірок, необхідно забезпечити рівність розподілу частот впливаючих факторів (стать, вік, серйозність захворювання й ін.) у порівнюваних вибірках.
Ще одне зауваження. Вибіркове середнє арифметичне значення, як правило, не співпадає з аналогічним значення генеральної сукупності. Тому при поданні кінцевого результату вимірювання у вибірковій сукупності необхідно встановити величину відхилення вибіркової середньої від генеральної. Її називають статистичною помилкою або помилкою репрезентативності. Для вимірювання помилки найчастіше використовують похибку середньої арифметичної або середню похибку (позначається m). Вона вказує на те, наскільки є великою випадкова варіація окремих спостережень навколо середньої арифметичної генеральної сукупності, якщо крива варіаційного розподілу симетрична. Кінцевий результат кожного варіаційного ряду подають у мигляді M±m.
Збіг умов спостережень. Умови спостереження для окремих елементів чи вибірки для двох порівнюваних вибірок повинні збігатися. Найкращим способом забезпечення цієї властивості є подвійний сліпий метод, при якому пі пацієнт, ні лікар, ні середній медичний персонал не знає, які чи ліки плацебо видаються конкретному хвор. Це дозволяє позбутися від ефекту сугестивності (вплив якого можливо на 30—50% пацієнтів) і ефекту упередженості.
2. Характеристика деяких критеріїв перевірки статистичних гіпотез
2.1. Параметричні критерії перевірки гіпотез про середні і дисперсії
2.1.1. Критерій Фішера
Призначення. Перевірка гіпотези про приналежність двох дисперсій однієї генеральної сукупності й отже — їх рівність.
Нульова гіпотеза. S12 = S22.
Альтернативна гіпотеза. Існують наступні варіанти Hl у залежності від який розрізняються критичні області:
1. S12 > S22. Найбільше часто використовуваний варіант Н1. Критична область — верхній хвіст F-розподілу.
2. S12 < S22. Критична область — нижній хвіст F-розподілу. Через часту відсутність нижнього хвоста, у таблицях критичну область звичайно зводять до варіанта 1, змінюючи місцями дисперсії.
3. Двостороння: S12 ≠ S22. Комбінація перших двох.
Передумови. Дані незалежні і розподілені по нормальному законі.
Короткі теоретичні відомості. Гіпотеза про рівність дисперсій двох нормальних генеральних сукупностей приймається, якщо відношення більшої дисперсії до меншого менше критичного значення розподілу Фішера.
Fpaсч = S12 / S22 (2.1)
Fpaсч < Fa,v1,v2
де а — рівень значимості, v1 і v2 — ступені волі для дисперсії в чисельнику і знаменнику відповідно.
Примітка. При описуваному способі перевірки значення Fpaсч обов’язково повинне бути більше одиниці. Критерій чуттєвий до порушення припущення про нормальність.
Для двосторонньої альтернативи S12 ≠ S22. нульова гіпотеза приймається при виконанні умови:
F1-a/2,v1,v2 < Fpaсч < Fa/2,v1,v2
2.1.2. Аналіз однорідності дисперсій по Кохрену
Призначення. Перевірка гіпотези про приналежність декількох дисперсій до однієї генеральної сукупності.
Нульова гіпотеза. σ12 = σ12 = … = σi2 = σk2 = σ2.
Передумови. Дані незалежні і розподілені по нормальному законі. Кількість спостережень однаково в кожній вибірці.
Короткі теоретичні відомості. Критеріальне значення розраховується по наступній формулі:
(2.2)
де S2max — максимальна з дисперсій; Si2 -емпіричні дисперсії, розраховані в кожній вибірці.
Результат порівнюється з табличним. Якщо Gpaсч < Gmабл., α, k, n-1, то гіпотеза про однорідність приймається. Тут п — кількість дослідів, по яких обчислюють оцінку дисперсії Si.
Примітка. Відхилення нульової гіпотези може означати відмінність закону розподілу даних від нормального, а не неоднорідність дисперсій.
2.1.3. Критерій Бартлета
Призначення. Перевірка гіпотези про однорідність декількох дисперсій. Застосовується у випадку, коли вибірки, по яких визначаються оцінки дисперсій, мають різний розмір (на відміну від критерію Кохрена, що вимагає вибірок рівного розміру).
Нульова гіпотеза. Досліджувані дисперсії належать до однієї генеральної сукупності:
σ12 = σ12 = … = σi2 = σk2 = σ2.
Альтернативна гіпотеза, σi2 ≠ σ2 для конкретного i. Toбто, хоча б одна з дисперсій належить іншої генеральної сукупності.
Передумови. Розподіл даних повинний бути нормальним, дані незалежні.
Короткі теоретичні відомості
(2.3)
де
При цьому — загальне число ступенів волі; k — число груп; vі = пі, – 1 — число ступенів волі в кожній групі (ni – обсяг i-тої групи); Si2, — оцінка дисперсії в кожній групі; S2 — зважена оцінка дисперсії.
Якщо розраховане значення χ2 чи більше дорівнює критичному значенню, узятому з рівнем значимості α і числом ступенів волі v, то нульова гіпотеза приймається.
Примітка. Даний критерій дуже чуттєвий до відхилення даних від нормального закону розподілу.
2.1.4. Перевірка гіпотези про рівність середніх при нерівних дисперсіях вибірок
Призначення. Перевірка рівності середніх двох генеральних сукупностей, з яких витягнуті дві вибірки.
Передумови. Обидві вибірки витягнуті із сукупності, що має нормальний розподіл, дані незалежні, дисперсії вибірок розрізняються, вибірки незалежні.
Короткі теоретичні відомості. Критеріальне значення розраховується по формулі:
(2.4)
При цьому:
(2.5)
де N1, і N2 – розміри першої і другої вибірок; S12 і S22 — емпіричні дисперсії;
i — оцінки середніх значень; V — число ступенів волі для t-критерію. При обчисленнях передбачається, що більше .
Нульова гіпотеза
· Н0: проти Н1: . У цьому випадку гіпотеза про рівність середніх відкидається якщо по абсолютній величині критеріальне значення більше верхньої α/2% точки t-розподілу, узятого з V ступенями волі, тобто при t > tv, α/2.
· Н0: проти Н1: . Нульова гіпотеза відкидається, якщо критеріальне значення більше верхньої α% точки t-розподілу, узятого з V ступенями волі, тобто при t > tv, α.
Примітка. Критерій стійкий при малих відхиленнях від нормального закону розподілу.
2.1.5. Перевірка гіпотези про рівність середніх при рівних дисперсіях
Призначення. Перевірка рівності середніх двох генеральних сукупностей, з яких витягнуті дві вибірки.
Передумови. Обидві вибірки витягнуті із сукупності, що має нормальний розподіл. Дані незалежні. Дисперсії вибірок однакові.
Короткі теоретичні відомості. Критеріальне значення обчислюється по наступній формулі:
(2.6)
де N1 і N2 — розміри першої і другої вибірок; S12 і S22 — емпіричні дисперсії; , i — оцінки середніх значень.
Число ступенів волі для перевірки t-критерію дорівнює V = N1 + N2 – 2.
Нульова гіпотеза
· Н0: проти Н1: . У цьому випадку гіпотеза про рівність середніх відкидається, якщо по абсолютній величині критеріальне значення більше верхньої α/2% точки t-розподілу, узятого з V ступенями волі, тобто при t > tv, α/2.
· Н0: проти Н1: . Нульова гіпотеза відкидається, якщо критеріальне значення більше верхньої α% точки t-розподілу, узятого з V ступенями волі, тобто при t > tv, α.
Примітка. Критерій стійкий при малих відхиленнях від нормального розподілу. При невиконанні умови рівності дисперсій критерій стійкий тільки для випадку вибірок рівного обсягу.
2.1.6. Перевірка гіпотези про рівність середніх без припущень про дисперсії
Призначення. Перевірка рівності середніх двох генеральних сукупностей, з яких витягнуті дві вибірки.
Передумови. Обидві вибірки витягнуті із сукупності, що має нормальний розподіл. Дані незалежні. Розміри вибірок однакові, вибірки незалежні.
Короткі теоретичні відомості. Критеріальне значення обчислюється по формулі:
(2.7)
де N — розмір першої і другої вибірок; , i — оцінки середніх значень; X1i і X2i — поточні значення перемінних.
Число ступенів волі для t-критерію V = N – 1.
Нульова гіпотеза
· Н0: проти Н1: . У цьому випадку гіпотеза про рівність середніх відкидається якщо по абсолютній величині критеріальне значення більше верхньої α/2% точки t-розподілу, узятого з V ступенями волі, тобто при t > tv, α/2.
Примітка. Критерій стійкий при малих відхиленнях від нормального розподілу.
2.1.7. Перевірка гіпотези про рівність середнього константі
Призначення. Перевірка рівності середнього певному значенню.
Передумови. Вибірки витягнуті із сукупності, що має нормальний розподіл, дані незалежні.
Короткі теоретичні відомості. Критеріальне значення обчислюється але формулі:
(2.8)
де N — розмір вибірки; S2 — емпірична дисперсія вибірки; А — передбачувана величина середнього значення; — середнє значення.
Число ступенів волі для t-критерію V =N- 1.
Нульова гіпотеза
· Н0: проти Н1: . Нульова гіпотеза про рівність середніх відкидається, якщо по абсолютній величині критеріальне значення більше верхньої α/2% точки t-розподілу узятого з V ступенями волі, тобто при
· Н0: проти Н1: . Нульова гіпотеза відкидається, якщо критеріальне значення більше верхньої α % точки t-розподілу узятого з V ступенями волі, тобто при
· Н0: проти Н1: . Нульова гіпотеза відкидається, якщо критеріальне значення менше нижньої α % точки t-розподілу, узятого з V ступенями волі.
Примітка. Критерій стійкий при малих відхиленнях від нормального розподілу.
2.1.8. Перевірка гіпотези про рівність середніх при зв’язаних вибірках
Призначення. Перевірка рівності середніх двох генеральних сукупностей, з яких витягнуті дві вибірки, за умови, що вибірки зв’язані. Наприклад, значення якихось параметрів до і після лікування, у процесі старіння організму і т.п. Хоча для цих цілей часто використовують звичайний критерій (приведений вище), рекомендують користатися спеціальним критерієм.
Передумови. Обидві вибірки витягнуті із сукупності, що має нормальний розподіл. Дані незалежні. Вибірки зв’язані.
Короткі теоретичні відомості. Критеріальне значення обчислюється але формулі:
(2.9)
де хi, і уi, — значення зв’язаних рядів спостережень; N — величина вибірки (кожної, тому що вони однакові).
Число ступенів волі для t-критерію V = N- 1.
Нульова гіпотеза
· Н0: проти H1: . У цьому випадку гіпотеза про рівність середніх відкидається, якщо по абсолютній величині критеріальне значення більше верхньої α/2% точки t-розподілу, узятого з V ступенями волі, тобто при
· Н0: проти Н1: . Нульова гіпотеза відкидається, якщо критеріальне значення більше верхньої % точки t-розподілу узятого з V ступенями волі, тобто при .
· Н0. проти H1: . Нульова гіпотеза відкидається, якщо критеріальне значення менше нижньої α % точки t-розподілу, узятого з V ступенями волі.
Примітка Позитивною стороною цього критерію є те, що навіть при значних відхиленнях перемінних хi, і уi від нормального закону їхня різниця буде досить точно розподілена по нормальному законі.
2.1.9.Парадокси при перевірці гіпотез об середні і деякі зауваження
При перевірці гіпотез цілком можливі наступні ситуації:
1. Підтверджено гіпотези і , але відкинута .
2. Підтверджено гіпотези і , але відкинута .
У зв’язку з цим, для перевірки рівності декількох середніх необхідно користатися спеціальними критеріями.
Деякі зауваження до перевірок середніх
· Варто пам’ятати, що в тому випадку, коли вибірка формується невипадковим способом, стандартні відхилення зменшуються, а різниця середніх значень збільшується.
· Можливе порівняння параметрів на підставі зіставлення їхніх довірчих інтервалів. При цьому, якщо інтервали не перекриваються, то між параметрами є статистично значима різниця. Якщо ж довірчі параметри перекриваються частково, то з цього не випливає, що вони відрізняються незначимо.
Визначення розміру вибірки
Для визначення мінімального обсягу вибірки, необхідного для оцінки значення досліджуваного параметра можна скористатися наступною формулою:
(2.10)
де п — шуканий розмір вибірки; N — розмір генеральної сукупності; α — рівень значимості при перевірки гіпотезі про значення параметра.
2.2. Непараметричні критерії перевірки статистичних гіпотез.
Непараметричні критерії застосовують у тих випадках, якщо закон розподілу відрізняється від нормального, чи дані вимірюють у дискретних шкалах виміру.
В усіх випадках використання наведених непараметричних критеріїв приймають наступні допущення:
· усі випадкові величини взаємно незалежні,
· аналізовані вибірки розподілені по безперервному розподілу того самого виду.
Часто перевіряють гіпотезу про рівність не середніх, а медіан. Це зв’язано з тим, що для закону розподілу, відмінного від нормального, медіана є більш стійкою і коректною оцінкою положення центру розподілу.
Варто пам’ятати, що непараметричні критерії мають для випадку нормального розподілу потужність меншу, ніж відповідні параметричні критерії. У зв’язку з цим не слід використовувати непараметричні критерії при нормальному розподілі випадкових величин у досліджуваних вибірках.
2.2.1. Поняття про ранги і їхня побудова
На практиці досить часто зустрічають числові дані у вибірці, що носять у певному розумінні умовний характер. Це можуть бути експертні оцінки, тестові бали, дані про які-небудь переваги досліджуваної групи людей (наприклад, політичних) і т.д. При аналізі таких даних часто неможливо дотриматися всі передумови застосування класичних статистичних методів, що мають на увазі приналежність робочої вибірки одному з відомих законів розподілу (наприклад, нормальному). Іноді це дуже важко чи перевірити довести (скажемо, у силу недостатньої кількості спостережень). У таких випадках робити науково обґрунтовані висновки, застосовуючи методи прикладної статистики, можна лише використовуючи не самі значення (наприклад, бали), а їхній порядок, заснований на співвідношенні «менше – більше». Порядок значень називають рангами. У літературі по статистичному аналізі можна зустріти кілька визначень рангів. Приведемо на наш погляд, найбільш удале. Рангом спостереження називають номер, що одержить це спостереження в упорядкованій сукупності всіх даних після упорядкування їхній відповідно до визначеного правила (наприклад, від меншого значення до більшого).
У деяких джерелах поняття рангу прирівнюється до поняття порядкового номера елемента варіаційного ряду. Однак це вірно лише почасти. Адже в такому випадку незрозуміло, яким образом робити, якщо два чи більш елементи варіаційного ряду рівні між собою.
Надалі при використанні поняття рангу, а також ранжирування (процес присвоєння елементам вибірки рангів) ми будемо мати на увазі, що ряд значень ранжується за правилом, заснованому на співвідношенні «менше — більше».
Варіаційним рядом називають значення випадкової вибірки (x1, x2,… хп), що мають функцію розподілу F(x) і розташовані в порядку їхнього зростання: х(1) < х(2) < … < х(і) < … < х(п), де i-й член варіаційного ряду х(і) називають і-й порядковою статистикою, а номер члена варіаційного ряду — рангом, порядком (статистики).
Ранжирування — це процедура переходу від сукупності спостережень до послідовності їхніх рангів. Результат ранжирування називають ранжуванням.
Розглянемо процес ранжирування па прикладі. Допустимо, у нас є вибірка, що складається з п’яти чисел: 8, 25, 42, 3, 1. Цим значенням будуть привласнені відповідні ранги: 3, 4, 5, 2, 1. По суті, вони є позиціями елементів приведеної вибірки, якщо її відсортувати по зростанню.
Іноді дані у вибірці збігаються. Виникає питання: який ранг присвоїти співпадаючим значенням вибірки? У такому випадку використовують так називані середні ранги. Сукупність елементів вибірки, що мають однакове значення, називають зв’язкою, а кількість однакових значень у зв’язці — її розміром. Середнім рангом є середнє арифметичне рангів елементів зв’язки, які б вони мали, якби однакові елементи зв’язки виявилися різні. Наприклад, у нас є вибірка чисел: 15, 17, 12, 15, 7, 8, 5, 1, 8. Цим значенням будуть відповідати ранги: 7,5; 9; 7,5; 6; 3; 4,5; 2; 1; 4,5.
Статистичні методи, що використовують ранги для одержання науково обґрунтованих висновків з аналізованих даних, називають ранговими. Ці методи широко застосовують там, де дуже складно (чи неможливо) з’ясувати якому закону розподілу відповідають аналізовані дані. Однак слід зазначити, що коли в аналізованих даних містяться великі зв’язки (чи їх багато), застосування цих методів викликає сумнів. Якщо ж кількість зв’язок невелика (і вони не дуже великі), то їх необхідно враховувати в конкретних розрахункових формулах.
Різні статистичні пакети мають процедури, що дозволяють виконати процес ранжирування вибірки, простіше говорячи — одержати ранги елементів досліджуваної вибірки. Є така функція (РАНГ() RANK()) і в електронних таблицях Microsoft Excel. Але, на жаль, працює вона некоректно — не може призначати середні ранги елементам вибірки, при наявності в ній зв’язок.
2.2.2. Критичні значення статистики W-критерію Уилкоксона
Критичні значення статистики W-критерію Уилкоксона широко застосовують при використанні методів перевірки статистичних гіпотез, заснованих на рангах. Дані критичні значення досить добре табульовані — їх приводять у виді таблиць в багатьох літературних джерелах. Але необхідна книга не завжди є під рукою. По цьому, ми пропонуємо використовувати для розрахунку критичних значень статистики W формулу, засновану на її апроксимації використанням нормального розподілу
Нижню критичну точку статистики W досить точно обчислюють по апроксимуючій формулі:
(2.11)
де [] — операція округлення до найближчого цілого; Q — рівень значимості для однобічного критерію; т, п — розміри досліджуваних вибірок, причому т < п, Ч*(1-Q) значення зворотної функції нормального розподілу з параметрами (Q, 1). Приведена вище апроксимуюча формула дає задовільні результати при п > т > 5.
Верхня критична точка зв’язана з нижньою співвідношенням:
W(Qm;n) = т(т + п + 1) – w(Qm;n). (2.12)
Таким чином, знаючи нижнє критичне значення статистики W, завжди можна обчислити верхнє.
Критичне значення статистики Манна – Уітні U зв’язано з критичним значенням статистики W співвідношенням:
U(Qm;n) = w(Qm;n) – т (т + 1)/2. (2.13)
Обчислення критичних значень статистики W в електронних таблицях MS Excel можна виконати так: в клітинку таблиці слід ввести вищенаведену формулу, використотавши замість Ф(1—Q) убудовану в Microsoft Excel функцію HOPMCTOBP(l–Q) (NormSInv(l–Q)).
2.2.3. Критерій Краскела — Уоліса (Н-критерий)
Призначення. Перевірка гіпотези про те, що кілька (k) вибірок мають однаковий розподіл і, отже, середні значення цих вибірок рівні між собою.
Нульова гіпотеза. Усі k вибірок мають однаковий розподіл.
Альтернативна гіпотеза. Нульова гіпотеза невірна.
Передумови. Усі випадкові величини взаємно незалежні.
Опис методу:
1. Вибірки поєднують в одну.
2. Для об’єднаної вибірки всі спостереження заміняють рангами (див. 2.2.1).
3. Визначають критеріальне значення по формулі:
(2.14)
де N — загальна кількість спостережень, визначають у такий спосіб ni, – число спостережень у кожній вибірці; Ri – сума рангів по кожній вибірці (rij – ранг j–ro спостереження в і-й вибірці); k — кількість вибірок).
4. Виконуємо порівняння розрахункового значення критерію з критичним (табличним) значенням. У тому випадку, якщо розрахункове значення критерію більше критичного, те кульова гіпотеза відхиляється, і ми не можемо вважати, що середні значення рівні між собою.
При малому загальному числі досвідів (N < 15) використовуються спеціальні таблиці розподілу Краскала — Уоліса. Якщо загальна кількість досвідів більше зазначеної величини, то в якості критичної використовують верхню 5% точку розподілу χ2 з (k – 1) числом ступенів волі.
Примітка. Якщо нульова гіпотеза відхилена, то для того, щоб з’ясувати, які пари вибірок мають однаковий розподіл, не можна використовувати будь-які двовибіркові критерії (див. про парадокси в порівнянні середніх) — необхідно застосовувати множинні порівняння. Цей критерій менш потужний, чим критерій Фішера, тому при числових даних і нормальному законі розподілу варто застосовувати саме критерій Фішера чи Кохрена для декількох дисперсій. У тих випадках, коли вибірки мають різний розподіл, даний критерій застосовувати неможна. Замість нього варто використовувати критерій Фридмана. У тому випадку, коли в стовпці спостережень маються зв’язування, то значення критерію коректується по формулі:
(2.15)
де L — кількість зв’язок, Ті — кількість співпадаючих елементів в і-й зв’язуванні.
3.3.4. Критерій Зігеля — Тьюкі
Призначення. Призначений для перевірки рівності дисперсій двох вибірок порядкових чи даних при законі розподілу вибірок, що відрізняється від нормального
Нульова гіпотеза. .
Передумови. Усі випадкові величини взаємно незалежні. Аналізовані вибірки розподілені по неперервнему розподілі того самого виду.
Короткі теоретичні відомості
Перевіряємо гіпотезу про приналежність двох незалежних вибірок до однієї генеральної сукупності. Для цього формуємо об’єднану вибірку з загальним числом спостережень п1 + п2 (при цьому п1 < n2), що упорядковується по величині. Потім формуємо ранги (Увага! Ранги будуються незвичайним образом!) таким чином, щоб мінімальні і максимальні значення одержали низькі ранги, а в міру наближення до середніх значень ранги збільшувалися. При цьому, якщо спостережень непарна кількість, те середнє спостереження (медіана) не одержує ніякого рангу. Ранг 1 присвоюється найменшому значенню, ранги 2 і 3 двом найбільшим, 4 і 5 наступним найменшим, 6 і 7 — найбільшим і т.д. Потім для кожної вибірки визначають суми привласнених рангів R1 і R2. Для перевірки правильності розміщення рангів можна скористатися виразом R1 + R2 = (п1+п2)(п1+п2+1)/2 Для непарної чи загальної кількості спостережень R1 + R2 = (п1+п2)((п1+п2+1)/2-1) для парного.
Для малих обсягів вибірки ( ) існують спеціальні таблиці, що дають критичні значення розподілу Уілкоксона. У тих випадках, коли п1, п2 > 9 чи п1 > 2, п2 > 20, можна застосовувати стандартну нормальну змінну:
(2.15)
де R1 — сума рангів меншої по обсязі вибірки. Коли 2R1 >n1(n1 + n2 + 1), у чисельнику виразу для z перед 1 знак потрібно замінити з «+» на «-».
Якщо обсяги вибірок відрізняються, z необхідно скорегувати:
z’=z + (0,1n1 – 0,1n2)(z3 – 3z). (2.16)
У випадку, якщо більше 20% спостережень (різних вибірок!) зв’язані рівностями чи залежностями, знаменник виразу для z приймає наступний вид:
(2.17)
де S1 — сума квадратів рангів залежних спостережень, S2 — сума квадратів середніх рангів залежних спостережень (у кожній групі залежних спостережень знаходиться середній ранг).
За обчисленим значенням z з таблиці визначаємо імовірність, що помноживши на 2, одержуємо рівень значимості α. Якщо ця імовірність мала (менше 0,05), те з довірчою імовірністю 1 – α можна вважати, що є присутнім різниця дисперсій генеральних сукупностей.
Примітка. Чим більше розрізняються вибірки, тим менш надійний цей критерій.
2.2.5. Критерій знаків
Призначення. Застосовують у тих випадках, коли порівнювані вибірки однакового розміру природним образом розбиваються па пари (зв’язані вибірки). Наприклад, показники тих самих хворих до прийому препарату і після; показники росту чи врожайності пари кущів, що ростуть поруч, при цьому один з пари одержує додаткову підгодівлю чи обробку. Іноді такі перевірки називають перевіркою наявності ефекту обробки.
Нульова гіпотеза. Фактично перевіряють гіпотезу про рівність нулю медіани різниці між парами двох вибірок.
Короткі теоретичнівідомості. Розраховують значення:
(2.18)
де Xi і Yi, — значення елементів відповідних вибірок.
Оскільки передбачається, що спільний розподіл X і Y неперервне, то імовірність рівності значень X і Y вважають рівною 0. Тому, у випадку збігу значень вони відкидаються, і кількість вимірів відповідно зменшується. Обчислюється число т, рівне кількості Zi, значення яких рівні 1.
Для невеликих вибірок можна обчислити рівень значимості (імовірність відкинути гіпотезу про рівність нулю медіани різниці, якщо вона вірна) по формулі:
(2.19)
де п — розмір вибірки.
Для великих вибірок можна скористатися наближеною нормальною апроксимацією:
Якщо отримане значення Р мале (менше 0,05), то гіпотезу про рівність нулю відкидають.
(2.20)
У тих випадках, коли розміри вибірок не рівні чи природна розбивка на пари неможлива, застосовують медіанний критерій для двох вибірок чи двухвиборковий критерій Уілкоксона.
2.2.6. Критерій Манна — Уітні (U-критерій Уілкоксона — Манна — Уітні)
Призначення. Перевірка гіпотези про рівність середніх двох незалежних вибірок.
Нульова гіпотеза. Дві незалежні вибірки належать одній генеральної сукупності, їхньої функції розподілу рівні. Ця гіпотеза включає рівність середніх і медіан.
Можна перевірити й іншу гіпотезу:
, де А — деяка константа. Щоб застосувати цю гіпотезу, необхідно з усіх спостережень першої вибірки відняти А, а залишки вважати новою першою вибіркою. Після цього всі описані нижче дії виконують аналогічно.
Передумови. Усі випадкові величини взаємно незалежні. Спостереження, що входять в одну вибірку, належать до однієї генеральної сукупності. Дисперсії вибірок рівні.
Короткі теоретичні відомості
Цей критерій — непараметричний аналог t-критерію для перевірки середніх значень. Є самим строгим з непараметричних критеріїв. Його можна застосовувати тільки у випадку, коли дисперсії вибірок рівні.
Формуємо єдину вибірку, для її значень визначають ранги (по зростанню). Повторюваним спостереженням присвоюють середній ранг (див. 2.2.1).
Визначають розрахункове значення критерію. Для малих вибірок:
(2.21)
(2.22)
де R1 і R2 — суми рангів, розрахованих для значень, що належать першій і другій вибіркам відповідно.
Правильність розрахунку U1 і U2 перевіряють співвідношенням:
U1 + U2 = n1n2 (2.23)
Критеріальне значення визначають у такий спосіб:
U = min(U1,U2). (2.24)
Гіпотезу про рівність вибірок відкидають, якщо U > U(n1 пъ α), де U(n1 n2, α) — критичне значення статистики Манна — Уітні . Крім того, у 3.3.2 докладно викладено, яким образом можна точно обчислити критичне значення статистики U через критичні значення статистики W.
Для вибірок, розмір яких досить великий (п1 + п2 > 60), можна скористатися апроксимацією:
(2.25)
де z відповідає значенню стандартного нормального розподілу. Для випадку п1 8 і п2 8 можна скористатися нормальною апроксимацією:
(2.26)
Якщо розраховане значення z більше табличного значення нормального стандартного розподілу, узятого з відповідним рівнем значимості, то гіпотеза відкидається.
Примітка. Увага! Якщо нульова гіпотеза відкидається, виходить, вибірки мають різні закони розподілу. Але в загальному випадку це не означає, що середні значення не рівні.
Критерій малочутливий до малих розходжень дисперсій вибірок.
t-критерій потужніще критерію Манна – Уітні, тому останній не слід використовувати у випадку нормального розподілу вибірок.
Цей критерій не можна застосовувати до зв’язаних вибірок. З передбачуваної безперервності розподілів аналізованих вибірок випливає відсутність повторів у вибірках. Однак па практиці збіги зустрічаються досить часто, що зв’язано, наприклад, з округленням даних при вимірі. У цьому випадку зроблені за допомогою цього критерію висновки, є приблизними (при цьому, чим більше у вибірках співпадаючих значень, тим сумнівніше висновки). При великій кількості повторів даний метод застосовувати не варто, краще скористатися, наприклад, двовибірковим критерієм Уілкоксона.
3. Приклади вирішення задач перевірки статистичних гіпотез
3.1. Методи вирішення задач перевірки статистичних гіпотез за допомогою табличного процесор Еxcel
Як уже було відмічено в темах 2 та 3, табличний процесор Excel володіє потужними інструментами для проведення статистичних обчислень:
· Розвинені можливості щодо написання складних математичних виразів.
· Підбірка функцій для розрахунку багатьох статистичних критеріїв та параметрів.
· Пакет Анализ данных, що містить набір функцій-підпрограм для комплексного проведення аналізу вибірок даних.
В наступній таблиці подано перелік функцій-підпрограм, що можуть бути використані при перевірці статистичних гіпотез:
Назва підпрограми |
Короткий опис |
Двовибірковий F–тест для дисперсій |
Розраховеє та перевіряє по критичному значенню критерій Фішера для дисперсій двох незалежних вибірок |
Регрессия |
Розрахунок параметрів функції лінійної регресії по методу найменших квадратів |
Двовибірковий t–тест для рівних дисперсій |
Розраховує t–критерій Стьюдента для середніх значень двох вибірок при рівних дисперсіях |
Двовибірковий t–тест для не рівних дисперсій |
Розраховує t–критерій Стьюдента для середніх значень двох вибірок при не рівних дисперсіях |
Парний двовибірковий t–тест для середніх значень |
Розраховує t–критерій Стьюдента для середніх значень двох вибірок без припещення про дисперсіїї. Використовеється, коли є природня парність спостережень у вибірках (наприклад, генеральна сукупність тестується двічі) |
Двовибірковий z–тест для середніх значень |
Застосовується для перевірки гіпотези про різницю середніх значень двох генеральних сукупностей. Дисперсії вибірок при цьому повинні бути відомі. |
3.2. Вирішення задачі на виявлення ефекту впливу
Розглянем наступний приклад. Приведено дані по двох незалежних вибірках (табл. 3.1) розміру пухлини карциноми Герена на четвертий день захворювання. Було проведене дослідження впливу магнітними полями низької частоти на новотворення (вибірка №2).
Таблиця 3.1. Результати досліджень
Номер досліду |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
Номер вибірки |
1 |
0,027 |
0,036 |
0,1 |
0,12 |
0,32 |
0,45 |
0,049 |
0,105 |
2 |
0,075 |
0,4 |
0,08 |
0,105 |
0,075 |
0,12 |
0,06 |
0,075 |
В першу чергу, слід класифікувати прикладну задачу у відповідності до табл. 1.1 (п. 1.2.3) та вибрати статистичну гіпотезу для перевірки. Аналізуючи табл. 1.1 (п. 1.2.3) та користуючись вказівками (п. 1.2.5), приходимо до висновку, що в даній задачі слід порівняти показники контрольної та експериментальної вибірок (тип 1). Вихідні дані можна розглядати як сукупність контрольної (№1) та експериментальної (№2) вибірок.
Отже, слід перевірити статистичну гіпотезу про рівність середніх значень даних вибірок. Формулюємо відповідні статистичні гіпотези:
· Нульова: середні значення досліджуваних вибірок рівні (тобто, магнітні поля низької частоти не впливають на розмір пухлини карциноми Герена).
· Альтернативна: Середні значення досліджуваних вибірок статистично відрізняються (тобто, магнітні поля низької частоти впливають на розмір пухлини карциноми Герена)
Згідно вказівок (п. 1.2.3, табл. 1.1) для вибору методу перевірки вказаних статистичних гіпотез слід:
· Встановити закон розподілу по вибірках (згідно рекомендацій у п. 1.2.6).
· Перевірити гіпотезу про рівність дисперсій, щоб знати який саме із t-критеріїв Стьюдента необхідно вибрати для перевірки гіпотези про рівність середніх значень.
Виконаємо наступні дії.
1. Вихідні дані розмістимо в комірках, що знаходяться на перетинанні стовпців С и D з рядками 3-10.
2. Визначимо, чи можна вважати закон розподілу першої і другої вибірок нормальним (наприклад, за методом “трьох сігм”). Якщо ні (хоча б для однієї вибірки), то необхідно використовувати непараметричний критерій (див. 1.1.3.), якщо так — продовжуємо.
3. Розрахуємо дисперсії для першого і другого стовпця. Для цього в комірки С11 і D11 помістимо функції =ДИСП(СЗ:C10) і =ДИСП(DЗ:D10) відповідно. Результатом роботи цих функцій є розраховане значення дисперсії для кожного стовпця відповідно.
4. Знаходимо розрахункове значення для критерію Фішера. Для цього потрібно велику дисперсію розділити на меншу. В комірку F13 поміщаємо формулу =C11/D11, що і виконує цю операцію.
5. Визначаємо, чи можна прийняти гіпотезу про рівність дисперсій. Для цього, задавшись рівнем значимості, наприклад 0,05, слід обчислити критичне значення розподілу Фішера для цього значення і відповідного числа ступенів волі. В комірку F14 уводимо функцію =FРАСПОБР(0,05;7;7) (де 0,05 – заданий рівень значимості; 7 — число ступенів волі чисельника, а 7 (друге) — число ступенів волі знаменника). Число ступенів волі дорівнює числу експериментів мінус одиниця. Результат — 3,787051. Оскільки це значення більше розрахункового 1,81144, ми повинні прийняти нульову гіпотезу про рівність дисперсій.
6. Оскільки ми з’ясували, що дисперсії вибірок рівні, то для перевірки гіпотези про рівність середніх значень слід використати t-критерій Стьюдента при рівних дисперсій. Для подальшої роботи, крім дисперсій необхідно ще обчислити і середні значення. Для цього в комірки С12 (D12) поміщаємо функцію =СРЗНАЧ(СЗ:С10) у С12 і =CP3HA4(D3: D10) у D12. Потім розраховуємо число ступенів волі в комірці H7 (=ЧСТРОК(СЗ:С10)+ ЧCTPOK(D3:D10)-2), після чого обчислюємо критеріальне значення по формулі в Н4 = (C12-D12)/КОРЕНЬ(((1/8) + (1/8))*(C11*7+D11*7)/H7). Тут 8 – розміри вибірок (у даному прикладі однакова), Н7 — адреса комірки, у якій знаходиться значення числа ступенів волі. Отримано значення 0,404. Залишається розрахувати критичне значення розподілу Стыодента за допомогою формули в комірці Н9 =СТЬЮДРАСПОБР(0,025;Н7). Тут 0,025 — α/2 при 5% рівні значимості, Н7 — адреса комірки, у якій знаходиться розраховане значення числа ступенів волі. Оскільки критичне значення більше отриманого числа – гіпотеза про рівність середніх приймається. Тобто магнітні поля низької частоти не впливають на розмір пухлини карциноми Герена. Результати показані на мал. 3.1.
Малюнок 3.1. Приклад перевірки гіпотези про рівність середніх при рівних дисперсіях
У вказаній методиці кроки 3 – 6 можна замінити використанням двох функцій – підпрограм з пакету аналізу даних. Для перевірки гіпотези про рівність дисперсій виберіть у меню послідовно пункти Сервіс à Аналіз даних. З’явиться вікно наступного виду (мал. 3.2).
В даному вікні вибираєте «Двухвыборочный F-mecm для дисперсий». У результаті з’явиться вікно діалогу (мал. 3.3). Тут задаються інтервали (адреси комірок) першої і другої змінних, рівень значимості (α) і місце, де буде знаходиться результат.
Слід зазначити, що функція перевіряє однобічний критерій і робить це правильно. Для випадку, коли критеріальне значення більше 1, обчислюється верхнє критичне значення. Коли критеріальне значення менше 1, то обчислюється нижнє критичне. Нагадуємо, що гіпотеза про рівність дисперсій відкидається, якщо критеріальне значення більше верхнього критичних чи менше нижнього.
Малюнок 3.2. Діалогове вікно “Анализ данных”
Малюнок 3.3. Вікно завдання параметрів підпрограми.
Для перевірки гіпотези про рівність середніх значень при рівних дисперсіях слід вибрати у меню послідовно пункти Сервіс à Аналіз даних. У вікні (мал. 3.2) вибираєте пункт Двухвыборочный t-тecт с одинаковыми дисперсиями. Відкриється нове вікно (мал. 3.4), у якому необхідно задати вихідні дані для тесту:
· Интервал переменной 1, Интервал переменной 2 — необхідно відзначити вибірки, що будуть аналізуватися (адреси лівої і правої клітинок для кожної вибірки).
· Гипотетическая средняя разность — можна перевірити гіпотезу про те, що різниця середніх значень рівна певній величині.
· Альфа — необхідний рівень значимості. У медико-біологічних дослідженнях приймається рівним 0,05.
· Вихідний інтервал — вводиться посилання на клітинку, розташовану у лівому верхньому куті вихідного діапазону (позначка, куди ви хочете помістити результат). Розміри вихідної області будуть розраховані автоматично.
· Новий робочий лист — вибирається в тому випадку, коли необхідно помістити результати роботи на інший лист; при цьому у відповідному віконці вказується діапазон розміщення результатів аналогічно попередньому пункту.
· Нова робоча книга — вибирається, якщо необхідно помістити результати в нову книгу; результати дисперсійного аналізу при цьому будуть розміщатися на першому листі нової книги, починаючи з клітинки А1.
Малюнок 3.4. Діалогове вікно “Двухвыборочный t-тест с одинаковыми дисперсиями”
У цьому вікні задаємо вихідні дані для обробки і натискаємо ОК. Результати роботи приведені на мал. 3.5.
Малюнок 3.5. Вихідні дані і результат роботи тесту по перевірці рівності середніх при однакових дисперсіях
Статистичні залежності в оцінці економічної ефективності діяльності фармацевтичної фірми
1.Статистичні методи встановлення залежності між змінними
1.1. Зв’язки між факторами. Загальні поняття
У статистичному аналізі звичайно розрізняють наступні види зв’язків між факторами:
· функціональні;
· стохастичні;
· статистичні.
Функціональний зв’язок — зв’язок між змінними, при якій кожному значенню однієї величини відповідає строго визначене значення іншої, тобто Y = F(X1 Х2, …, Хn). Дослідженням таких зв’язків статистика не займається.
Стохастичийн зв’язок відповідає ситуации, коли зміна значення однієї змінної веде до зміни закону розподілу іншої. Для дискретного випадку це означає, що кожному значенню однієї змінної відповідає набір значень іншої, причому кожне значення має свою імовірність реалізації. У практичних дослідженнях найбільш відомим видом таких зв’язків є марковські ланцюги.
Статистичний зв’язок означає, що значення одній змінної змінюється в середньому в залежності від того, які значення приймає інша. Дуже часто розглядається як функціональна залежність з випадковою помилкою, тобто:
Y = F(X1, X2, …, Xn) + ε, (1.1)
де F(X1, X2,…, Хn) — функція, що описує залежність Y від сукупності незалежних змінних Х1, Х2, …, Хn а ε — деяка випадкова помилка. Відомо, що сума константи і випадкової величини є випадковою величиною. У зв’язку з цим значення Y, розраховані по зазначеній формулі, будуть унаслідок додавання випадкової величини ε також випадковими величинами.
1.2. Вибір методу перевірки залежності між змінними
Існує цілий набор методів, що призначені для перевірки гіпотез про наявність зв’язків між змінними. Вибір методу залежить від шкал виміру, у яких виміряються аналізовані змінні, і від їхньої кількості (табл. 1.1).
З таблиці видно, що кореляційний аналіз (параметричний чи непараметричний) застосовується в тих випадках, коли перемінні виміряються в шкалах відношень, інтервалів чи порядку.
Дисперсійний аналіз використовують, якщо залежна змінна виміряється в шкалі відношень, інтервалів чи порядку, а впливаючі перемінні мають нечислову природу (шкала найменувань).
Аналіз таблиць спряженості використовується, коли впливаючі перемінні мають нечислову природу (шкала найменувань), а залежна змінна показує кількість спостережень (% чи частку від загальної кількості), для яких ознака присутня чи відсутня.
Таблиця 1.1. Вибір методу аналізу зв’язку між ознаками.
Загальга кількість змінних |
Шкали вимірювань |
Закон розподілу |
Метод |
|
Впливаючих змінних |
залежних змінних |
|||
Дві |
Інтервалів або відношень |
Нормальний |
Параметрична кореляція Пірсона |
|
Ненормальний |
Непараметрична кореляція Спірмена |
|||
Хоча б одна шкала порядку |
– |
Непараметрична кореляція Спірмена або Кендалла |
||
Три і більше |
Порядку |
– |
Конкордація |
|
Дві і більше |
Найменувань |
Інтервалів або відношень |
Нормальний для залежної змінної |
Параметричний дисперсійний аналіз (критерій Фішера) |
Порядку для залежної змінної |
Непараметричний дисперсійний аналіз Зігеля і Тьюкі |
|||
Ненормальний для залежної змінної |
Непараметричний дисперсійний аналіз Зігеля і Тьюкі |
|||
Три і більше |
Порядку |
– |
Багатомірний непараметричний дисперсійний аналіз Фрідмана |
|
Інтервалів або відношень |
Ненормальний для залежної змінної |
Багатомірний непараметричний дисперсійний аналіз Фрідмана |
||
Нормальний для залежної змінної |
Багатомірний параметричний дисперсійний аналіз |
|||
Дві |
Обидві шкали найменувань, одна виду “так/ні”, інша має тільки два значення |
– |
Чотирикліткові таблиці спряження |
|
Обидві шкали найменувань, одна виду “так/ні”, інша має К значеннь |
– |
Таблиці спряження виду 2*К |
||
Обидві шкали найменувань, одна має К значень рівнів, інша – L значеннь |
– |
Таблиці спряження виду K*L |
1.3. Поняття про шкали вимірювань
Обробити статистичними методами можна лише те, що піддається виміру. У зв’язку з цим необхідно розглянути існуючі шкали вимірів. Вимір – присвоєння чисел чи предметам подіям, заснований на деякій системі правил. Необхідно, щоб для величин, що являють собою результати виміру досліджуваної властивості, виконувалися наступні умови:
Тотожність
1. Або А = B або А ≠ В
2. Якщо А = В, то В = А
Транзитивність
1. Якщо А = В і В = С, то А = С
Ранговий порядок
1. Якщо А > В то В < А
2. Якщо А > В і В > С, то А > С
Аддитивність
1. Якщо А = В і С > 0, то А + С > В
2. А + В = В + А
3. Якщо А = В і С = D, то А + С = В+D
4. (А + В) + С = А + (В + С)
У залежності від можливості виконання лихий умов, а також операцій над обмірюваними значеннями («дорівнює», «не дорівнює», «більше», «менше», «додавання» і «віднімання», «множення» і «ділення») існують наступні шкали вимірів:
· шкала класифікації (найменувань);
· шкала порядку;
· шкала інтервалів;
· шкала відношень.
Розглянемо особливості цих шкал.
Шкала класифікації (найменування, номінальна). Ніякі операції порівняння, крім «рівні» і «не рівні», неможливі. Нумерація чи найменування служить лише для ідентифікації об’єкта – номер будинку, номер на майці спортсмена, номер методики лікування і т.п.
Шкала порядку. Можливе порівняння об’єктів по величині — «більше» чи «менше». Інші операції неможливі. Прикладом може служити шкала твердості мінералів, що містить еталонні мінерали, вибудовані в ряд, у якому кожен наступний мінерал твердіше попереднього. У медицині прикладом порівняння об’єктів можуть служити: ступінь тяжкості захворювання, «гарний», «задовільний» і «поганий» стан, стадія розвитку захворювання й ін. Можливі тільки операції порівняння типу «більше», «менше», «дорівнює». Значення, виставлені різними фахівцями, можуть не збігатися (зрушення шкали).
Шкала інтервалів. У цій шкалі можливо не тільки порівняння по величині, але і визначення «наскільки більше» (тобто можливі операції «додавання» і «віднімання»). Прикладом можуть служити шкали виміру температури (Цельсія, Кельвіна, Фаренгейта, Реомюра).
Шкала відношень. У цій шкалі можливе з’ясування питання «у скільки разів» (тобто припустимі всі операції: «порівняння», «додавання» і «віднімання», «множення» і «ділення»). Приклад — вага, довжина й ін. У цих випадках існує природна точка відліку.
У процесі розвитку науки і засобів виміру можливий перехід від однієї шкали вимірів до іншої, більш досконалої. Адже перші термометри, наприклад, вимірювали температуру в шкалі порядку («помірно», «тепло», «гаряче» і т.п.).
Іноді говорять також про дискретні і неперервні шкали вимірів. У загальному випадку до дискретних відносяться шкала класифікації і шкала порядку. У цих шкалах не існує проміжних значень, їхній часто називають некількісними.
Таблиця 1.2 Можливі операції в різних шкалах вимірів
Назва шкали |
Вид шкали |
Можливі операції |
Класифікації |
Дискретна |
= * |
Порядку |
Дискретна |
= *>< |
Інтервальна |
Неперервна |
=*><+- |
Відносин |
Неперервна |
=*><+-/х |
Таблиця 1.3 Статистичні характеристики, які можна обчислити
Назва шкали |
Статистичні характеристики, які можна обчислювати |
Класифікації |
Частоти, модальний клас |
Порядку1 |
Частоти, мода, медіана, центилі, рангова кореляція |
Інтервальна |
Частоти, мода, медіана, центилі, рангова кореляція, середнє, дисперсія |
Відношень |
Усі наявні |
Примітки. 1У деяких роботах для таких шкал визначають медіанне квадратичне відхилення, що обчислюється аналогічно дисперсії, але замість середнього використовується медіана.
Таблиця 1.4. Зв’язок шкал виміру і застосовуваних методів
Шкала виміру впливаючих змінних |
Шкала виміру залежних змінних |
Застосовувані методи |
Інтервалів чи відношень |
Інтервалів чи відношень |
Регресійний і кореляційний аналіз |
Час |
Інтервалів чи відношень |
Аналіз часових рядів |
Найменувань чи порядку |
Інтервалів чи відношень |
Дисперсійний аналіз2 |
Змішаний |
Інтервалів чи відношень |
Коваріаційний і регресійний аналіз |
Найменування чи порядку |
Найменування чи порядку |
Аналіз рангових кореляцій і таблиць спряженості3 |
Найменування чи порядку |
Інтервалів чи відношень |
Дискримінантний аналіз, кластерний аналіз, таксономія |
Примітки. 2Якщо число факторів більше двох, зручніше користатися регресійним аналізом. 3Для багатоклітинних таблиць спряженості може бути використаний регресійний аналіз.
Шкала виміру, природно, накладає обмеження на статистичні характеристики, що можуть бути обчислені для випадкової змінної, обмірюваної в конкретній шкалі, і па методи обробки, що коректно можна застосовувати до них (табл. 1.2, 1.3). У загальному випадку для обробки даних, обмірюваних у дискретних шкалах, застосовуються непараметричні методи.
У залежності від виду шкал виміру змінних для дослідження зв’язків між ними використовують різні статистичні методи (табл. 1.4).
2. Характеристика методів і критеріїв встановлення залежності між змінними
2.1. Кореляційний аналіз
Кореляційний зв’язок представляє собою частковий випадок статистичного зв’язку М(Y X = x) = ÿ(x), тобто математичне очікування змінної Y, при умові, що випадкова величина Х приймає значення х.
2.1.1. Параметрична кореляція (коефіцієнт кореляції Пірсона)
Передумови
· Усі спостереження взаємно незалежні.
· Спостереження мають нормальний закон розподілу.
Опис методу
Значення коефіцієнта кореляції обчислюється по формулі:
(2.1)
Коефіцієнт кореляції показує тісноту лінійного зв’язку між двома вибірками випадкових величин. Його значення змінюється від –1 (мал. 1.1, rxy = -0,8), що відповідає зворотному зв’язку, до +1 (мал. 1.2, rxy = 0,8), що відповідає прямо пропорційного зв’язку (значення 0, означає відсутність зв’язку – мал. 1.3).
|
|
Малюнок 1.1. Приклад зворотньої кореляційної залежності |
Малюнок 1.2. Приклад прямої кореляційної залежності |
|
|
Малюнок 1.3. Приклад діаграми розсіювання при відсутності зв’язку між змінними |
Малюнок 1.4. Приклад нелінійного зв’язку між змінними |
Оскільки ми маємо справу з випадковими величинами, однієї величини коефіцієнта парної кореляції для висновку недостатньо. Необхідно перевірити, чи значиме він відрізняється від нуля. Це можна зробити за допомогою критерію Стъюдента. Фактично перевіряється гіпотеза про рівність коефіцієнта кореляції кулю. Для цього розраховується критериальное значення по формулі:
(2.2)
де r — значення коефіцієнта кореляції, a N — кількість спостережень.
Якщо розрахункове значення t (tpac) більше табличного, узятого з N – 2 ступенями волі, нульова гіпотеза відкидається. Це означає, що коефіцієнт кореляції значимий відрізняється від нуля (з обраним рівнем значимості). Напівширина довірчого інтервалу для коефіцієнта кореляції визначається по формулі:
(2.3)
де N — число спостережень, по яких розраховується коефіцієнт кореляції; r — значення коефіцієнта кореляції; tn-2p — табличне значення критерію Стьюдента, узятого з N – 2 ступеня волі.
Зауваження. Слід пам’ятати, що коефіцієнт кореляції показує міру тільки лінійоного зв’язку. Тому у випадках, коли залежність між змінними носить більш складний характер, коефіцієнт кореляції буде показувати відсутність зв’язку. Приклад – на мал. 1.4. між змінними існує залежність другого порядку (описується квадратним рівнянням), тоді як коефіцієнт кореляції буде близьким до нуля. Тому, для виявлення складних залежностей між змінними використовують інші статистичні методи, зокрема регресійний аналіз.
2.1.2. Часткова кореляція
Для того щоб вплив кореляційного зв’язку між двома змінними «очистити» від можливого впливу третьої, уведене поняття часткової кореляції. По ній коефіцієнт кореляції між двома змінними X і Z визначається по формулі:
(2.4)
де r12, r13 і r23 — коефіцієнти парної кореляції між змінними X і Y, X і Z, Y і X відповідно. При використанні часткового коефіцієнта кореляції необхідно пам’ятати:
· взаємовпливаючих змінних може бути не три, а скільки завгодно;
· ви можете не знати про усіх взаємовпливаючих змінних;
2.1.3. Рангова кореляція
Рангова кореляція є аналогом парної кореляції для тих випадків, коли величини, наявність зв’язку між який потрібно перевірити, представлені не в шкалі відносин, а в який-небудь іншій. Найбільше часто така ситуація виникає, якщо ми маємо справу із суб’єктивними оцінками об’єктивних явищ, які не можна вимірити, тобто з експертними оцінками. Крім того, рангова кореляція використовується також у випадках, коли закон розподілу досліджуваних змінних не є гаусовським (нормальним).
Коефіцієнти кореляції називаються ранговими, тому що перед обчисленням значення змінних перетворюють у ранги. Для цього наявні значення змінних розташовують у ранжированому (впорядкованому по величині) ряду (значення у вихідному стані можуть бути таким ранжированим рядом). Потім кожному значенню присвоюється ранг від 1 до N, де N — кількість аналізованих об’єктів. У тому випадку, якщо кілька елементів мають той самий ранг, те кожному з них присвоєються середнє від займаних ними місць.
Допущення
· Усі спостереження взаємно незалежні.
· Усі значення спостережень витягнуті з однієї і тієї ж двовимірної генеральної сукупності, тобто X і Y однаково розподілені.
Існує кілька різних способів обчислення коефіцієнтів рангової кореляції. Найбільше часто використовують коефіцієнт кореляції Спірмена (r, іноді позначається rs) і коефіцієнт Кендалла (τ).
2.1.3.1. Коефіцієнт кореляції Спірмена
Коефіцієнт кореляції Спірмена обчислюється по формулі:
(2.5)
де R1i і R2i — ранги i-го об’єкта для кожної з порівнюваних змінних. Значення r не залежить від способу упорядкування рангів.
Очевидно, що цей коефіцієнт є повним аналогом коефіцієнта парної кореляції — після перетворення його можна представити у виді:
(2.6)
При наявності співпадаючих значень (зв’язок) знаменник зменшується па величину:
(2.7)
де L1 і L2 — кількість зв’язок у T1i і T2J — розміри зв’язок (кількість елементів у них).
2.1.3.2. Коефіцієнт кореляції Кендалла
Коефіцієнт кореляції Кендалла обчислюється по формулі:
(2.8)
де п — кількість спостережень, a Q — число неузгоджених пар (ХjУj) і (Xi,Yi) для всіх комбінацій i і j. Пари називаються неузгодженими, якщо для них виконується наступне умова:
sign(Xj – Yj)sign(Xi – Yi) = -1, (2.9)
де sign – означає «знак». Це функція приймає значення +1 для позитивного числа і -1 для негативного. Іншими словами, приведена умова означає, що збільшення X приводить до зменшення Y, і навпаки. Для перевірки значимості коефіцієнта існують спеціальні таблиці.
2.1.3.3. Конкордація.
У тому випадку, коли необхідне порівняння не двох змінних, а більшої кількості (наприклад, при з’ясуванні погодженості думок групи експертів), використовується коефіцієнт конкордації, запропонований Кендаллом:
(2.10)
де п — кількість аналізованих об’єктів, т — кількість експертів, Rij — ранг j-го об’єкта, що привласнений йому i-м експертом.
Варто звернути увагу на відмінність у значеннях коефіцієнта конкордації від коефіцієнта кореляції. Якщо думки експертів цілком протилежні, коефіцієнт конкордації дорівнює нулю (W = 0), але коефіцієнт кореляції в цьому випадку буде дорівнює -1.
При наявності зв’язок (однакових значень) формула здобуває наступний вид:
(2.11)
де при цьому Li – число зв’язок, ni – кількість елементів у i-й зв’язці для j-го експерта.
Значимість коефіцієнта конкордації при малій кількості експертів перевірити складно. Для малих значень існують неповні таблиці, наприклад табл. 6.10 у [1].
2.2. Дисперсійний аналіз
У задачах, що вирішуються за допомогою дисперсійного аналізу, є присутнім відгук числової природи, на який впливає кілька змінних, що мають номінальну природу. Наприклад, кілька видів раціонів відгодівлі чи худоби два способи їхнього утримування і т.д. Вважається, що ми можемо розглядати модель
(2.12)
тобто розсіювання дорівнює зміні, що залежить від одного фактора αi плюс розсіювання залежне від другого фактора βi плюс випадкова помилка εi. Тоді загальне розсіювання складається з декількох компонентів: . Виділивши відповідні компоненти, за допомогою критерію Фішера можна визначить їхню значимість.
2.2.1. Параметричний дисперсійний аналіз
Однофакторна задача. Для найпростішого випадку таблиця вихідних даних має вид, представлений у табл. 2.2
Таблиця 2.2. Загальний вид вихідних даних для однофакторного дисперсійного аналізу.
Номер елементів сукупностей |
1 |
2 |
… |
j |
… |
n |
Номер сукупностей |
||||||
1 |
Х11 |
X12 |
|
X1j |
|
X1n |
2 |
X21 |
Х22 |
|
X2j |
|
X2n |
|
|
|
|
|
|
|
I |
Хi1 |
Xi2 |
|
Xij |
|
Xin |
|
|
|
|
|
|
|
m |
Xm1 |
Xm2 |
|
Xmj |
|
Xmn |
Це може бути, наприклад, т партій сировини, і з кожної узято п зразків. Необхідно з’ясувати, чи змінюються показники сировини від партії до партії. Ми можемо так само розглядати якісь характеристики лабораторних тварин (m груп по п тварин у кожній), щоб з’ясувати, чи відрізняються їхні характеристики від групи до групи. Зміст у тім, щоб порівняти дисперсію, обумовлену випадковими причинами, з дисперсією, викликуваної наявністю деякого фактора. Якщо вони значимо розрізняються, то фактор робить статистично значимий вплив на досліджувану перемінну.
Відмінність вважається значимою, якщо розрахункове значення критерію Фішера (відношення міжгрупової дисперсії до внутрігрупової) буде більше табличного, узятого з заданим рівнем значимості і ступенями волі (т – 1) і т(п – 1).
Міжгрупова дисперсія розраховується по формулі:
(2.13)
внутрігрупова:
(2.14)
Тут – загальне середнє, а
Для однофакторного випадку результати розрахунків прийняті представляти в наступному виді (табл. 2.3).
Таблиця 2.3. Представлення результатів розрахунку однофакторного дисперсійного аналізу
Компоненти дисперсії |
Сума квадратів |
Число ступенів волі |
Середній квадрат (дисперсія) |
Міжгрупова (впливаючий фактор) |
|
m – 1 |
/(m-1) |
Внутрігрупова (випадковий вплив) |
|
m(n – 1) |
|
Загальна |
|
m*n – 1 |
|
Тут внутрігрупова дисперсія характеризує вплив випадкової складовий, а міжгрупова — вплив досліджуваного фактора.
Однофакторна задача з нерівномірним числом іспитів. Досить часто виникає ситуація, при якій число досвідів для різних значень рівня фактора по-різному. Це може бути зв’язано, наприклад, з тим, що частина лабораторних тварин під час експерименту чи загинула не виявила необхідної реакції й ін.
Тоді загальна дисперсія визначається по формулі:
(2.15)
де Хij — значення відповідного спостереження, пj — кількість спостережень для j-го рівня фактора; – загальна кількість спостережень.
Міжгрупова (викликана впливом фактора) сума квадратів визначається по формулі:
(2.16)
Залишкова сума знаходиться як різниця між загальною і факторною SSocm = SSобщ – SSфактор
Потім знаходяться залишкова (внутрігрупова) S2ocm = SSocm /(n – m) і факторна (міжгрупова) дисперсії S2фактор = SSфактор /(n – m), а також розрахункове значення критерію Фішера F = S2фактop/S2ocm.
Двофакторна задача з рівномірним числом спостережень в клітинці. У такій задачі є два фактори, вимірюваних у шкалі найменувань, що впливають па відгук. Загальний вид представлення даних для такої задачі міститься в табл. 2.4.
Тут X111t X1i2, … Xmnh — значення досліджуваної неремінної, що спостерігалися;
— середнє значення в клітинці;
— середнє значення по рядку;
– середнє по стовпці;
– загальне середнє.
Результати розрахунків звичайно представляються в таблиці наступного виду (табл. 2.5). Тут S2A — характеризує вплив фактора А; S2B — вплив фактора В; S2AB — спільний вплив обох факторів; S2ocm — вплив випадкових факторів, що неможливо віднести ні до A, ні до В. Необхідно перевірити значимість розходження дисперсій S2A і S2ocm, S2B і S2ocm, S2AB і S2ocm. Для цього знаходять розрахункові значення F- критерію Фішера FA = S2A/S2ocm, FB = S2B/S2ocm, FAB = S2AB/S2ocm. Якщо виконуються умови (кожнa окремо!) FA > Fa_n-1,nm(k-1), FB > Fa,m-1,nm(k-1), FAB > Fa,(n-1)(m-1),nm(k-1), то вплив факторів А, В (чи їхньої взаємодії відповідно) є значимим.
Таблиця 2.4. Загальний вид представлення даних для двухфакторного дисперсійного аналізу
Фактор А |
Фактор В |
||||
В1 |
В2 |
… |
Bn |
|
|
А1 |
|
|
… |
|
|
А2 |
|
|
… |
|
|
: |
… |
… |
|
… |
|
Am |
|
|
… |
|
|
|
|
|
… |
|
|
Таблица 2.5. Форма представлення результатів двофакторного дисперсійного аналізу
Компонента дисперсії |
Суми квадратів |
Число степенів свободи |
Дисперсії |
Меж средніми по рядках (по фактору А) S2A |
|
n – 1 |
|
Меж средніми по стовбиках (по фактору В) S2B |
|
m – 1 |
|
Взаємодія S2AB |
|
(m-1)(n-1) |
|
Залишкова S2ост |
|
n*m(k – 1) |
|
Повна S2 |
|
n*m*k – 1 |
|
2.2.2. Непараметричний дисперсійний аналіз Фридмана
Призначення. У тому випадку, коли закон розподілу не є нормальним, використовується непараметричний дисперсійний аналіз Фрідмана.
Нульова гіпотеза. Середні значення усіх вибірок рівні.
Передумови
· Усі випадкові величини взаємно незалежні.
· Дані кожної вибірки розподілені по одному законі розподілу. Закон розподілу кожної вибірки може відрізнятися від закону розподілу інших.
Опис методу
Вихідні дані представляються в наступному виді (табл. 2). Для цього в кожнім стовпці значення X заміняють їхніми рангами (іншими словами, замість значень змінних ставиться їх помер у ряді, упорядкованому по зростанню). Потім розраховується значення критерію:
(2.17)
де Rij– відповідні значенні рангів.
Якщо розрахункове значення χ2 буде більше критичного, узятого з заданим рівнем значимості і (п – 1) ступенем волі, гіпотеза про розходження між партіями приймається.
При розрахунках можна перевірити правильність розміщення рангів і розрахунків, знаючи, що має місце співвідношення:
(2.18)
Примітка. При малих значеннях т та п критерій χ2 дає занадто грубе наближення, і при цьому можливо ухвалення неправильного рішення. Тому критерій χ2 застосовується в тому випадку, коли виконуються наступні умови: т = 3 і п > 9 чи т = 4 і п > 4 чи т > 4, п> 9 (див. [4]). Якщо ці умови не виконуються, то перевірка здійснюється за критерієм Фрідмана.
2.3. Аналіз таблиць спряженості
В медико-біологічних дослідженнях велику роль грає аналіз таблиць спряженості. Наступні методи призначені для аналізу даних, які описують об’єкти з деякою кількістю властивостей, причому часто про властивість можна лише сказати є воно чи ні (табл. 2.6).
Таблиця 2.6. Показники смертності від раку легень і ішемічної хвороби серця (на 100 000 чоловік у рік)
Захворювання |
Палять |
Не палять |
Рак легень |
48,33 |
4,49 |
Ішемічна хвороба серця |
394,67 |
109,54 |
Нульова гіпотеза полягає в тому, що показник смертності від зазначених захворювань не залежить від того, курить чи людина ні. Якщо нульова гіпотеза буде відкинута, то це означає, що між палінням і смертністю від зазначених захворювань існує статистично значимий зв’язок.
2.3.1. Чотириклітинкові таблиці
У загальному виді чотириклітинкова таблиця (їх ще називають таблиці 2×2) має наступний вид (табл. 2.7).
Таблиця 2.7. Загальний вид четырехклеточной таблиці спряженості.
Вибірка |
Наявність ознаки |
Відсутність ознаки |
Разом |
Перша вибірка |
А |
В |
n1 = А + В |
Друга вибірка |
С |
D |
n2 = С + D |
Разом |
А + С |
B + D |
n = n1 + n2 |
Нульова гіпотеза про приналежність обох вибірок до однієї генеральної сукупності виконується з використанням критерію χ2, що розраховується по формулі:
(2.19)
Для малих вибірок замість п беруть (п – 1).
Розрахункове значення порівнюється з критичним, узятим з одним ступенем волі і заданим рівнем значимості. Якщо розрахункове значення більше критичного, то гіпотезу про однорідність варто відкинути і прийняти гіпотезу про наявність між досліджуваними ознаками істотного зв’язку.
Примітка. Правильність отриманих висновків залежить від того, як були обрані дані: вибірка повинна бути однорідна стосовно аналізованої ознаки.
Наприклад, якщо в аналізовану вибірку входять одночасно особи, на яких препарат робить позитивне (поліпшуючий стан здоров’я) вплив, і особи, на яких він впливає, то в результаті аналізу може бути прийнята гіпотеза про те, що препарат не робить ніякого впливу. А це не відповідає реальному положенню речей.
Варто пам’ятати, що обсяг вибірок не повинний бути занадто маленьким. Так, для рівня значимості 0,05 необхідно мінімальне значення п1 = п2 = 124 (п = 248).
2.3.2. Таблиці виду 2*К
Таблиця спряженості типу 2*К має загальний вид, як табл. 2.8.
Таблиця 2.8. Загальний вид таблиці спряженості виду 2*К
№ вибірки або № рівня 2-гої ознаки |
Ознака 1 |
Σ |
|
Присутня |
Відсутня |
||
1 |
m1 |
n1 – m1 |
n1 |
2 |
m2 |
n2 – m2 |
n2 |
… |
… |
… |
… |
i |
mi |
ni – mi |
ni |
… |
… |
… |
… |
k |
mk |
nk – mk |
nk |
Σ |
m |
n – m |
N |
Для перевірки нульової гіпотези про однорідність k вибірок використовується формула, запропонована Брандтом і Снедекором:
(2.20)
Розрахункове значення порівнюється з критичним, узятим з (k – 1) ступенем волі і заданим рівнем значимості. Якщо розрахункове значення більше критичного, то гіпотезу про однорідність варто відкинути і прийняти гіпотезу про наявність між досліджуваними ознаками істотного зв’язку.
2.3.3. Таблиці виду K*L
Таблиці виду K*L (табл. 2.9) є найбільш загальним видом таблиць спряженості. У цьому випадку значеннями ознаки 1 можуть бути, наприклад, різні види лікування: симптоматичне, специфічне з нормальними дозами, специфічне з підвищеними чи дозами специфічне з додаванням інших препаратів і ін. Значеннями ознаки 2 можуть бути, наприклад, видужання за 2 тижні, видужання за 4 тижні, летальний результат.
Ознака 2 може бути також сукупністю різних вибірок. У цьому випадку застосовується один критерій для перевірки гіпотез про незалежність ознак і про однорідність вибірок. Для випадку, коли перший стовпець табл. 2.9 являє собою K значення рівня другої ознаки, перевіряється гіпотеза про незалежність першої і другої ознак. Якщо ж перший стовпець містить k різних вибірок, то перевіряється гіпотеза про однорідність цих вибірок (тобто чи можна вважати, що ці вибірки витягнуті з однієї генеральної сукупності).
Таблиця 2.9. Загальний вид таблиці спряженості виду K*L
Ознака 2 (k значень рівнів) |
Ознака 1 (m значень рівнів) |
Суми по рядках |
|||||
1 |
2 |
… |
j |
… |
m |
||
1 |
n11 |
n12 |
… |
n1j |
… |
n1m |
n1 |
2 |
n21 |
n22 |
… |
n2j |
… |
n2m |
n2 |
… |
… |
… |
… |
… |
… |
… |
… |
i |
ni1 |
ni2 |
… |
nij |
… |
nim |
ni |
… |
… |
… |
… |
… |
… |
… |
… |
k |
nk1 |
nk2 |
… |
nkj |
… |
nkm |
nk |
Суми по стовбцях |
n.k1 |
n.2 |
… |
n.j |
… |
n.m |
n.. = n |
Значення критерію розраховується по формулі:
(2.21)
Розрахункове значення порівнюється з критичним, узятим з (k – 1)(т – 1) ступенями волі і заданим рівнем значимості. Якщо розрахункове значення більше критичного, то гіпотезу про однорідність варто відкинути і прийняти гіпотезу про наявність між досліджуваними ознаками істотного зв’язку.
3. Приклади вирішення задач
3.1.Методи вирішення задач виявлення зв’язку між змінними за допомогою Еxcel
Як уже було відмічено в темах 3 та 4, табличний процесор Excel володіє потужними інструментами для проведення статистичних обчислень:
· Розвинені можливості щодо написання складних математичних виразів.
· Підбірка функцій для розрахунку багатьох статистичних критеріїв та параметрів.
· Пакет Анализ данных, що містить набір функцій-підпрограм для комплексного проведення аналізу вибірок даних.
В наступній таблиці подано перелік функцій-підпрограм для вивявлення статистичного зв’язку між змінними:
Назва підпрограми |
Короткий опис |
Однофакторний дисперсійний аналіз |
Дозволяє перевірити гіпотезу про подібність середніх значень двох вибірок, що належать одній генеральній сукупності |
Двофакторний дисперсійний аналіз без повторів |
Дозволяє перевірити гіпотезу про подібність середніх значень кількох вибірок, що належать одній генеральній сукупності |
Двофакторний дисперсійний аналіз з повторами |
Теж, але можлива наявність кількох груп вибірок даних (наприклад кілька спроб) |
Кореляційний аналіз |
Виводить матрицю коефіцієнтів парної кореляції для вказаного діапозону даних |
Коваріаційний аналіз |
Обчислює середній добуток відхилень точок даних від відносних середніх значень |
3.2.Вирішення задачі встановлення наявності зв’язку між змінними
Розглянем наступний приклад. Проводився експеримент по дослідженню впливу погодніх умов на зміну тривалості систолічної зупинки серця при введенні препарату хлориду барію. Результати спостережень наведено у таблиці:
Погодні умови |
Піддослідні тварини |
|||
1 |
2 |
3 |
4 |
|
тиха погода |
13,8 |
11 |
13,7 |
12,1 |
вітер, хуртовина |
16 |
12,2 |
15,8 |
14,3 |
Крок 1. В першу чергу, слід вибрати метод встановленя залежності між змінними величинами, що розглядяються в задачі. На основі рекомендацій (п. 2.1.) встановлено:
· впливаюча змінна – погодні умови – має нечислову природу
· залежна змінна – тривалість систолічної зупинки серця – вимірюється по шкалі відношень.
Отже для визначення зв’язку між змінними слід використати дисперсійний аналіз. Для вибору методу аналізу слід встановити закон розподілу залежної змінної (табл. 1.1).
Крок 2. Перевіримо чи є закон розподілу нормальним. Одним з методів встановлення відповідності варіаційного розподілу нормальному закону є правило трьох сігм:
· Практично всі (99,7%) відхилень від середнього менше 3 сігм (εі <3*σ).
· Дві третини (68,3%) відхилень менші σ.
· Половина (50%) відхилень менші 0,625σ.
Серед інших функцій, в складі пакету Анализ данных є три функції для проведення дисперсійного аналізу – одна для однофакторного та дві для двофактоного. Цією функцією і слід скористатися для вирішення поставленої задачі.
Крок 3. На новому листі робочої книги наберіть вихідні дані задачі, як це показано на мал. 3.3.
Крок 4. У меню виберіть послідовно пункти Сервіс à Аналіз даних. У вікні (мал. 3.1) виберіть пункт Однофакторний дисперсионный анализ. Відкриється нове вікно (мал. 3.2), у якому необхідно задати вихідні дані для тесту:
· Вхідний інтервал — необхідно відзначити таблицю, у якій розміщені вихідні дані (адреси лівої верхньої і правої нижньої клітинок).
· Групування — необхідно вказати, у рядках чи у стовпцях знаходяться дані, що відносяться до одного рівня фактора (у даній ситуації — у рядках).
· Альфа — необхідний рівень значимості. У медико-біологічних дослідженнях приймається рівним 0,05.
· Вихідний інтервал — вводиться посилання на клітинку, розташовану у лівому верхньому куті вихідного діапазону (позначка, куди ви хочете помістити результат). Розміри вихідної області будуть розраховані автоматично.
· Новий робочий лист — вибирається в тому випадку, коли необхідно помістити результати роботи на інший лист; при цьому у відповідному віконці вказується діапазон розміщення результатів аналогічно попередньому пункту.
· Нова робоча книга — вибирається, якщо необхідно помістити результати в нову книгу; результати дисперсійного аналізу при цьому будуть розміщатися на першому листі нової книги, починаючи з клітинки А1.
Задамо значення. У якості вхідного інтервалу задамо діапозон клітинок B3:F3. Так як порівнюються три вибірки, то групування слід робити по рядках. Вихідний інтервал – довільний, наприклад починаючи з клітники B6. Натискаэмо конпку Ок для запуску пыдпрограми на виконання. Вихідні дані і результати для даного випадку приведені на мал. 3.3.
Малюнок 3.1. Діалогове вікно “Анализ данных”
Малюнок 3.2. Діалогове вікно “Однофакторный дисперсионный анализ”
Малюнок 3.2. Робочий лист з результатами розрахунків
Крок 5. Розрахункове значення критерію Фішера менше критичного, тобто міжгрупова та внутрігрупова дисперсіїї статистично рівні. Отже, можна вважати, що немає зв’язку між погодніми умовами та тривалістю систолічної зупинки серця при введенні препарату хлориду барію.
Перелік додаткової літератури
1. Лапач С.Н., Пасечник Н.Ф., Чубенко А.В. “Статистические методы в фармакологии и в маркетинге фармацевтического рынка”. – К.: ЗАО “Укрспецмонтажпроект”, 1999. – 312 с.
2. Лапач С.Н., Чубенко А.В., Бабич П.Н. “Статистические методы в медико – биологических исследованиях с испоьзованием MS EXCEL”. – К.: МОРИОН, 2000. – 320 с.
3. Гавриленко В., Пархоменко Л., “Решение задач аппроксимации средствами MS EXCEL”, «Компьютеры+программы», №12/2002р., с.42.
4. Свердан П.Л. “Вища математика. Аналіз інформації у фармації і медицині”.
5. Чалий О.В., Стучинська Н.В., Меленєвська А.В. “Вища математика. Навчальний посібник для студентів медичних і фармацевтичних навчальних закладів”. – К.: Техніка, 2001. – 204с.