Home » Аналіз динамічних рядів

Аналіз динамічних рядів

5 Червня, 2024

Оцінка nвірогідності результатів дослідження.

Метод nстандартизації.

Кореляційно-регресійний nаналіз.

Вибіркове спостереження

З усіх видів несуцільного nспостереження в практиці статистичних досліджень найбільше визнання і nзастосування дістало вибіркове спостереження.

Вибірковим nспостереженням називають вид несуцільного спостереження, за характеристикою відібраної nчастини одиниць якого судять про всю сукупність.

Розрізняють генеральну nі вибіркову сукупності.

Генеральною сукупністю nназивають загальну масу одиниць, з якої здійснюють відбір для дослідження.

nЧастину nгенеральної сукупності, яку відібрано для обстеження, називають вибірковою.

Обсяг генеральної сукупності позначають nN, вибіркової – n.

Узагальню вальними показниками nгенеральної сукупності є: середній розмір ознаки , частка Р, генеральна nдисперсія ; в разі вибіркової сукупності: середні вибіркова , вибіркова частка nW і дисперсія.

Вибірковий метод відрізняється від інших nвидів несу цільного спостереження двома ознаками – наперед визначають:

1) яку частину одиниць генеральної nсукупності треба обстежувати;

2) послідовність відбору одиниць, який nдостатньою мірою відтворює (репрезентує) розміри середніх і відносних nпоказників генеральної сукупності.

До вибіркового nспостереження статистика вдається у випадках, nколи потрібно у стислі строки та з мінімальними затратами праці і коштів nодержати кількісні характеристики досліджуваної сукупності, або коли не можна nчи недоцільно здійснювати суцільне спостереження.

nІснує ціла низка nпричин, унаслідок яких у багатьох випадках вибірковому спостереженню надається nперевага перед суцільним. Серед них найсуттєвіші це: економія часу і засобів nунаслідок скорочення обсягу робіт статистичного дослідження; зведення до nмінімуму псування чи знищення досліджуваних об’єктів; забезпечення детальнішого nвивчення кожної одиниці спостереження за неможливості охоплення всіх одиниць; nдосягнення високої точності результатів обстеження за рахунок зменшення помилок nреєстрації.

nВибіркове nспостереження застосовують також у поєднанні з nсуцільним для поглиблення дослідження або для вивчення і контролю результатів nсуцільного спостереження.

Етапи вибіркового nспостереження:

1) обґрунтування мети nвибіркового спостереження;

2) складання програми nспостереження і розробка відповідних даних;

3) вирішення nорганізаційних питань щодо спостереження;

4) визначення частки і nспособу відбору одиниць у вибіркову сукупність;

5) здійснення відбору;

6) реєстрація ознак nдосліджуваних одиниць;

7) узагальнення даних nспостереження та визначення їхніх вибіркових характеристик;

8) обчислення похибок nвибірки;

9) поширення кількісних nхарактеристик вибіркового спостереження на всю сукупність.

Завдання, які вирішує nвибіркове спостереження:

1) визначення nсереднього розміру досліджуваної ознаки;

2) визначення питомої nваги (частки) досліджуваної ознаки в певній сукупності;

3) визначення середньої nта граничної похибки вибірки;

4) знаходження меж для nсередньої і частки при повторному і без повторному відборі;

5) визначення потрібної nчисельності вибірки;

6) поширення даних nвибіркового спостереження на всю сукупність.

Науковим обґрунтуванням можливості nзастосування вибіркового спостереження є діалектична єдність одиничного, nособливого і загального, згідно з якою в кожному одиничному є риси особливого і nзагального, а загальне має риси одиничного і особливого. Це дає змогу за nодиничним і особливим судити про загальне, за частиною – про ціле, якщо nправильно знайдено зв’язок між ними.

Особливістю вибіркового nспостереження порівняно з іншими nвидами несуцільного спостереження є те, що відбір nодиниць у вибіркову сукупність забезпечує рівну можливість потрапляння кожної nодиниці у вибірку. Це досягається шляхом неупередженого строгого випадкового nвідбору за схемами, розробленими в математичній статистиці.

Відповідь на запитання про те, з якою nймовірністю можна судити про збіг між генеральними і вибірковими узагальню nвальними показниками, дає теорія вибіркового методу, що ґрунтується на основі nзакону великих чисел. За допомогою цього закону вирішують два взаємопов’язаних nзавдання:

– розраховують при заданій імовірності nмежі можливих відхилень вибіркового показника від відповідного показника в nгенеральній сукупності;

– визначають імовірність перевищення nвстановленої межі можливими відхиленнями вибіркового показника від nгенерального.

Масові явища, які вивчає статистика, nперебувають під впливом багатьох випадкових чинників. Тому, використовуємо nосновний висновок граничних теорем ймовірності про те, що сукупна дія багатьох nвипадкових факторів приводить за деяких умов до результату, майже незалежного nвід випадку. Оскільки вибіркове спостереження пов’язане з випадковими nвідхиленнями характеристик вибіркової і генеральної сукупностей, то основне nположення граничних теорем дає змогу стверджувати, що результати вибіркового nспостереження достовірні в разі достатньо великої кількості відібраних одиниць. nЗа цих умов вибіркові характеристики надійно відтворюють генеральні nхарактеристики.

У разі масового спостереження розподіл nемпіричних частот більшості явищ підпорядковується закону нормального nрозподілу. За будь-якого розподілу частот у генеральній сукупності їхні nвибіркові середні мають розподіл, близький до нормального.

Доведено, що за нормального розподілу nбільшість величин зосереджена навколо генеральної середньої. Близько 68,3% nчисельності вибіркової середньої лежить у межах генеральної середньої; 95,4% nцієї чисельності – в межах і 99,7% – не виходить за межі . Нормальний розподіл nуказує на частоту виникнення похибок даного розміру середньої.

Випадкові похибки реєстрації при nвеликому числі спостережень не впливають суттєво на результат дослідження, nоскільки вони взаємно погашаються, а тому від них можна абстрагуватись і в nподальшому розглядати тільки похибки вибірки. Принцип строгої випадковості, nякий покладено в основу вибірки, забезпечує її об’єктивність, дає змогу nвстановити межі можливих похибок і дістати майже достовірні дані для nхарактеристики всієї сукупності явищ. Таку вибіркову сукупність називають nпредставницькою, або репрезентативною сукупністю. До її складу входять nпредставники всіх груп генеральної сукупності.

Точність результатів вибіркового nспостереження нарешті залежатиме від способу відбору одиниць, ступеня коливання nознаки в сукупності та від кількості відібраних одиниць.

Варіаційні ряди розподілу

Різноманітність статистичних сукупностей n– передумова різних форм співвідношення частот і значень варіаційної ознаки. За nсвоєю формою ряди розподілу поділяються на одно-, дво- і багатовершинні. Наявність nдвох і більше вершин свідчить про неоднорідність сукупності, про поєднання в nній груп з різними рівнями ознаки. Розподіли якісно однорідних сукупностей nпереважно одновершинні. Серед одновершинних розподілів є симетричні та nасиметричні (скошені), гостро- і плосковершинні.

Якщо частоти варіантів nрівновіддалені від центра значень ознаки, такий варіаційний ряд називається nсиметричним, якщо ж вершина розподілу зміщена, тобто частоти по обидва боки від nцентра змінюються неоднаково, тоді варіаційний ряд називається асиметричним, nабо скошеним. Розрізняють правосторонню і лівосторонню асиметрії. Напрям nасиметрії протилежний напряму зміщення вершини розподілу. В разі nправосторонньої асиметрії вершина розподілу зміщена вліво, при лівосторонній – nвправо. Асиметрія – результат обмеженої варіації ознак в одному напрямі або nвплив переважної причини розвитку явища, яка відповідає за зміщення центра його nрозподілу.

Відхилення між середньою арифметичною і nмедіаною або модою виражають міру асиметрії. В симетричному розподілі nнеобхідною умовою є рівність трьох характеристик: середньої арифметичної, моди nі медіани:

У разі nчіткої асиметрії варіаційного ряду для глибшого вивчення економічних явищ nсереднє значення ознаки має доповнюватися модою і медіаною.

Стандартизоване відхилення свідчить про nнезначну лівосторонню асиметрію, а тому розподіл посівних площ гречки за nврожайністю можна вважати симетричним.

Крутість варіаційного nряду, nтобто його високовершинність (гостровершинність) nабо низьковершинність (плосковершинність) nназивають ексцесом. Розподілам більш гостровершинним, nніж нормальним, відповідає позитивний ексцес, а більш плоско вершинним – nвід’ємний. На практиці в одному розподілі часто поєднуються всі особливості: nодновершинний розподіл може бути симетричним і високо вершинним або скошеним та nнизьковершинним.

За узагальнюючі nхарактеристики як міру крутості розподілу використовують моменти. За їх nдопомогою можна описати будь-який розподіл.

Окремі елементи (значення) сукупності nоднорідних за якісним складом предметів, явищ, параметрів є варіантами, а всю їх сукупність можна nпредставити у вигляді варіаційного ряду, nякий є основою для визначення середніх величин. Варіаційний ряд – це ряд nваріант і відповідних їм частот. Варіаційні ряди дають можливість встановити nхарактер розподілу одиниць сукупності за тією чи іншою кількісною ознакою та її nваріацію – різноманітність індивідуальних значень ознак конкретних одиниць nсукупності.

Окремі значення варіант певної ознаки nпозначаються літерою х. Число, яке показує, як часто зустрічається та чи інша nваріанта у складі даного ряду, називається частотою (f). Сума частот (åf) дорівнює загальному числу nспостережень (n).

nВаріаційний ряд nможе бути простим, де кожна варіанта nпредставлена окремо, тому частота кожної з них дорівнює одиниці. Наприклад, nрозподіл хворих за частотою пульсу: 68, 69, 75, 70, 65, 68, 70, 75, 74, 72, 72, n68. Даний ряд є також нерангованим, nтому що варіанти не систематизовані. Систематизувавши варіанти в порядку nзбільшення чи зменшення їх числового значення, даний ряд можна перетворити в рангований: 65, n68, 68, 68, 69, 70, 70, 72, 72, 74, 75, 75.

Якщо варіанти згрупувати за їх nабсолютним значенням, то можна отримати згрупований nваріаційний ряд, де кожна варіанта представлена зі своєю частотою. Для нашого nприкладу:

Наведений згрупований ряд є неінтервальним, nтому що групування проведено без конкретного інтервалу за абсолютним значенням nкожної варіанти.

Варіаційні ряди, де значення варіант nпредставлено у вигляді інтервалів, називаються інтервальними. У вигляді інтервального ряду часто представляють ознаки зі значною nкількістю варіант. При цьому значення кожної варіанти представлено у вигляді nінтервалу (табл. 1).

Таблиця 1

Розподіл хлопчиків 7 років за зростом

Зріст (х)

Число хлопчиків (f)

125,0-126,9

127,0-128,9

129,0-130,9

131,0-132,9

Всього

n = 28

У наведеному прикладі (табл. 1) інтервали є закритими – кожен з них має верхню та nнижню межу. В практиці зустрічаються відкриті nінтервали (вік 60 років і старше, зріст до 120 см та інші). При аналізі nширину відкритого інтервалу, звичайно, вважають рівною ширині суміжного з ним nінтервалу.

Згрупований інтервальний nваріаційний ряд одержують шляхом об’єднання варіант у групи. При цьому потрібно nпам’ятати, що: а) розмір варіаційних груп повинен залежати від природи явища; nб) доцільно визначати однакові інтервали; в) межі варіаційних груп не повинні nповторюватись.

Всі варіаційні ряди за якісною nхарактеристикою розподіляються на дискретні n(перервні), в яких варіанти можуть бути представлені тільки цілими числами чи nотримані в результаті підрахунків (розподіл за частотою пульсу, числом nліжко-днів, відвідувань) та інкретні (безперервні), nде варіанти можуть бути представлені як цілими, так і дробовими числами, або є nрезультатом вимірів (табл. 1). Клінічні параметри є здебільшого прикладом інкретних варіант.

В процесі проведення дослідження питання про число nваріаційних груп вирішують з огляду на характер матеріалу та чисельність nсукупності. Характерні особливості розподілу не виявляться, якщо при незначному nчислі одиниць спостереження взяти велике число груп, або якщо число груп є nнедостатнім.

При використанні ЕОМ для обробки статистичних даних nгрупування проводять за стандартними процедурами. Однією з них є формула Стерджеса для визначення оптимального числа груп:

n = 1 + 3,322 · lgN,

де:– число груп;

N – число одиниць спостереження.

Використання даної формули доцільне при великому числі nодиниць спостереження.

Іншим варіантом, більш гнучким з практичної точки зору, є nметод визначення амплітуди ряду. Для вирішення питання про число груп необхідно nпредставити статистичну сукупність у вигляді рангованого nряду, тобто розташувати її одиниці в певному порядку. При чисельності nсукупності менше 100 одиниць не доцільно планувати більше 10 груп.

Різниця між максимальним та мінімальним значенням варіант nназивається розмахом чи амплітудою (х_max – nх_min).

Етапи складання інтервального nваріаційного ряду такі:

· визначення амплітуди nряду;

· визначення числа груп;

· визначення величини nінтервалу.

Розрахунок середніх величин базується на значеннях варіант. nЯкщо варіанта представлена у вигляді інтервалу, за величину її у кожному з них nприймають центральну варіанту, тобто середину інтервалу. Для дискретного ряду nцентральна варіанта визначається як півсума одного nінтервалу. Для інкретного ряду (табл. 1) нею є півсума початкових значень двох сусідніх інтервалів: (125,0 n+ 127,0) : 2 = 126 см. n

Загальну характеристику варіаційного ряду проводять за nдопомогою наступних параметрів: середньої арифметичної (`Х), середнього квадратичного nвідхилення (d), середньої похибки nсередньої величини (m), коефіцієнта варіації (С), амплітуди (х_max – х_min).

Крім вказаних, у деяких випадках для характеристики ряду nдоцільно визначати також моду та медіану.

Мода – це варіанта, яка має nнайбільшу частоту. Моду використовують у тих випадках, коли потрібно дати nхарактеристику ознаки, яка найбільш часто зустрічається в досліджуваній nсукупності. Її використовують тільки у великих сукупностях.

Медіаною в статистиці називається nваріанта, яка займає серединне (центральне) положення у варіаційному ряду. nМедіана поділяє ряд навпіл – по обидва боки від неї знаходиться однакова nкількість одиниць сукупності.

Середня nарифметична – найбільш поширений за частотою використання вид середніх величин. Вона nможе бути простою і зваженою. Для простого варіаційного ряду, в якому кожна nваріанта повторяється один раз, визначається проста середня арифметична, яка розраховується як відношення суми nзначень варіант до загального числа спостережень.

де: V – значення окремих nваріант;

n – загальне число спостережень.

Для прикладу за частотою пульсу, наведеного вище, визначимо:

Для згрупованого nваріаційного ряду визначається зважена nсередня арифметична. Таким чином:

Частота, з якою зустрічається кожна варіанта, називається n”вага” варіанти, а середня арифметична є зваженою, тому що варіанти nберуть участь у загальній сумі неодноразово, а ніби зважено за числом nвідповідних частот.

При визначенні nсередньої арифметичної для згрупованого інтервального nваріаційного ряду: 1) визначають середину інтервалу, як вказано вище; 2) nвизначають добуток кожної центральної варіанти на відповідну для неї частоту; n3) суму добутків ділять на число спостережень.

Важливі властивості nсередньої арифметичної:

· nДобуток середньої на суму частот завжди дорівнює сумі добутку nваріант на частоту.

· nЯкщо від кожної варіанти відняти якесь довільне число, то nнова середня зменшиться на те ж число.

· nЯкщо до кожної варіанти додати якесь довільне число, то nсередня збільшиться на те ж число. Друга та третя властивості середньої nарифметичної показують, що при зменшенні чи збільшенні варіант на одне і те ж nчисло зменшується чи збільшується рівень ознаки на те ж число.

· nЯкщо кожну варіанту поділити на якесь довільне число, то nсередня арифметична зменшується у стільки ж разів.

· nЯкщо кожну варіанту помножити на якесь довільне число, то nсередня арифметична збільшується у стільки ж разів.

· nЯкщо всі частоти (ваги) поділити чи помножити на якесь число, nто середня арифметична внаслідок цього не зміниться – якщо ми збільшуємо чи nзменшуємо рівнозначно частоти всіх варіант, ми не змінюємо вагу кожної окремої nваріанти ряду.

· nСума відхилень варіант від середньої арифметичної завжди nдорівнює нулю. Це значить, що відносно середньої арифметичної взаємно nпогашаються відхилення варіант в той чи інший бік.

Загальні властивості можна використовувати, щоб полегшити nтехніку визначення середньої арифметичної варіаційного ряду.

Середня гармонійна розраховується в тих nвипадках, коли відомими є дані про чисельник при відсутності таких щодо nзнаменника. Наприклад, необхідно визначити середній час, затрачений на прийом nодного хворого, коли відомо, що 5 лікарів вели прийом протягом 8 годин. Кожен з nних затратив в середньому на прийом одного хворого відповідно 20; 16; 20; 15; n24 хвилини. Розрахунок має наступну схему: сукупний робочий час лікарів nскладав: n=8·5=40 годин (2400 хвилин, або 480 хвилин на одного лікаря). nНавантаження на кожного лікаря визначається: для першого – 480 : 20 = 24 nхворих; для другого – 480 : 16 = 30 хворих і т.д. Сумарно – 130 хворих.

Середня геометрична визначається для тих nпараметрів, зміни значень яких проходять в геометричній прогресії (зміна nчисельності населення в період між переписами, результати титрування вакцин, nприріст маси тіла новонароджених протягом окремих місяців життя та інше).

Логарифм середньої геометричної дорівнює сумі nлогарифмів всіх членів ряду, розділених на їх число.

Середня арифметична, яка використовується самостійно, сама по nсобі, часто має обмежене значення тому, що вона не відображає розміри коливання nкількісних варіант ряду (варіабельність ряду). Важливою характеристикою ряду є nоцінка різноманітності (мінливості, варіабельності) варіант досліджуваної nсукупності. Основою даної оцінки є визначення відхилень окремих варіант від nсереднього значення ряду. Якщо варіаційний ряд більш компактний, варіанти менше nвідрізняються від середньої арифметичної. Тому можна вважати, що дана середня nвеличина є більш типовою і краще описує дану сукупність. Якщо варіаційний ряд nрозкиданий, варіанти значно відрізняються від середньої. В такому випадку nсередня є менш типовою та не зовсім чітко характеризує ряд і властивості nокремих його варіант.

Одним із критеріїв різноманітності nваріант ряду є його амплітуда – nрізниця крайніх значень. Проте, вона не враховує характер їх розподілу. За nумови високої компактності розподілу варіант в сукупності і при наявності nокремих варіант, що різко відрізняються від інших (“вискакуючі” nваріанти), амплітуда не відображатиме істинний характер розподілу.

Іншою величиною мінливості ознак nдосліджуваної сукупності є середнє nквадратичне відхилення (стандартне відхилення), яке позначається символом n”сигма” (δ).

Чим вищим є середнє квадратичне nвідхилення, тим вищим буде ступінь різноманітності ознак сукупності та менш nтиповою середня. Наприклад, аналіз організації госпіталізації хворих показав, що nсередня тривалість доопераційного періоду при nплановій госпіталізації у двох стаціонарах складає:

Лікарня № 1

Лікарня № 2

Х = 3,1 дня

Х = 3,2 дня

δ = 0,3 дня

δ = 0,9 дня

Середня тривалість підготовки до nоперації в обох стаціонарах практично однакова, проте середнє квадратичне nвідхилення, що відображає його коливання, в лікарні № 1 значно менше. Це є nсвідченням вищої типовості середньої величини та, ймовірно, результатом кращої nорганізації госпіталізації і підготовки до оперативного лікування.

У випадках, коли значення ознак nбільше відхиляються від середньої (лікарня № 2), узагальнююча варіація nзнаходиться під впливом більш різнорідних умов і досліджувана сукупність хворих nза якістю організації їх госпіталізації є менш однорідною. Таким чином середня nвеличина, яка характеризує цю менш однорідну сукупність, буде менш типовою.

Формула розрахунку середнього nквадратичного відхилення така:

– для простого варіаційного ряду;

– для згрупованого варіаційного ряду.

Де:– 1 – число спостережень в nдосліджуваній сукупності (при досить великому числі спостережень –> 30 – nу формулу замість n–1 можна підставити n); P – частота варіант; d = V –`M – відхилення кожної nваріанти від середньої арифметичної; V – значення варіанти.

Методику розрахунку середнього квадратичного відхилення nрозглянемо на прикладі оцінки середньої тривалості лікування хворих з nпневмонією в стаціонарі (табл. 2).

Таблиця 2.

Терміни лікування хворих з пневмонією nв стаціонарі

Число днів

(х)

Число хворих (f)

V · P

d = V – M

d²

d²·P

-3

-2

128

-1

187

-0

180

n = 48

816

Σ=110

Послідовність nрозрахунку середнього квадратичного відхилення:

1. nВизначаємо середню арифметичну (M).

2. nЗнаходимо відхилення варіант від середньої арифметичної (d).

3. nПідносимо відхилення (d) в квадрат (для уникнення від’ємних nзначень та збільшення значень крайніх відхилень).

4. nПеремножуємо квадрати відхилень на відповідні частоти – d²·P та визначаємо їх суму.

5. nВизначаємо середнє квадратичне відхилення за наведеною nформулою.

Для нашого прикладу: d = ± 1,5 дня.

Середнє квадратичне відхилення завжди визначають у тих nіменованих числах, у яких представлені конкретні вимірювані варіанти та nсередня. Воно характеризує абсолютну міру варіації – чим більш мінливий, nрозсіяний ряд, тим “d” буде більше. Чим nбільше варіюють індивідуальні значення варіант, тим менш точно характеризується nваріаційний ряд за допомогою середньої арифметичної.

Практична значимість середнього квадратичного відхилення n(сигми) базується на теорії нормального розподілу варіант, згідно з якою їх nвідхилення від середнього значення в ту чи іншу сторону зустрічаються nрівнозначно. Переважна більшість явищ при практичному аналізі медико-біологічних даних мають нормальний розподіл. Теорією nстатистики доведено, що в нормальному варіаційному ряду знаходиться шість nсередніх квадратичних відхилень – рівномірно по три з кожного боку від nсередньої.

Виходячи із значення середньої nарифметичної (M) та середнього квадратичного відхилення (d) при симетричному ряді розподілу nможна стверджувати з відомим ступенем вірогідності, що певне число варіант буде nзнаходитись у визначених межах. Згідно з теорією математичної статистики, що nдоведено на великих числах спостережень, у межах “M ± 1d” будуть мати місце не менше 68,3 % всіх варіант даної nсукупності. За межами даного інтервалу nможе бути до 31,7 %, всіх спостережень. В межах “M ± 2d” будуть розташовані близько 95,5 % всіх варіант. Практично весь nваріаційний ряд – 99,7 % варіант знаходитиметься в діапазоні “M ± 3d“. Окремі варіанти – до 0,3 % досліджуваної сукупності можуть не nвідповідати загальному характеру розподілу та випадати з нього внаслідок nзанадто низького чи високого рівня (“вискакуючі” nваріанти).

Закономірностями розподілу частот варіаційного ряду можна nскористатися при вирішенні практичних завдань. Для наведеного вище прикладу nпланова доопераційна середня тривалість nгоспіталізації в лікарні № 1 складає 3,1±0,3 дні. Аналіз 200 випадків лікування nдозволяє зробити такий висновок: близько 68,3 % хворих (136 чоловік) матимуть nтривалість доопераційного періоду в середньому 2,8 – n3,4 дні (M ± 1d). У 95,5 % хворих (округлено 190 пацієнтів) він становитиме 2,5 – 3,7 дня (M ± 2d). Інтервал 2,2 – 4,0 дні (M ± 3d) описуватиме тривалість доопераційного періоду практично для всіх обстежених nхворих.

Узагальнення представленого матеріалу дозволяє зробити nвисновок про можливість практичного використання середнього квадратичного nвідхилення:

· nдля визначення амплітуди ряду;

· nвідновлення крайніх його значень;

· nвизначення ймовірного числа спостережень в певних інтервалах.

Наведені критерії розподілу ознак (“сигмальна оцінка”) використовують для індивідуальної оцінки nпоказників фізичного розвитку, визначення норм клінічних та фізіологічних параметрів. nІнтервал оцінки показників у межах (M±1d) в більшості випадків nвизначає їх середній рівень; в межах (M) ± 2d – вище чи нижче nсередніх; в межах (M ± 3d) – дуже високі, чи дуже низькі рівні nпоказників.

Оцінка середнього квадратичного nвідхилення залежить не тільки від ступеня варіації ознаки, але й від абсолютних nрівнів варіант та середньої. Тому безпосередньо порівнювати середні квадратичні nвідхилення варіаційних рядів з різними рівнями і одиницями виміру, які nхарактеризують неоднорідні явища (довжина у см, вага у кг), не можна. Для nможливості такого зіставлення необхідно визначити для кожного ряду відношення nсереднього квадратичного відхилення (сигми) до середньої арифметичної у nвідсотках, тобто визначити коефіцієнт nваріації, мінливості (С). Він є відносною мірою варіабельності, яка nвиражається в абстрактних, а не іменованих числах, критерієм надійності nсередньої величини і визначається за формулою:

Чим вищий коефіцієнт варіації, тим nбільша варіабельність даної ознаки. Наприклад, визначили, що після дозованого nнавантаження середня частота пульсу в обстежених складала M=90 уд./хв., nd=8 уд/хв., nа артеріальний тиск M=135 мм. рт. ст., d=7 мм. рт. nст.

Коефіцієнт варіації для першого (за частотою пульсу) ряду:

Коефіцієнт варіації nдля другого (за артеріальним тиском) ряду:

Для даного nприкладу артеріальний тиск є більш сталою ознакою, ніж частота пульсу. Таким nчином, коефіцієнти варіації дають більш точну оцінку мінливості явищ та nвизначають найбільшу (найменшу) варіабельність їх ознак.

Орієнтовними критеріями оцінки nваріабельності за його коефіцієнтом можна вважати: низький рівень – до 10 %; nсередній рівень – 10-20 %, високий рівень – вище 20 %. Високий рівень nкоефіцієнта свідчить про невисоку точність узагальнюючої характеристики nсередньої величини, одним із шляхів підвищення якої є збільшення числа nспостережень.

За назвами в nстатистиці використовуються середня арифметична, середня хронологічна, середня nгеометрична, середня квадратична величини, середня гармонічна. Зміна значення nпоказника степенної середньої величини (m) визначає nвид середньої величини: якщо m = 1, то ми одержуємо середню арифметичну nвеличину; якщо m = 2, то одержуємо середню квадратичну; якщо m = 3, то – nсередню кубічну; якщо m = – 1,– маємо середню гармонічну; якщо m = 0, то nсередню геометричну. З степенних середніх в правовій nстатистиці найчастіше використовують середню арифметичну, значно рідше – nсередню гармонічну; середня геометрична застосовується лише при обчисленні nсередніх темпів динаміки, а середня квадратична – при обчисленні показників nваріації.

Розмір обчисленої nсередньої величини завжди відрізняється, оскільки обумовлюється показником nстепеню середньої величини. В загальному вигляді це правило має назву мажорантності середніх: чим більше показник ступеня, тим nбільше величина середньої. При цьому слід мати на увазі, що правильну nхарактеристику різних сукупностей в кожному окремому випадку визначає лише nпевний вид середньої величини. Основний критерій визначення виду середньої nвеличини – це механізм утворення обсягу ознаки, яка варіює. Середня тільки тоді nбуде вірно відображати усю сукупність, коли при заміні усіх ознак (варіантів) nсередньою загальний обсяг варіюючої ознаки залишиться nнезмінним.

Залежно від того, nяк формується загальний обсяг сукупності, і визначається вид середньої nвеличини. Середня арифметична застосовується тоді, коли обсяг варіючої ознаки утворюється як сума окремих варіантів, середня nквадратична – коли обсяг варіючої ознаки має вигляд nсуми квадратів окремих варіантів, середня гармонічна – коли обсяг варіючої ознаки складається із суми обернених значень nокремих варіантів, середня геометрична – коли обсяг варіючої nознаки одержується як добуток окремих варіантів.

У правовій nстатистиці середні арифметичні величини застосовуються тоді, коли первинні n(вихідні) дані наведені у такому вигляді, що загальний обсяг ознаки для усієї nсукупності можна одержати шляхом підсумовування їх у всіх одиницях.

Середня nарифметична проста (незважена) обчислюється шляхом ділення суми індивідуальних nзначень ознаки на їх загальну кількість. Спочатку підсумовують значення усіх nваріантів, а потім ця сума ділиться на загальну кількість одиниць сукупності. nНаприклад, один слідчий районної прокуратури закінчив за місяць 2 справи, інший n– три. В результаті у середньому вони закінчили розгляд 2,5 справи ((2+3) : 2). nПри цьому не можна відкинути 0,5 справи і округлити цифру, тому що в такому nразі результат буде помилковий.

Середня nарифметична проста використовується дуже рідко, як правило, лише тоді, коли nсукупність повністю симетрична (нормальний закон розподілу одиниць) або має nневелику кількість одиниць (як в нашому прикладі).

Оцінка nвірогідності результатів дослідження

Вивчення nбудь-якої проблеми, звичайно, супроводжується необхідністю дати відповідь на nряд питань щодо вірогідності отриманих результатів:

1. Чи завжди потрібно оцінювати їх nвірогідність?

2. Наскільки вірогідним є розподіл nпевної ознаки в даній сукупності – чи достовірним є отриманий показник?

3. Чи відображає розподіл певного nпараметра в досліджуваній групі аналогічний розподіл параметра в генеральній nсукупності (серед всіх хворих)?

4. Чи суттєва різниця між аналогічними показниками nв різних групах (хворих, населення та інших)?

Необхідність оцінки вірогідності отриманих результатів nвизначається об’ємом дослідження. Вона не проводиться при суцільному nдослідженні (для аналізу відібрано всі можливі одиниці спостереження), оскільки nдля всієї (генеральної) сукупності можна отримати тільки одне значення певного nпоказника. Проте в системі медико-біологічних nдосліджень (крім даних офіційної статистики) рідко використовують суцільні nметоди збору інформації – переважна частина досліджень є вибірковими.

При nпроведенні вибіркового дослідження ми можемо зустрічатися з загальними nпохибками та похибками вибірки. Загальні похибки можуть мати як систематичний nхарактер (методичні, недоліки вимірювальної апаратури), так і випадковий n(помилки дослідника). Похибки вибіркового спостереження пов’язані з відбором nйого одиниць. Це похибки типовості, репрезентативності.

В nпроцесі аналізу розраховані показники (середня тривалість лікування, частота nускладнень, рівень летальності та інші) розглядають як узагальнюючі величини. nЯкщо результати отримано на основі достатнього за кількістю та якісно nоднорідного матеріалу, то можна вважати, що вони досить точно характеризують nдосліджувані явища.

Наприклад, nпри вивченні ефективності нового методу лікування, апробованого на 400 хворих, nвстановлено, що у 12 з них виникли ускладнення. Частота їх складає 3 %. nЗначення узагальнюючого результату полягає в тому, що при проведенні nаналогічних вибіркових досліджень, або для оцінки всієї сукупності хворих з nданою патологією (генеральної сукупності) ми могли б передбачити отримання nаналогічних даних. Проте не виключена ситуація, коли при проведенні повторних nдосліджень показник, який був визначений шляхом вибіркового спостереження, в nнезначній мірі може відрізнятись від результату суцільного спостереження.

Отже, оцінити nвірогідність результатів вибіркового дослідження означає визначити, в якій nмірі зроблені для нього висновки (результати) можна перенести на генеральну nсукупність. Тобто, за частиною явища міркувати про явище в цілому та основні nпритаманні йому закономірності.

Для оцінки вірогідності результатів будь-яких вибіркових nдосліджень визначають середню похибку відносної (m_Р) nчи середньої величини (m_Х).

Середня nпохибка для відповідних показників при значному числі спостережень (n>30) nможе бути розрахована за наступними формулами:

– середня похибка nсередньої величини;

– середня похибка nвідносної величини;

де: δ– середнє квадратичне nвідхилення;

n – число спостережень у вибірковій сукупності. При nмалому числі спостережень (n<30) в знаменнику замістьвикористовується nn-1.

P – відносний показник;

q – величина, зворотна до показника, тобто вірогідність nтого, що дане явище не буде зареєстровано. Сума двох протилежних вірогідностей дорівнює одиниці: P + q = 1. Якщо показник nрозраховано на 100 (%), то

q = 100 – P, nякщо на 1000 (%₀), то q = 1000 – P і т.д.

Для nнаведеного вище прикладу середня похибка показника становить:

Середня nпохибка відображає розміри випадкових коливань показника при вибіркових nдослідженнях і залежить від числа спостережень та якісних характеристик явища. nЧим більше число спостережень та чим одноріднішою є відібрана для аналізу nгрупа, тим менші межі ймовірних випадкових коливань показника.

Середня похибка дозволяє визначити довірчі межі, в яких з nпевною ймовірністю знаходиться істинне значення показника. Інтервал, nрозташований між ними, носить назву довірчого інтервалу.

Довірчі межі середньої та відносної величин визначають за nформулою:

`Х_ген = `Х_виб + tm_`_х ; Р_ген n= Р_виб + tm_Р_,де:

1) n`Х_гента Р_ген – nзначення середніх та відносних величин для генеральної сукупності;

2) n`Х_вибі Р_виб– nзначення середніх та відносних величин, розрахованих для вибіркової сукупності; n

3) ntm_`_хі m_Р– nсередні похибки відповідних показників (похибки репрезентативності);

4) nt n– критерій вірогідності або довірчий критерій. Він може бути заданий з різними nступенями точності і залежно від імовірності безпомилкового прогнозу складати t = 2 i t = 3.

Межі вірогідності (довірчі межі) (Р + 2m) (при t = 2) nдають можливість визначити межі коливання показника з імовірністю 95,5 % (р = n0,05), а довірчі межі (Р+3m) (при t = 3) дають nможливість визначити межі коливання показника з імовірністю 99,7 % (р = 0,01). nІмовірність безпомилкового прогнозу і довірчий критерій визначають на етапі nпланування статистичного дослідження.

При заданих ступенях імовірності довірчий критерій (t) має nнезмінну величину, а довірчий інтервал залежить від величини середньої похибки n(m), значення якої зменшується при збільшенні числа та якісного складу nспостережень.

Для nнашого прикладу, при використанні наведеного методу лікування частота nускладнень для генеральної сукупності з імовірністю 95,5 % (t = 2) може nзнаходитись в межах: Р_ген = Р_виб + ntm_Р= 3,0 + 2×0,85 % – від 1,3 n% до 4,7 %. З імовірністю n99,7 % довірчий інтервал складатиме від 0,45 n% до 5,55 %.

Практична цінність використання середньої похибки nсередньої чи відносної величини полягає не тільки у визначенні довірчих меж nпевного показника, але й в оцінці його суттєвості (вірогідності). Якщо вона nдосить велика, ми можемо отримати значення довірчого інтервалу в діапазоні, nякий не підлягає логічній оцінці. Наприклад, при використанні певної методики nвигодовування новонароджених приріст маси тіла склав 800+300 грам. nДовірчий інтервал при вірогідності безпомилкового прогнозу 99 % складатиме від n100 до 1700 грам. Отже, наявність від’ємного результату не дозволяє в повній nмірі за даним показником оцінити ступінь впливу даної методики на приріст маси nтіла новонароджених.

У вказаній ситуації для підвищення nвірогідності оцінки необхідно зменшити довірчий інтервал шляхом збільшення nчисла спостережень і, відповідно, зменшення середньої похибки показника. nСуттєвість (вірогідність) показника визначається на основі співвідношення між nабсолютним його значенням та середньою похибкою, яке повинно бути не менше nтрьох – Р/m_Р>3.

В медико-біологічних nдослідженнях часто виникають ситуації, коли при порівнянні окремих параметрів nнеобхідно оцінити суттєвість різниці між ними. Суттєва різниця між окремими nпоказниками вибіркового дослідження свідчить про можливість перенесення nотриманих висновків на генеральну сукупність. Критерієм оцінки суттєвості nрізниці є коефіцієнт вірогідності n(критерій Стьюдента), який визначають за формулою:

– для nсередніх величин;

– для nвідносних величин.

При великому числі спостережень (n>30) різниця між nпоказниками є суттєвою, якщо:

1) t ≥ 2 (відповідає вірогідності nбезпомилкового прогнозу 95,5 %);

2) t > 3 (відповідає вірогідності nбезпомилкового прогнозу 99,7 %).

За умови t<2 ступінь вірогідності безпомилкового прогнозу nскладає менше 95%. В цьому випадку ми не можемо стверджувати, що різниця між nпоказниками є суттєвою.

Наприклад, nв школі № 1 навчається 1200 дітей. Профілактичні щеплення проти грипу проведено n900 дітям. В наступному році захворіло 350, в тому числі 150-и з них не були nзроблені щеплення. Для того, щоб порівняти і оцінити суттєвість різниці між nрівнями захворюваності серед щеплених дітей, та тих, яким щеплення не nпроводились, необхідно:

1) визначити рівні захворюваності в nшколі № 1 серед першої (з щепленнями) та другої (без щеплень) груп. Вони nскладають, відповідно:

Р₁=150 n: 300×100=50 %.

Р₂=(350-150) n: 900×100=22,2 %;

2) визначити середні похибки вказаних nпоказників:

3) nоцінити nсуттєвість різниці за критерієм Стьюдента:

Висновок: nрізниця між показниками суттєва, оскільки t>3, що відповідає рівню nбезпомилкового прогнозу 99,7 %.

Часто при клінічних чи експериментальних дослідженнях доводиться nмати справу з малим числом спостережень (30 та менше): 5-6 лабораторних тварин, n10-12 хворих та інші. Якщо дослідження вірно організоване, відібрані однорідні nгрупи, їх можна розглядати як вибіркові з малим числом спостережень. Проте при nмалому числі спостережень (n<30) оцінка вірогідності різниці між параметрами nокремих груп проводиться на основі порівняння результату не з граничними nзначеннями критерія Стьюдента, nа з його табличними значеннями для відповідного числа спостережень (n`= n₁+n₂–2). Якщо визначений nt-критерій перевищує табличне значення чи дорівнює йому – різниця між nпоказниками статистично доведена.

Критерій вірогідності (t) використовують при попарному nпорівнянні досліджуваних параметрів. Проте при проведенні статистичного аналізу nіноді необхідно оцінити вірогідність різниці більшої від двох кількості nпоказників клініко-статистичних груп. Попарне порівняння їх не дозволяє nотримати узагальнюючу оцінку. В іншому випадку необхідно провести порівняння nсукупності не тільки за узагальнюючими показниками, а й за характером розподілу nознак в досліджуваних групах.

У вказаних ситуаціях найбільш доцільним є використання критерія nвідповідності – χ² (критерій Пірсона), nякий визначають за формулою:

$Описание: Описание: Опис : C:\Users\User\Desktop\67f4e8b262d2552f378d47c5f4776492.png$ n, де

р – реальні частоти;

р₁ – теоретичні частоти.

В узагальненому вигляді практичне значення критерію nвідповідності (χ²) полягає в наступному:

· nоцінка nвірогідності різниці між кількома порівнюваними групами при декількох можливих nрезультатах з різним ступенем ймовірності (наприклад, три чи чотири групи nхворих з різними методами лікування та їх наслідками – різною частотою nускладнень);

· nвизначення nнаявності зв’язку між двома факторами (залежність результатів лікування від nвіку хворих, важкості захворювання, зв’язок між важкістю патології nновонароджених та станом їх фізичного розвитку);

· nоцінка nідентичності розподілу частот у двох та більше сукупностях (аналогічність nрозподілу хворих за рівнем клінічних параметрів при різних ступенях тяжкості nпатології).

Основою методу є визначення суттєвості різниці (відхилень) nфактичних даних від теоретичних (очікуваних). Розрахунок теоретичних даних nбазується на припущенні, що між порівнюваними групами за досліджуваними nфакторами різниця відсутня. Дане припущення визначається як “нульова гіпотеза”.

На її основі визначають “очікувані” результати, і порівнюють nїх з фактичними даними. Якщо різниця відсутня, можна зробити висновок, що n“нульова гіпотеза” підтвердилась. При наявності відмінностей фактичних даних nвід теоретичного розподілу визначають суттєвість різниці між порівнюваними nгрупами.

Оцінка nрезультатів (χ²) проводиться за спеціальною таблицею. Суттєвою nвважається різниця в тому випадку, коли величина розрахованого коефіцієнта nперевищує табличне значення при вірогідності не нижче 95 % (імовірність похибки nменше 5 % – p<0,05).

Методику nрозрахунку коефіцієнта відповідності розглянемо на прикладі оцінки впливу nметоду лікування на їх результати.

1. nНаведемо nфактичні результати за трьома методами лікування (табл. 3).

Таблиця n3

Результати nлікування хворих за окремими методиками

Методики

лікування

Всього

хворих

Результати лікування – р (фактичні дані)

Хороші

Задовільні

Незадовільні

III

Всього

200 (100 %)

109

2. nРозраховуємо n“очікувані” результати згідно з “нульовою” гіпотезою, основою якої є nприпущення, що різниця між результатами лікування за окремими методиками nвідсутня. В цьому випадку за основу беремо загальний розподіл хворих, nпролікованих всіма методами. Числова характеристика “нульової” гіпотези nскладає: хороші результати в цілому мали 54,5 %, задовільні – 26,5 % та nнезадовільні – 19 % хворих. Відповідно до вказаного розподілу визначають n“очікувані” дані результатів лікування за окремими методиками (значення nвизначаємо в цілих числах) – табл. 4.

Таблиця 4

“Очікувані” дані результатів лікування за окремими методиками

Методики

Лікування

Всього

хворих

Результати лікування – р₁ (очікувані дані)

Хороші

Задовільні

Незадовільні

III

Всього

200

109 (54,5 %)

53 (26,5 %)

38 (19 %)

3. nСпівставимо фактичні та теоретичні дані (їх різницю) з розрахунком nвеличини відхилення та врахуванням його напрямку (знаку) – табл. 5.

Таблиця 5

Розрахунок величини відхилення

Методики

лікування

(р – р₁)

Хороші

Задовільні

Незадовільні

III

9 (36–27)

4 (48–44)

–13 (25–38)

–2 (11–13)

–4 (17–21)

6 (25–19)

–7 (3–10)

0 (15–15)

7 (20–13)

Всього

4. nРозраховуємо nквадрат відхилення теоретичних даних від фактичних та середній квадрат nвідхилення на одну “очікувану” групу. Даний етап розрахунку має такий вигляд у nзв’язку з тим, що на основі фактичних відхилень неможливо визначити його nсумарну величину, оскільки вона дорівнює нулю. При піднесенні відхилень у nквадрат визначаємо їх параметри для кожної групи (р – р₁)². nЗ огляду на різне число хворих у досліджуваних групах величина відхилень може nбути різною, тому квадрат їх ділимо на число відповідних спостережень кожної групи n– (р – р₁)²:р₁_{. n}Провівши розрахунки, визначаємо (р – р₁)² та (р – р₁)²:р₁(табл.₆).

Таблиця 6

Квадрат відхилення теоретичних даних від фактичних та середній квадрат nвідхилення

Методики

лікування

(р – р₁)²

р₁

Хороші

Задовіль-ні

Незадо-вільні

Хороші

Задовіль-ні

Незадо-вільні

III

169

2,75

0,23

0,31

0,77

1,9

4,9

3,77

∑ = 17,63

5. nВизначаємо nχ² – підсумок результатів останнього етапу розрахунків. В nнашому випадку χ² = 17,63. Порівнюємо його з табличним nзначенням, враховуючи число ступенів свободи (n¹), які визначають за nформулою: n¹= (S – 1)(r – 1), де

S – число nгруп хворих (для нашого прикладу – три);

r – nчисло результативних груп (три).

Число nступенів свободи n¹= (3 – 1)(3 – 1) = 4. Отриманий результат nперевищує табличні значення χ²для n¹= 4 за всіма nрівнями вірогідності. Отже, ми можемо зробити висновок про суттєвість n(вірогідність) різниці та наявність зв’язку між показниками при різних методах nлікування – “нульова гіпотеза” не підтвердилась.

Критерій nвідповідності не є абсолютно універсальним і має деякі недоліки:

· nзалежить nвід групування первинного матеріалу;

· nважливе nзначення має однорідність наведених груп для попередження згладжування різниці nміж ними;

· nвеличина nχ² визначає наявність зв’язку, проте не виявляє його силу та nхарактер;

· nметод nне визначає суттєвість різниці між окремими групами, тому іноді для попарного nпорівняння груп необхідно додатково використовувати t – критерій.

Статистичний критерій – це вирішальне правило, що забезпечує математично обґрунтоване nприйняття істинної і відхилення помилкової гіпотези. Статистичні критерії nбудуються на основі статистики ^(х₁, х₂, х_п) – деякої функції від результатів nспостережень х₁, х₂, х_п. nСтатистика ¥ є випадковою величиною з певним законом розподілу. Серед nзначень статистики ¥ виділяють критичну область ¥_кр з властивістю: якщо емпіричне значення nстатистики ¥_емп належать області ¥ _кр, то nнульову гіпотезу відхиляють (відкидають), інакше – приймають. Статистичні nкритерії визначають у практичній діяльності метод розрахунку певного числа, яке nпозначається як емпіричне значення критерію, наприклад, ґ_ем“ для ґ-критерію Стьюдента.

Співвідношення емпіричного і критичного nзначень критерію є підставою для підтвердження чи спростовування гіпотези. nНаприклад, у разі застосування ґ-критерію Стьюдента, якщо ґ_ем” n> ґ_кр n, то значення статистики належать критичній області і нульова гіпотеза Н₀ відхиляється (приймається альтернативна nгіпотеза Ні).Правила прийняття статистичного nрішення обумовлюються для кожного критерію.

Параметричні і nнепараметричні критерії

Відповідно до nстатистичних гіпотез статистичні критерії діляться на параметричні й непараметричні.

Параметричні критерії використовуються в завданнях перевірки параметричних гіпотез і nвключають у свій розрахунок показники розподілу, наприклад, середні, дисперсії nтощо. Це такі відомі класичні критерії, як г-критерій, ґ-критерій nСтьюдента, ^-критерій nФішера та ін. Непараметричні nкритерії перевірки гіпотез засновані nна операціях з іншими даними, зокрема, частотами, рангами тощо. Це А-критерій Колмогорова-Смірнова, [/-критерій nВілкоксона-Манна-Вітні та багато інших.

Параметричні критерії дозволяють прямо оцінити рівень основних параметрів генеральних nсукупностей, різниці середніх і відмінності в дисперсіях. Критерії спроможні nвиявити тенденції зміни ознаки при переході від умови до умови, оцінити nвзаємодію двох і більш факторів у впливі на зміни ознаки. Параметричні критерії вважаються дещо більш потужними, nніж не-параметричні, за умов, якщо ознака виміряна за nінтервальною шкалою і нормально розподілена. Проте з інтервальною шкалою можуть виникнути певні проблеми, якщо nдані, представлено не в стандартизованих оцінках. До того ж перевірка розподілу n”на нормальність” вимагає досить складних розрахунків, результат яких nзаздалегідь невідомий. Найчастіше розподіли ознак відрізняються від nнормального, тоді доводиться звертатися до непараметричних критеріїв.

Непараметричні критерії позбавлені перерахованих вище обмежень. Проте вони не nдозволяють здійснити пряму оцінку рівня таких важливих параметрів, як середнє nабо дисперсія, з їхньою допомогою неможливо оцінити взаємодію двох і більше nумов або факторів, що впливають на зміну ознаки. Непараметричні критерії nдозволяють вирішити деякі важливі завдання, які супроводжують дослідження в nпсихології і педагогіці: виявлення відмінностей у рівні досліджуваної ознаки, nоцінка зсуву значень досліджуваної ознаки, виявлення відмінностей у розподілах nознак.

Застосування критеріїв для прийняття n(відхилення) статистичних гіпотез завжди здійснюються з довірчою ймовірністю, nінакше кажучи, на певному рівні nзначущості.

Рівень статистичної nзначущості – це ймовірність того, що nми визнали відмінності істотними (прийняли альтернативну гіпотезу і відхилили nнульову), а вони насправді випадкові. Наприклад, якщо вказується, що nвідмінності достовірні на 5%-му рівні значущості, то мається на увазі nймовірність 0,05 того, що вони все ж таки недостовірні. Рівень значущості – це nймовірність відхилення нульової гіпотези, тоді як вона правильна.

Історично склалося так, що в nпсихолого-педагогічних дослідженнях прийнято вважати нижчим рівнем статистичної nзначущості 5%-й рівень (а<0,05), достатнім – 1%-й рівень (а<0,01) і вищим n- 0,1%-й рівень (а<0,001). Тому в таблицях критичних значень звичайно nприводяться значення критеріїв, відповідних рівням статистичної значущості nа<0,05 і а<0,01, інколи а<0,001. Пропонуємо дотримуватися правила nвідхилення гіпотези про відсутність відмінностей (Н₀) і прийняття nгіпотези про статистичну достовірність відмінностей (ні), доки рівень nстатистичної значущості не досягне а=0,05.

Непараметричні критерії оцінки nвірогідності результатів дослідження

Розглянуті в попередніх розділах статистичні параметри n(середня арифметична, середнє квадратичне відхилення, коефіцієнт варіації, nсередня похибка), які використовують для аналізу варіаційних рядів, є його nпараметрами і вимагають представлення вихідних даних у кількісному вигляді. nПроте при проведенні медичних досліджень досить часто доводиться nвикористовувати методи статистичного аналізу даних, представлених у напівкількісному, напів’якісному та якісному nвигляді.

Сукупність статистичних методів, що nдозволяють оцінити їх результати як в кількісному (числовому), так і в напівкількісному та якісному вигляді об’єднують в групу непараметричних критеріїв оцінки. nВикористання їх не потребує розрахунку параметрів варіаційного ряду. Тут має nзначення порядок розташування варіант в сукупностях. Статистична оцінка nспостережень за допомогою непараметричних критеріїв, як правило, простіша, ніж nоцінка параметричними методами та не вимагає громіздких розрахунків.

Переважна nбільшість параметричних статистичних методик передбачає наявність нормального nрозподілу варіант у досліджуваній сукупності. Але на практиці зустрічаються не nтільки нормальні, але й інші види розподілу ознак. За наявності таких ситуацій nвикористання параметричних критеріїв підвищує ймовірність помилок. Практичне nзастосування непараметричних критеріїв, не пов’язане з певною формою розподілу nдосліджуваних ознак, робить доцільним їх самостійне використання або в nкомплексі з параметричними.

Незважаючи nна певну простоту методик, надійність непараметричних критеріїв досить висока. nВони можуть бути використані для оцінки вірогідності медико-біологічних nрезультатів однієї сукупності, різниці двох та більше вибіркових сукупностей.

Зважаючи, що одним із найбільш важливих розділів їх nвикористання є оцінка вірогідності різниці порівнюваних спостережень, весь nкомплекс вказаних методик можна розподілити на nдві групи: 1) непараметричні критерії оцінки вірогідності різниці у двох взаємопов’язаних сукупностях; 2) nнепараметричні критерії оцінки вірогідності різниці у двох незалежних сукупностях.

Першу nгрупу використовують для оцінки вірогідності різниці за результатами, які nотримані для однієї групи хворих протягом різних періодів (до лікування – після nлікування, перший день – п’ятий день та інші). Порівняння їх результатів може nбути проведено за критеріями знаків та Вілкоксона.

Критерій знаків дозволяє включати в аналіз до 100 nпар спостережень і базується на підрахунку числа однонаправлених nрезультатів при парному їх порівнянні.

В nтабл. 7 наведено динаміку швидкості осідання еритроцитів (ШОЕ) за 10-денний nперіод лікування.

Таблиця n7

Динаміка nшвидкості осідання еритроцитів (ШОЕ)

Хворі

(№ п/п)

ШОЕ

Спрямованість різниці

1 день

10 день

–

Основні nетапи розрахунку за критерієм знаків:

1. Визначення спрямованості різниці в nпорівнюваних групах результатів. Динаміка при цьому позначається відповідними nзнаками: +, –, =. З подальшого розрахунку виключають результати без динаміки n(=).

2. Підрахунок числа спостережень з nпозитивними та негативними результатами. З 10 наведених зміни виявились у 9 nхворих.

3. Підрахунок числа знаків, які рідше nзустрічаються. Зниження ШОЕ (–) виявлено у 6 хворих, а приріст (+) nзареєстровано в трьох випадках.

4. Порівняння меншого числа знаків n(критерій Z) з табличними критичними значеннями для відповідного числа nспостережень. Для= 9 визначений критерій Z=3 вище граничного табличного (Z_{0,05 n}= 2). Отже, не можна зробити висновок про суттєвість динаміки швидкості nосідання еритроцитів – ймовірність похибки більше 5 % (р>0,05).

Т-критерій Вілкоксона передбачає можливість попарного nпорівняння від 6 до 25 пар спостережень. Його доцільно використовувати в тих nвипадках, коли виявляються неоднозначні кількісні зміни досліджуваного nпараметра (зниження та підвищення). При цьому враховують не тільки nспрямованість різниці, а і її величину.

Методика nаналізу за Т-критерієм Вілкоксона наведена в табл. 8.

1. Визначається різниця в парах nспостереження між кінцевим та початковим рівнями артеріального тиску.

2. Рангування отриманих результатів за величиною nрізниці між показниками без врахування спрямованості змін. Результати без nдинаміки виключають з подальшої оцінки. Якщо два результати мають однакові nабсолютні значення змін, їх ранги визначають як півсуму nпорядкових номерів.

3. Підрахунок суми однозначних рангів n(позитивних та негативних).

4. Оцінка за меншою сумою рангів шляхом nпорівняння визначеного Т-критерію з табличним значенням при відповідному числі nпар спостережень.

Таблиця n8

Рівень nартеріального тиску у хворих на гіпертонічну хворобу до та після лікування (мм. nрт. ст.).

Хворі

Рівень артеріального тиску

Різниця

Ранг різниці

Сума рангів

“+”

Сума рангів

” – “

до лікування

після лікування

В.

Д.

К.

Р.

Н.

П.

А.

С.

Ю.

Т.

210

180

185

160

175

190

155

180

200

170

175

180

140

185

145

150

160

155

–35

+25

–30

–40

–20

–45

–15

6,5

–

6,5

Т=40

Т = 5

Критерій nВілкоксона Т=5 не перевищує табличного значення для nданого числа спостережень –= 9, T_0,05 = 6. Отже, можна зробити nвисновок про суттєвість (статистичну вірогідність) динаміки артеріального тиску nу хворих після лікування.

Друга група непараметричних критеріїв – критерії, що nзастосовують у випадку порівняння незалежних nсукупностей. Типовими прикладами їх практичного використання є порівняння nдослідної та контрольної груп хворих, результатів двох груп спостережень, що nвідносяться до різних захворювань чи ступенів важкості патології.

Для nпорівняння незалежних сукупностей використовують:

· серійний критерій;

· критерій Уайта;

· Ван дер Вардена.

Але nнайбільш потужним в даній групі є критерій Колмогорова-Смирнова (λ²), nметодика застосування якого наведена нижче (табл. 9):

Таблиця n9

Зміна nрадіоактивності крові опромінених тварин, що отримували (Х) та не отримували n(У) лікування (в умовних одиницях)

Варіанти по ряду Х та У

Частоти варіант по групах

Накопичені частоти по групах

Накопичені частки по групах

Різниця

Рх

Ру

0,23

0,56

0,67

0,23

0,44

0,78

0,34

0,44

0,89

0,34

0,55

0,45

0,55

0,56

0,44

0,67

0,33

0,89

0,11

Nx=9

Ny=8

1. Числові значення двох варіаційних nрядів об’єднують в один варіаційний ряд, варіанти якого розташовують в порядку nзростання.

2. Визначають частоти варіант для обох nгруп спостережень.

3. Визначають накопичені частоти для nобох груп.

4. Визначають накопичені частки, для nчого накопичені частоти діляться на число спостережень для кожної групи.

5. Розраховується різниця накопичених nчасток груп Х та У без врахування знаків.

6. Визначають максимальну різницю – Д = n0,55 (графа 8, табл. 9).

7. Визначають критерій λ²за nформулою:

8. Порівнюємо отриманий результат з nграничним значенням критерія Колмогорова-Смирнова. nЯкщо λ²більше граничного значення, різниця між порівнюваними nгрупами є суттєвою.

Для nданого завдання λ²= 1,28. Порівнюючи отриманий результат з граничним nзначенням λ²_0,05= 1,84 та λ²_{0,01 n}= 2,65, робимо висновок про несуттєвість nрізниці між порівнюваними групами.

Типи і загальна схема перевірки статистичних гіпотез

Типи статистичних гіпотез визначаються сукупністю тих завдань і методів їх розв’язання, які nмають місце в психолого-педагогічних дослідженнях. За своїм прикладним змістом nстатистичні гіпотези можна поділити на декілька основних типів щодо :

v закону розподілу випадкових величин тих чи інших властивостей;

v чисельних показників параметрів (середніх, дисперсій, кореляцій та ін.);

v однорідності двох або декількох вибірок

v відмінностей у рівні nознак досліджуваного явища або процесу;

v відмінностей у розподілі nознак.

Загальна схема перевірки nстатистичних гіпотез. Незважаючи на nрізноманітність типів гіпотез і критеріїв, схему перевірки статистичних гіпотез nможна представити у вигляді послідовності таких процедур:

1) формулювання гіпотез Н₀ і Н_і на основі завдань дослідження;

2) перевірка припущень nщодо відповідності розподілу параметричному сімейству, параметрів вибірки та nіншої додаткової інформації;

3) прийняття рівня nзначущості а;

4) вибір статистичного nкритерію;

5) розрахунки емпіричного nкритерію;

6) визначення області nкритичних значень критерію;

7) прийняття nстатистичного рішення;

8) формулювання nстатистичних висновків;

9) прийняття рішення щодо nпродовження (припинення) досліджень;

10) формулювання nзмістовних висновків.

У прикладній статистиці використовують два nстилі викладу методів перевірки гіпотез. За одним формулюють і нульову, і nальтернативну гіпотези (або набору гіпотез), перевірки яких відбувається за nпевними критеріями. При іншому стилі виклад будують як алгоритмічний опис nкритеріїв для перевірки нульової гіпотези, про альтернативи навіть не nзгадується. У посібнику пропонується перший варіант.

Метод стандартизації

Об’єктивне зіставлення загальних інтенсивних показників можливе nлише за умови якісної однорідності порівнюваних груп. Так, наприклад, показники nлетальності в двох опікових відділеннях можна порівнювати між собою за умови, nщо обидва стаціонари мають приблизно однаковий склад хворих за рядом основних nпараметрів – віком, статтю хворих, важкістю патології, термінами госпіталізації nі т.д. Якщо їх склад відрізняється, порівняння загальних інтенсивних nпоказників, які дають характеристику сили та поширеності явища, ускладнено. При nцьому на величину загального інтенсивного показника впливає склад оцінюваної nклініко-статистичної групи. Ігнорування впливу складу досліджуваних груп nнаселення на рівні смертності, народжуваності, захворюваності в окремих nрегіонах може призвести до хибних висновків.

При nпроведенні клінічних досліджень із вивчення ефективності певного методу nлікування також необхідно формувати однорідні в порівнянні групи.

Статистичний метод, що дозволяє виключити вплив nнеоднорідності складу порівнюваних груп на досліджувані загальні показники nназивається методом стандартизації. При використанні його розраховують nстандартизовані (умовні) показники, які могли б бути за умови однакового складу nнаселення в порівнюваних групах.

Практична nзначимість методу стандартизації:

· дозволяє порівняти частоту однотипних nявищ у неоднорідних групах;

· дозволяє оцінити вплив досліджуваного nфактора на величину загальних показників.

Оцінка nвпливу певного фактора на величину загальних інтенсивних показників базується nна динаміці співвідношення даних показників за умови змін в складі nдосліджуваних груп. Якщо умовна зміна складу порівнюваних груп за певним nкритерієм призводить до зміни співвідношення загальних інтенсивних показників n(зміну знаку між ними), то це дає можливість зробити висновок про значимість n(вплив) даного чинника для оцінки рівнів досліджуваних показників.

Існує три методи стандартизації: прямий, опосередкований та nзворотний. Вибір будь-якого з методів визначається формою представлення nпервинного матеріалу, зручністю та швидкістю розрахунків, даними попередніх nдосліджень. Прямий метод використовують при наявності даних про склад населення nта склад досліджуваного явища за певними параметрами (віком, професіями, nтермінами госпіталізації, тяжкістю захворювання і т.д.). Відсутність даних про nрозподіл певного явища, або незначна чисельність груп при даному розподілі, що nзнижує вірогідність погрупових показників, є умовами nдля використання опосередкованого методу стандартизації. Відсутність даних про nсклад населення обумовлює необхідність використання зворотного методу.

Найбільш поширеним в медико-біологічних nдослідженнях є прямий метод стандартизації.

Розглянемо методику його реалізації на прикладі частоти nускладнень після опіків у хворих з різними ступенями тяжкості патології (індекс nтяжкості опіків, наведений в умовних одиницях), що лікувалися в різних nстаціонарах. Щоб оцінити рівень якості лікування у двох стаціонарах, необхідно nвиключити неоднорідність складу хворих за цим індексом (табл. 10).

Порівняння nзагальних показників частоти ускладнень у двох стаціонарах дозволяє зробити nвисновок про більш високу частоту ускладнень в стаціонарі Б. Проте в стаціонарі nБ вища питома вага хворих з високими індексами тяжкості патології, що, відповідно, nможе обумовлювати високу частоту ускладнень. Враховуючи неоднорідність складу nхворих в досліджуваних стаціонарах, для визначення істинного співвідношення nчастоти ускладнень та оцінки якості медичної допомоги в обох відділеннях nнеобхідно порівняти склад хворих за ступенем тяжкості патології. Розрахунок nпроводиться за наступною схемою:

І етап – розрахунок погрупових та загальних nінтенсивних показників (табл. 10).

Таблиця 10

Частота ускладнень при опіках в стаціонарах А і Б (І етап)

Індекс тяжкості (умовні одиниці)

Стаціонар А

Стаціонар Б

Частота ускладнень

Число хворих

З них з ускладненнями

Число хворих

З них з ускладненнями

Стаціонар А (у %)

Стаціонар Б (у %)

До 10

250

300

8,00

7,33

11–20

450

9,33

9,11

21–30

120

250

18,33

18,0

31–40

220

29,41

27,27

Більше 40

100

50,0

44,0

Всього

935

124

1320

212

13,26

16,06

ІІ етап n– вибір та розрахунок стандарту.

Стандартом nє склад порівнюваних груп (в нашому випадку хворих з опіками), які умовно nберуться однаковими в порівнюваних групах. За стандарт можна взяти: 1) склад однієї nз порівнюваних груп; 2) сумарний або середній склад обох груп; 3) відомий склад nбудь-якої іншої групи. В нашому прикладі за стандарт беремо сумарний склад nхворих за тяжкістю патології в обох досліджуваних стаціонарах, припускаючи, що nсклад хворих за тяжкістю патології в обох стаціонарах відповідає розподілу, nобраному за стандарт (табл. 11).

Таблиця 11

Розрахунок nза прямим методом стандартизації (ІІ етап)

Індекс тяжкості

Число хворих

Число хворих (стаціонар А)

Число хворих (стаціонар Б)

Сумарно в обох стаціонарах

Розподіл за стандартом

До 10

250

300

550

24,4

11–20

450

900

39,9

21–30

120

250

370

16,4

31–40

220

305

13,5

Більше 40

100

130

5,8

Всього

935

1320

2255

100,0

ІІІ етап – nрозрахунок “очікуваного” числа хворих за стандартом.

Кожен nз досліджуваних стаціонарів має фактичні частоти ускладнень серед хворих з nрізним ступенем тяжкості патології. На даному етапі аналізу можна визначити, яке nчисло хворих з ускладненнями може бути виявлено в них за умови nстандартизованого (однакового) розподілу хворих. Розрахунок ведеться за nнаступною схемою: яке число хворих з ускладненнями могло б бути на 24,44 хворих nз індексом тяжкості до 10 в групі стандарту, якщо фактична частота ускладнень в nданій групі в стаціонарі А складає 8 випадків на 100 хворих і в стаціонарі Б – n7,3 випадки на 100 хворих.

Стаціонар А

8,0 – 100

х – 24,44

х = 1,95

Стаціонар Б

7,3 – 100

х – 24,44

х = 1,78

Повний nрозрахунок “очікуваного” числа хворих відповідно до стандарту наведено в табл. n3.

IV етап – nобчислення стандартизованих показників (табл. 12).

На nцьому етапі знаходимо підсумок результатів, розрахованих на попередньому етапі nза всіма групами для відповідних стаціонарів. Сума “очікуваних” чисел є nстандартизованими за індексом тяжкості показниками частоти ускладнень для обох nстаціонарів.

Вони nскладають: для стаціонару А – 15,54; для стаціонару Б – 14,60 випадки на 100 nхворих.

Таблиця 12

Розрахунок nза прямим методом стандартизації (ІІІ та IV етапи)

Індекс тяжкості

Частота ускладнень

Розподіл за стандартом

Число хворих з ускладненнями за стандартом

Стаціонар А

(%)

Стаціонар Б

(%)

Стаціонар А

Стаціонар Б

До 10

8,00

7,33

24,4

1,95

1,79

11–20

9,33

9,11

39,9

3,72

3,63

21–30

18,33

18,0

16,4

3,00

2,95

31–40

29,41

27,27

13,5

3,97

3,68

Більше 40

50,0

44,0

5,8

2,90

2,55

Всього

13,26

16,06

100,0

15,54

14,60

IV етап

Висновок. За умови однакового nскладу хворих за індексом тяжкості патології при опіках в обох стаціонарах частота nускладнень була б вищою в стаціонарі А. Отже, рівень якості nлікувально-профілактичної допомоги вищий в стаціонарі Б. Високий фактичний nрівень частоти ускладнень в стаціонарі Б, визначений на І етапі, можна пояснити nбільшою частотою госпіталізації хворих з високими індексами тяжкості патології. nЗміна співвідношення між фактичними та стандартизованими показниками свідчить nпро вплив досліджуваного фактора на рівні загальних інтенсивних показників – nчастота ускладнень при опіках залежить від складу хворих за індексом тяжкості в nдосліджуваних стаціонарах.

Практичне nпорівняння розрахунків, проведених за різними методами стандартизації дозволяє nзробити висновок про високу точність результатів при прямому та nопосередкованому та дещо меншу їх точність при зворотному методі nстандартизації.

Прямий метод стандартизації.

Розподіл nхворих і померлих по відділеннях лікарні №1 і №2.

(дані умовні)

Відділення

Лікарня № 1

Лікарня № 2

Число хворих, що лікувалися

Із них померло

Летальність, %

Число хворих, що лікувалися

Із них померло

Летальність, %

Терапевтичне

600

5,0

200

6,0

Хірургічне

300

2,0

700

3,0

Інфекційне

100

4,0

100

5,0

Всього

1000

Летальність, %

4,0

3,8

За nстандарт приймаємо півсуму хворих по кожному nвідділенні лікарні №1 і лікарні № 2.

І етап стандартизації (розрахунок інтенсивних показників, в даному випадку nлетальності) в двох сукупностях (в %):

По nкожному відділенні

Якщо nіз 600 хворих терапевтичного відділення лікарні №1 померло 30, то показник nлетальності = і т.д. по всіх відділеннях лікарні №1 і №2.

Показники летальності.

Відділення

Лікарня №1

Лікарня №2

Терапевтичне

30 ÷ 600 · 100 = 5,0

12 ÷ 200 · 100 = 6,0

Хірургічне

6 ÷ 300 · 100 = 2,0

21 ÷ 700 · 100 = 3,0

Інфекційне

4 ÷ 100 · 100 = 4,0

5 ÷ 100 · 100 = 5,0

По лікарні в цілому

4,0

3,8

2 етап визначення стандарту (за стандарт приймаємо півсуму nхворих по кожному відділенні лікарні №1 і лікарні № 2.

Розрахунок стандарту.

Відділення

Стандарт (число хворих)

Терапевтичне

(600 (л-ня №1) + 200 (л-ня №2)) ÷ 2 = 400

Хірургічне

(300 + 700) ÷ 2 = 500

Інфекційне

(100 + 100) ÷ 2 = 100

Всього

(1000 + 1000) ÷ 2 = 1000

або 400 + 500 + 10 = 1000

3 етап – розрахунок очікуваних величин (в даному випадку числа померлих) в nкожній групі стандарту.

Якщо nіз 600 хворих терапевтичного відділення лікарні №1 померло 30, то скільки nпомерло б, якби число хворих, що лікувалися = 400 (стандарт).

600 – n30

400 – nх х n= 20 і так по всіх відділеннях лікарні №1 і №2.

Розрахунок очікуваних величин.

Відділення

Очікуване число померлих

Лікарня № 1

Лікарня № 2

Терапевтичне

600 – 30

х = 20

200 – 12

х = 24

400 – х

Хірургічне

300 – 6

х = 10

700 – 21

х = 15

500 – х

Інфекційне

100 – 4

х = 4

100 – 5

х = 5

100 – х

Всього

4 етап – розрахунок стандартизованих показників.

Із n1000 хворих. що лікувалося в лікарні №1 і очікуване число померлих – 34, таким nчином. Показник летальності в лікарні №1 = 1000 – 34

100 – х х = 3,4.

В nлікарні № 2: 1000 – 44

100 – х х = 4,4

Це і є стандартизовані показники, тобто показники, nрозраховані при умові, що склад хворих в кожній із лікарень однаковий n(стандартний).

Аналіз летальності:

1. nПоказник летальності в цілому по лікарні №1 вищий, ніж по лікарні № 2 n(4,0% 3,8%).

2. nПоказник летальності по всіх відділеннях навпаки вищі в лікарні №2 (6,0 і 5,0); n(3,0 і 2,0); (5,0 і 4,0).

3. nБільш високий показник летальності в лікарні №1 пояснюється різницею в складі nхворих і переважанням в ній хворих терапевтичного профілю, які мають саму nвисоку летальність, а більш низький показник летальності в лікарні № 2 nобумовлений переважанням в ній хворих хірургічного профілю, що мають саму nнизьку летальність.

Висновок:

Стандартизований показник летальності вищий в лікарні № 2. nТаким чином, якби склад хворих в лікарні №1 і №2 був однаковим, то летальність nбула б вища в лікарні № 2.

Стандартизація (прямий nметод)

При nпрямій стандартизації за стандарт приймаємо склад населення і вважаємо, що він nоднаковий в обох сукупностях. Через стандарт визначаємо „очікуване” nчисло хворих (померлих, інвалідів і т.д.) для кожної із сукупностей.

Наприклад, nпри порівнянні діяльності двох дитячих лікарень (№1 і №2) виявили відмінності nне тільки в показниках летальності (4,2 і 3,1% відповідно), але і у віковому nрозподілі дітей, що лікувалися. В зв’язку з тим, для вияснення істинних nвідмінностей показників летальності необхідно усунути різницю вікового складу nхворих. За nстандарт можна взяти віковий склад nякогось третього закладу, склад одного із порівнюючих nзакладів, сумарний віковий склад обох лікарень (або їх півсуму) nі т.д.

Приклад 2.

Вік

Лікарня № 1

Лікарня № 2

Стандарт

„Очікуване” число померл. в стандарт.

К-сть хворих

К-сть померлих

Леталь-ність

К-сть хворих

К-сть померлих

Леталь-ність

К-сть хворих

S, %

Л-ня №1

Л-ня №2

0-3

4-7

7-14

1500

500

6,0

2,0

1,0

500

1500

8,0

3,0

1,5

2000

1000

2000

2,4

0,4 +

0,4

3,2

0,6 +

0,6

Всього

2500

105

4,2

2500

3,1

5000

100

3,2

4,4

„Очікуване” число померлих в стандарті для дітей у віці до 3-х років nдорівнює: в лікарні №1: n в лікарні n№2:

Аналогічно nвираховуються „очікувані” числа для інших вікових nгруп.

Для отримання стандартизованих показників „очікувані” числа сумуємо: 2,4 + 0,4 + 0,4 = 3,2 – S – nпоказник летальності в лікарні №1.

3,2 + 0,6 + 0,6 = 4,4 – S – показник летальності в лікарні №2.

Висновок:

Після стандартизації летальність вища у лікарні №2. таким nчином, якби віковий склад хворих, що лікувалися у лікарнях №1 і №2 був nоднаковий, то летальність була б вища у лікарня №2.

2) Метод непрямої nстандартизації показників застосовується в 2-х випадках:

– при відсутності даних про склад хворих, nпомерлих, тобто чисельника інтенсивного показника;

– при nнаявності малих чисел явища, що вивчається.

3) Зворотній nметод стандартизації використовується nпри відсутності даних про склад населення, тобто знаменника для розрахунку nпоказників.

Найбільш nчасто застосовується прямий метод. Суть прямого методу стандартизації полягає в nобчисленні показників, які мали б місце, якщо склад сукупностей був би nоднорідним (по віку, статі, або іншій ознаці).

загалом

Приклад 3.

Середні nстроки лікування міських і сільських мешканців.

За nвіком

0-14

15-49

50 і >

0-14

15-49

50 і >

Середня тривалість лікування по вікових групах

Кількість осіб, що лікувалися

1). nЕтап – розрахунок повікових показників (у таблиці: n18, 21, 23 – однакові по місту і селу).

2). Обчислення nстандарту по віку серед осіб, що лікувалися. За стандарт приймаємо півсуму осіб, що лікувалися у місті і на селі.

М+С

0-14

15-49

50 і >

30 + 25 = 55

50 + 25 = 75

20 + 50 = 70

55 ÷ 2 = 27,5

стандарт

75 ÷ 2 = 37,5 стандарт

70 ÷ 2 = 35,0

стандарт

3). nРозрахунок стандартизованого показника для міста:

Всі, nщо лікувалися приймаємо за 100%

4). nРозрахунок стандартизованого показника для села:

Після nстандартизації отримали однакові показники.

Висновок: різниця в строках лікування в 2 дні nпов’язана з віком (більша доля осіб похилого віку на селі).

Порівняння показників у сукупностях, що відрізняються своєю nструктурою, потребує їхньої стандартизації, цебто поправки за умови, що nструктура сукупностей буде зведена до єдиного стандарту.

Визначення стандарту

Відділення

Лікарня № 1

Лікарня № 2

Стандарт

Число хворих

Загальне число хворих

Терапевтичне

2100

64,8

970

32,6

3070

49,4

Хірургічне

560

17,3

990

33,2

1550

24,9

Гінекологічне

580

17,9

1020

34,2

1600

25,7

Разом

3240

100,0

2980

100,0

6220

100,0

Розрахуємо nпересічні терміни лікування в обох лікарнях за умови, що структура госпіталізованих nу них була б однаковою.

Відділення

Стандартний розподіл хворих, %

Лікарня № 1

Лікарня № 2

стандартний розподіл множимо на термін лікування і ÷ на 100

Терапевтичне

49,4

49,4 × 15,8 ÷ 100 = 7,8

49,4 × 16,8 ÷ 100 = 8,3

Хірургічне

24,9

24,9 × 9,5 ÷ 100 = 2,4

24,9 × 9,8 ÷ 100 = 2,4

Гінекологічне

25,7

25,7 × 7,0 ÷ 100 = 1,8

25,7 × 7,5 ÷ 100 = 1,9

Разом

100,0

Стандартний показник 12,0

Стандартний показник 12,6

Висновок: за умови однакової структури nгоспіталізованих хворих середня тривалість лікування вища у лікарня № 2.

Граф логічної nструктури теми «МЕТОД nСТАНДАРТИЗАЦІЇ»

nА Л Г О Р И Т М

РОЗРАХУНКУ nСТАНДАРТИЗОВАНИХ ПОКАЗНИКІВ ПРЯМИМ МЕТОДОМ

Вимірювання кореляційного звязку

Всі зміни, що відбуваються в nприроді, є взаємопов’язаними та взаємообумовленими. Мінливість певної ознаки, як наслідок зміни nінших параметрів, в свою чергу обумовлює мінливість інших ознак. Проте вказана nзалежність в окремих ситуаціях проявляється по-різному. Так, якщо зміна одного параметра на певну величину, nзавжди призводить до зміни іншого також на певну фіксовану величину, можна nговорити про функціональну залежність між nними. Такий взаємозв’язок часто має місце при вивченні хімічних та фізичних nявищ (закон Бойля-Маріотта), в математиці, геометрії n(зміна радіуса на певну величину призведе до зміни довжини кола також на певну nфіксовану величину).

В медико-біологічних дослідженнях nзалежність між окремими параметрами не має функціонального зв’язку – певному nзначенню одного параметра може відповідати декілька значень іншого, що можна nвизначити як кореляційний зв’язок. При зміні однієї ознаки неможливо nабсолютно прогнозувати величину, на яку зміняться інші. Прикладом такої nзалежності є вага та зріст дітей, тяжкість патології та терміни лікування, nконцентрація шкідливих речовин в робочій зоні та рівень захворюваності nпрацівників, число еритроцитів і вміст гемоглобіну та інші.

Визначення характеру зв’язку між певними параметрами nпроводять шляхом розрахунку коефіцієнта кореляції, який залежно від його nхарактеру та форми представлення даних може бути розрахований різними методами.

1. Коефіцієнт парної кореляції nвідображає характер зв’язку двох ознак. Він може бути розрахованим при nзіставленні двох рядів у вигляді рангового коефіцієнта кореляції ( ρ ) і nлінійного коефіцієнта кореляції (r). Парний коефіцієнт кореляції дає nхарактеристику узагальненого, “неочищеного” зв’язку між параметрами. nПри цьому можливий вплив інших факторів, які не враховуються, тому самостійна nцінність парного коефіцієнта невисока і його розрахунок є одним з елементів nкореляційно-регресійного аналізу.

2. Множинний коефіцієнт кореляції (R) – nвизначає взаємозв’язок між трьома та більше ознаками і показує ступінь впливу nкожної з них.

3. Парціальний коефіцієнт кореляції n(розрахунок проводиться на основі парних та множинного коефіцієнтів кореляції) n– відображає “чистий” взаємозв’язок між конкретним фактором та рівнем nздоров’я, виключаючи вплив інших.

Кореляційна залежність nвідрізняється за направленістю, силою та формою зв’язку (табл. 13).

Лінійність nзв’язку має першочергове значення при попарному порівнянні факторів, але nвтрачає свою значимість при багатофакторних моделях. Направленість зв’язку nвизначається за алгебраїчним знаком коефіцієнта кореляції, сила зв’язку – за nабсолютним значенням коефіцієнта кореляції. Якщо r = 0, можна говорити про nвідсутність зв’язку, а при r = 1 – про функціональний зв’язок між nдосліджуваними факторами.

Таблиця 13

Кореляційна залежність за nнаправленістю, силою та формою зв’язку

Форма зв’язку

Прямолінійна – рівномірна зміна одного параметра відповідає рівномірним змінам іншого параметра (при незначних коливаннях)

Криволінійна – рівномірна зміна одного параметра відповідає нерівномірним змінам іншого параметра (нерівномірність має певну закономірність)

Направленість зв’язку – визначається за знаком коефіцієнта кореляції

Прямий зв’язок (позитивний) – динаміка параметрів є однонаправленою – збільшення одного параметра обумовлює збільшення іншого (зростання екологічного навантаження обумовлює зростання рівня захворюваності населення)

Зворотний зв’язок (негативний, від’ємний) – динаміка параметрів є різнонаправленою – збільшення одного параметра обумовлює зменшення іншого (при збільшенні віку дітей спотерігається зниження рівня захворюваності)

Сила зв’язку

Слабка

r = 0,01 – 0,29

Середня

r = 0,30 – 0,69

Сильна

r = 0,70 – 0,99

Ранговий nкоефіцієнт кореляції (Спірмена) відноситься до nнепараметричних критеріїв оцінки взаємозв’язку. Особливість коефіцієнта – nпростота обчислення при недостатній точності дозволяє його використовувати для nорієнтовного аналізу з проведенням швидких розрахунків, при визначенні даних у напівкількісному, описовому вигляді. Він базується на nвизначенні рангу кожного значення ряду. Методику розрахунку наведено на nприкладі характеристики взаємозв’язку між рівнем перинатального nризику у вагітних та частотою післяпологових ускладнень (табл. 14).

Порядок nрозрахунків:

1. Визначаємо ранги для nзначень кожної величини ряду (х) та (у). Рангування nобох рядів повинно бути однонаправленим, наприклад, nвід меншого до більшого.

2. Визначаємо відхилення nзначень першого ряду від другого (d_ху). Їх nсума з врахуванням знаків повинна дорівнювати нулю.

3. Підносимо отримані nрезультати до квадрата та визначаємо їх суму (Σd²_хуⁿ= 4).

Таблиця 14

Перинатальний ризик (бали)

Частота післяпологових ускладнень (%)

Порядкові номери (ранги)

Різниця рангів

Квадрат різниці рангів

d_ху = x – y

d²_ху

До 2

0,4

3–4

0,8

–1

5–6

0,6

7–8

1,4

–1

9–10

1,3

Σd²_ху= 4

4. Підставляємо отримані nрезультати у формулу:

Висновок: між рівнем перинатального ризику вагітних та частотою післяпологових nускладнень виявлено сильний, прямий кореляційний зв’язок.

Похибка nрангового коефіцієнта кореляції для нашого випадку (n<30) визначається за nформулою:

При nвеликому числі спостережень (n>30) середня похибка рангового коефіцієнта nкореляції може бути визначена за формулою:

Оцінка nвірогідності коефіцієнта кореляції проводиться за тими ж принципами, що використовуються nдля інших показників з розрахунком критерію вірогідності (t) і врахуванням nчисла спостережень (число ступенів свободи варіаційних рядів n`=– 2). Отримані результати порівнюють з табличними nзначеннями. Загалом, слід пам’ятати, що для оцінки вірогідності результатів nкоефіцієнт кореляції повинен перевищувати свою похибку не менше ніж в 2,5-3 nрази при достатньому числі спостережень.

Для нашого випадку m_{ρ n}= 0,346 і t = ρ/m_ρ= 0,80/0,346 = 2,31, що, відповідно, nнижче граничних значень (t = 3,2 при p<0,05). Отриманий результат (t) не nдозволяє зробити висновок про вірогідність даного рангового коефіцієнта nкореляції. Доцільним в даному випадку є використання більшого числа nспостережень.

Спрощений метод оцінки nрангового коефіцієнта кореляції передбачає порівняння його з критичним nтабличним значенням для відповідного числа пар спостережень. Коефіцієнт nкореляції є значимим з вірогідністю похибки не вище 5 % (p<0,05), якщо nотриманий результат вище чи дорівнює табличному значенню. Для нашого прикладу nдля 5 пар спостереження табличне значення ρ = 0,900 (при p<0,05), що nвище фактичного значення. Отже, отриманий результат не можна вважати суттєвим.

Для розрахунку nкоефіцієнта прямолінійної кореляції існує багато методів. Вони визначаються nметою, характером та об’ємом дослідження, наявністю обчислювальної техніки. nОдин з методів був запропонований К. Пірсоном, в nнауковій літературі відомий як лінійний коефіцієнт кореляції Пірсона. Формула його розрахунку така:

де: х і у – nваріанти порівнюваних варіаційних рядів; d_x ni d_y – відхилення кожної варіанти від nсвоєї середньої арифметичної.

Наприклад: визначити nзалежність між тривалістю паління (роки) та частотою виявлення хронічних nбронхітів у молодому віці (до 29 років).

Таблиця 15

Тривалість паління (роки) (х)

Частота хронічних бронхітів (%) (у)

d_x

d_y

d_x*d_y

d_x²

d_y²

6,0

–3,5

–11,0

38,5

12,25

121,0

9,0

–2,5

–8,0

20,0

6,25

64,0

12,0

–1,5

–5,0

7,5

2,25

25,0

13,0

–0,5

–4,0

2,0

0,25

16,0

14,0

0,5

–3,0

1,5

0,25

9,0

21,0

1,5

4,0

6,0

2,25

16,0

26,0

2,5

9,0

22,5

6,25

81,0

35,0

3,5

18,0

63,0

12,25

324,0

Σ=52

Σ=136

Σd_x=0

Σd_y=0

Σd_x*d_y=161

Σd_x²=42

Σd_у²=656

`Х_х=6,5

`Х_у=17

Розрахунок nлінійного коефіцієнта кореляції:

1. Визначають середні nзначення для кожного ряду (Х_х,`Х_у).

2. Визначають відхилення кожного nіз значень ряду від середньої величини d_x ni d_y.

3. Підносять визначені nвідхилення до квадрату та визначають їх суми: Σd_x²=42 nта Σd_у²=656.

4. Підставивши отримані nзначення у формулу Пірсона, отримаємо:

Висновок: між тривалістю nпаління в молодому віці та частотою хронічних бронхітів існує сильний прямий nзв’язок.

Вірогідність отриманого nрезультату визначимо за співвідношенням t = r / m_r, nде m_r при малому числі спостережень n(n<30) дорівнює:

Для нашого випадку nкоефіцієнт вірогідності:

t =

0,97

9,7,

m_r

0,1

що значно вище гранично nдопустимих значень при вірогідності похибки p<0,05.

При великому числі nспостережень (n>30) формула для розрахунку середньої похибки коефіцієнта nкореляції має інший вигляд:

Прямолінійний nкореляційний зв’язок між параметрами характеризується тим, що кожному з nоднакових вимірів одного показника відповідає певне середнє значення іншого nпоказника. Дану залежність можна описати коефіцієнтом регресії. Він показує, nна яку величину в середньому зміниться другий параметр при зміні першого на nпевну одиницю виміру.

Розраховується nкоефіцієнт регресії за формулою:

R_у_/х = r_ху nx (σ_у / σ_x)

де: R_x_/y n– коефіцієнт регресії ознак х по у;

r_xy – коефіцієнт кореляції;

δ_х та δ_у n– середні квадратичні відхилення рядів (х) та (у).

Розглянемо nвикористання коефіцієнта регресії на прикладі.

При аналізі даних nфізичного розвитку 7-річних хлопчиків отримані наступні параметри фізичного nрозвитку за зростом (`Х_х) та вагою (`Х_у):

`Х_х = 120,0 см; δ_х= 6,0 см та `Х_у = 26,0 кг; δ_у= 2,2 кг; r_xy= 0,76.

Отже, при зміні зросту на n1 см вага хлопчиків в середньому зміниться на 0,28 кг. Визначений коефіцієнт nрегресії можна використати в рівнянні регресії при прогнозуванні ситуації – яка nвага в середньому буде відповідати зросту хлопчиків 125,0 см:

Коефіцієнти регресії досить широко використовуються nдля побудови рівнянь регресії при розробці багатьох медико-соціальних та nклінічних проблем, в тому числі для оцінки фізичного розвитку дітей та підлітків. nДані рівняння являють собою математичну модель, яка описує характер nвзаємозв’язку між досліджуваними параметрами. Це особливо актуально при nпобудові багатофакторних моделей і прогнозуванні рівнів результативного nпараметра системи при фіксованих рівнях окремих компонентів (показників).

Наведені вище методики розрахунку парних коефіцієнтів nкореляції є основою і лише першим етапом багатофакторного кореляційного nаналізу. Парні коефіцієнти показують характер зв’язку (загального, n”неочищеного”) між досліджуваними параметрами без врахування впливу nінших факторів. Оцінка “чистого” взаємозв’язку в багатофакторних nмоделях визначається на основі парціальних коефіцієнтів кореляції. nОсновою для їх розрахунку є парні коефіцієнти. Множинний коефіцієнт nкореляції відображає зв’язок одночасно комплексу факторів з досліджуваним nрезультативним фактором (клінічними показниками та ін.).

nЩе одним параметром nбагатофакторного кореляційного аналізу є коефіцієнт детермінації, який nвідображає питому вагу (%) впливу факторів, що вивчаються (факторіальні nознаки), на рівень результативних ознак (показники здоров’я населення, клінічні nпоказники та інші).

Методики практичної реалізації багатофакторного nаналізу не розглядаються в даному розділі, тому що вони є досить об’ємними та nшироко наведені в спеціальній літературі. Враховуючи значні об’єми розрахунків, nреалізація багатофакторного кореляційного аналізу не можлива без використання nобчислювальної техніки. Дані методики реалізовані в багатьох пакетах прикладних nпрограм: SPSS, STATISTICA, STADIA, AXUM, MULTIFAC, STATGRAPHICS plus, SAS та інших. Їх повноцінне використання в клінічних nта медико-соціальних дослідженнях не можливе без знань основ медичної nстатистики.