Home » Характеристика та аналіз статистичних даних

Характеристика та аналіз статистичних даних

28 Червня, 2024

ХАРАКТЕРИСТИКА ТА АНАЛІЗ СТАТИСТИЧНИХ ДАНИХ. СЕРЕДНІ ВЕЛИЧИНИ ТА ПОКАЗНИКИ ВАРІАЦІЇ.

ПАРАМЕТРИЧНІ ТА НЕПАРАМЕТРИЧНІ МЕТОДИ ОЦІНКИ ТА АНАЛІЗУ СТАТИСТИЧНИХ ГІПОТЕЗ.

АНАЛІЗ ВЗАЄМОЗВ’ЯЗКУ МІЖ ДОСЛІДЖУВАНИМИ ПАРАМЕТРАМИ СТАТИСТИЧНИХ СУКУПНОСТЕЙ.

Вибіркове спостереження

З усіх видів несуцільного спостереження в практиці статистичних досліджень найбільше визнання і застосування дістало вибіркове спостереження.

Вибірковим спостереженням називають вид несу цільного спостереження, за характеристикою відібраної частини одиниць якого судять про всю сукупність.

Розрізняють генеральну і вибіркову сукупності.

Генеральною сукупністю називають загальну масу одиниць, з якої здійснюють відбір для дослідження.

Частину генеральної сукупності, яку відібрано для обстеження, називають вибірковою.

Обсяг генеральної сукупності позначають N, вибіркової – n.

Узагальню вальними показниками генеральної сукупності є: середній розмір ознаки , частка Р, генеральна дисперсія ; в разі вибіркової сукупності: середні вибіркова, вибіркова частка W і дисперсія.

Вибірковий метод відрізняється від інших видів несу цільного спостереження двома ознаками – наперед визначають:

1) яку частину одиниць генеральної сукупності треба обстежувати;

2) послідовність відбору одиниць, який достатньою мірою відтворює (репрезентує) розміри середніх і відносних показників генеральної сукупності.

До вибіркового спостереження статистика вдається у випадках, коли потрібно у стислі строки та з мінімальними затратами праці і коштів одержати кількісні характеристики досліджуваної сукупності, або коли не можна чи недоцільно здійснювати суцільне спостереження.

Існує ціла низка причин, унаслідок яких у багатьох випадках вибірковому спостереженню надається перевага перед суцільним. Серед них найсуттєвіші це: економія часу і засобів унаслідок скорочення обсягу робіт статистичного дослідження; зведення до мінімуму псування чи знищення досліджуваних об’єктів; забезпечення детальнішого вивчення кожної одиниці спостереження за неможливості охоплення всіх одиниць; досягнення високої точності результатів обстеження за рахунок зменшення помилок реєстрації.

Вибіркове спостереження застосовують також у поєднанні з суцільним для поглиблення дослідження або для вивчення і контролю результатів суцільного спостереження.

Етапи вибіркового спостереження:

1) обґрунтування мети вибіркового спостереження;

2) складання програми спостереження і розробка відповідних даних;

3) вирішення організаційних питань щодо спостереження;

4) визначення частки і способу відбору одиниць у вибіркову сукупність;

5) здійснення відбору;

6) реєстрація ознак досліджуваних одиниць;

7) узагальнення даних спостереження та визначення їхніх вибіркових характеристик;

8) обчислення похибок вибірки;

9) поширення кількісних характеристик вибіркового спостереження на всю сукупність.

Завдання, які вирішує вибіркове спостереження:

1) визначення середнього розміру досліджуваної ознаки;

2) визначення питомої ваги (частки) досліджуваної ознаки в певній сукупності;

3) визначення середньої та граничної похибки вибірки;

4) знаходження меж для середньої і частки при повторному і без повторному відборі;

5) визначення потрібної чисельності вибірки;

6) поширення даних вибіркового спостереження на всю сукупність.

Науковим обґрунтуванням можливості застосування вибіркового спостереження є діалектична єдність одиничного, особливого і загального, згідно з якою в кожному одиничному є риси особливого і загального, а загальне має риси одиничного і особливого. Це дає змогу за одиничним і особливим судити про загальне, за частиною – про ціле, якщо правильно знайдено зв’язок між ними.

Особливістю вибіркового спостереження порівняно з іншими видами несу цільного спостереження є те, що відбір одиниць у вибіркову сукупність забезпечує рівну можливість потрапляння кожної одиниці у вибірку. Це досягається шляхом неупередженого строгого випадкового відбору за схемами, розробленими в математичній статистиці.

Відповідь на запитання про те, з якою ймовірністю можна судити про збіг між генеральними і вибірковими узагальню вальними показниками, дає теорія вибіркового методу, що ґрунтується на основі закону великих чисел. За допомогою цього закону вирішують два взаємопов’язаних завдання:

– розраховують при заданій імовірності межі можливих відхилень вибіркового показника від відповідного показника в генеральній сукупності;

– визначають імовірність перевищення встановленої межі можливими відхиленнями вибіркового показника від генерального.

Масові явища, які вивчає статистика, перебувають під впливом багатьох випадкових чинників. Тому, використовуємо основний висновок граничних теорем ймовірності про те, що сукупна дія багатьох випадкових факторів приводить за деяких умов до результату, майже незалежного від випадку. Оскільки вибіркове спостереження пов’язане з випадковими відхиленнями характеристик вибіркової і генеральної сукупностей, то основне положення граничних теорем дає змогу стверджувати, що результати вибіркового спостереження достовірні в разі достатньо великої кількості відібраних одиниць. За цих умов вибіркові характеристики надійно відтворюють генеральні характеристики.

У разі масового спостереження розподіл емпіричних частот більшості явищ підпорядковується закону нормального розподілу. За будь-якого розподілу частот у генеральній сукупності їхні вибіркові середні мають розподіл, близький до нормального.

Доведено, що за нормального розподілу більшість величин зосереджена навколо генеральної середньої. Близько 68,3% чисельності вибіркової середньої лежить у межах генеральної середньої; 95,4% цієї чисельності – в межах і 99,7% – не виходить за межі . Нормальний розподіл указує на частоту виникнення похибок даного розміру середньої.

Випадкові похибки реєстрації при великому числі спостережень не впливають суттєво на результат дослідження, оскільки вони взаємно погашаються, а тому від них можна абстрагуватись і в подальшому розглядати тільки похибки вибірки. Принцип строгої випадковості, який покладено в основу вибірки, забезпечує її об’єктивність, дає змогу встановити межі можливих похибок і дістати майже достовірні дані для характеристики всієї сукупності явищ. Таку вибіркову сукупність називають представницькою, або репрезентативною сукупністю. До її складу входять представники всіх груп генеральної сукупності.

Точність результатів вибіркового спостереження нарешті залежатиме від способу відбору одиниць, ступеня коливання ознаки в сукупності та від кількості відібраних одиниць.

Варіаційні ряди розподілу

Різноманітність статистичних сукупностей – передумова різних форм співвідношення частот і значень варіаційної ознаки. За своєю формою ряди розподілу поділяються на одно-, дво- і багатовершинні. Наявність двох і більше вершин свідчить про неоднорідність сукупності, про поєднання в ній груп з різними рівнями ознаки. Розподіли якісно однорідних сукупностей переважно одновершинні. Серед одновершинних розподілів є симетричні та асиметричні (скошені), гостро- і плосковершинні.

Якщо частоти варіантів рівновіддалені від центра значень ознаки, такий варіаційний ряд називається симетричним, якщо ж вершина розподілу зміщена, тобто частоти по обидва боки від центра змінюються неоднаково, тоді варіаційний ряд називається асиметричним, або скошеним. Розрізняють правосторонню і лівосторонню асиметрії. Напрям асиметрії протилежний напряму зміщення вершини розподілу. В разі правосторонньої асиметрії вершина розподілу зміщена вліво, при лівосторонній – вправо. Асиметрія – результат обмеженої варіації ознак в одному напрямі або вплив переважної причини розвитку явища, яка відповідає за зміщення центра його розподілу.

Відхилення між середньою арифметичною і медіаною або модою виражають міру асиметрії. В симетричному розподілі необхідною умовою є рівність трьох характеристик: середньої арифметичної, моди і медіани:

У разі чіткої асиметрії варіаційного ряду для глибшого вивчення економічних явищ середнє значення ознаки має доповнюватися модою і медіаною.

Стандартизоване відхилення свідчить про незначну лівосторонню асиметрію, а тому розподіл посівних площ гречки за врожайністю можна вважати симетричним.

Крутість варіаційного ряду, тобто його високовершинність (гостровершинність) або низьковершинність (плосковершинність) називають ексцесом. Розподілам більш гостровершинним, ніж нормальним, відповідає позитивний ексцес, а більш плоско вершинним – від’ємний. На практиці в одному розподілі часто поєднуються всі особливості: одновершинний розподіл може бути симетричним і високо вершинним або скошеним та низьковершинним.

За узагальнюючі характеристики як міру крутості розподілу використовують моменти. За їх допомогою можна описати будь-який розподіл.

Варіаційні розподіли у разі інтервальних або відносних типів вимірювань залежать від:

o характеру досліджуваної змінної – дискретна змінна, чи неперервна;

o діапазону значень змінної – вузький і невеликий, чи широкий і різноманітний.

Тому за технологією побудови варіаційні розподіли поділяють на розподіли незгрупованих і згрупованих варіант. З метою лаконічності домовимося їх називати незгрупованими і згрупованими розподілами. Для незгрупованих розподілів частоти мають відношення до безпосередніх значень варіант з варіативного ряду; для згрупованих розподілів – до груп (або інтервалів) значень варіант.

Середні величини

Середні величини відносяться до узагальнюючих показників.

У статистиці усі показники розподіляються на індивідуальні та середні. Індивідуальні показники завжди характеризують окремі одиниці сукупності. Усі суспільні явища, в тому числі й правові, мають масовий характер і обов`язково відносяться до статистичних сукупностей. Кожна одиниця сукупності відрізняється від інших її одиниць розмірами ознаки, яка вивчається в процесі дослідження, тому дати узагальнюючу характеристику статистичної сукупності можна тільки за допомогою середніх показників. Наприклад, щоб об`єктивно оцінити, на якому підприємстві вища заробітна плата, слід спочатку обчислити середню заробітну плату на кожному підприємстві і тільки потім їх порівняти.

Закон великих чисел іноді називають законом середньої величини. Дійсно, значення кожної окремої одиниці може істотно змінюватися під впливом різних умов. В нашому прикладі заробітна плата кожного окремого робітника розрізнюється залежно від стажу роботи, рівня кваліфікації, кількості відпрацьованого робочого часу та інших умов. Але якщо проаналізувати середню заробітну плату, то можна встановити тенденції її зміни і різницю в оплаті праці залежно від виду підприємства і проміжку часу, за який наведені дані. Обчислена середня величина характеризує найбільш типові закономірності у розвитку явища, абстрагуючись від тих відхилень, які властиві окремим одиницям сукупності.

Необхідність в обчисленні середньої величини обумовлюється тим, що суспільні явища, які вивчаються й правовою статистикою, завжди носять масовий характер, а ознаки у окремих одиниць сукупності відрізняються одна від одної, інакше кажучи, варіюють. Якщо припустити можливість існування сукупності, в якій у всіх одиниць будуть однакові розміри ознаки, то в такій сукупності середню величину обчислювати безглуздо.

Середня величина в статистиці – це узагальнюючий показник, який характеризує типовий розмір ознаки якісно однорідної сукупності в конкретних умовах простору і часу.

Головною передумовою для обчислення і застосування середніх величин є те, що вони не можуть обчислюватися для різнорідної сукупності. Це визначає, що наукове використання середніх величин базується на поєднанні його з методом групування: спочатку слід поділити сукупність на окремі групи, а лише після цього обчислювати середні величини для якісно однорідних груп сукупності та сукупності в цілому.

Середні величини дуже широко застосовуються для обчислення середнього рівня сукупності, порівняння двох або більше об`єктів, характеристики динаміки явищ, вивчення зв`язку між ними.

У правовій статистиці середні величини використовуються для: обчислення зміни у структурі злочинності; середньої кількості осіб, яка припадає на один злочин, характеристики зміни у середньому віці злочинців по окремих видах злочинів і по усій злочинності в цілому, для характеристики додержання процесуальних строків (середні строки попереднього слідства, розгляду кримінальних, цивільних та адміністративних справ), середньої величини збитків по окремих видах злочинів та інші показники.

Існують різні точки зору на визначення поняття середньої величини. Прихильники діалектичного підходу вважають, що в реальності існують різні індивідуальні одиниці, а середня величина лише абстракція, яка характеризує у загальному вигляді сукупність в цілому. На думку інших вчених, навпаки, – існує лише середня величина, а кожна окрема одиниця, яка відхиляється від середньої, – це атавізм або ненормальний стан. Звісно, що така точка зору значно спрощує статистичний аналіз – не треба вивчати окремі одиниці сукупності, достатньо вивчити лише середні величини та визначити тенденції їх зміни.

Нам здається, що точка зору прихильників діалектичного підходу є більш вірною. Представники багатьох наук вважають, що окрім встановлення елементарних математичних закономірностей, усі науки у своїх дослідженнях повинні виявляти статистичні, а не функціональні закономірності. Лише в елементарній математиці ми можемо одержати точний результат, а вже коли із чотирьох добуваємо квадратний корінь, то одержуємо два результати: зі знаком або мінус два, або плюс два.

Таким чином середній показник має лише оціночне значення. В правовій статистиці, де окремі явища часто є унікальними він ні в якому разі не може підмінювати, і тим більше замінювати, вивчення індивідуального. Крім того, індивідуальні явища характеризують розподіл сукупності і дають змогу встановити одиниці, які істотно відрізняються від інших одиниць.

Щоб встановити їх закономірності та особливості в розвитку явища загальна середня величина, обчислена для усієї сукупності, повинна доповнюватися вивченням середніх по окремих групах. У правовій статистиці дуже часто загальна середня величина по країні в цілому доповнюється середніми показниками по окремих регіонах. Взагалі середня величина є вельми небезпечним показником. Вона можна не тільки виявити, а і приховати закономірності розвитку явища.

Будь-яке статистичне дослідження, незалежно від його об’єму, крім оцінки відносного рівня досліджуваного явища чи його структури, завершується розрахунком та оцінкою узагальнюючих статистичних критеріїв. Найбільш поширеною формою статистичних показників є середні величини, які дають узагальнену кількісну характеристику певної ознаки в статистичній сукупності за певних умов місця та часу. Вони відображають типові риси варіаційних ознак досліджуваних явищ. Зважаючи на те, що кількісна характеристика ознаки пов’язана з її якісною стороною, середні величини слід розглядати тільки у світлі умов якісного аналізу. Крім узагальнюючої оцінки певної ознаки необхідність визначення середніх для сукупності мінливих кількісних величин виникає також тоді, коли порівнюють дві їх групи, які якісно відрізняються одна від одної.

В практиці охорони здоров’я середні величини використовують досить широко:

· для характеристики організації роботи закладів охорони здоров’я (середня зайнятість ліжка, термін перебування в стаціонарі, кількість відвідувань на одного мешканця та інше);

· для характеристики показників фізичного розвитку (довжина, маса тіла, окружність голови новонароджених та інше);

· для визначення медико-фізіологічних показників організму (частота пульсу, дихання, рівня артеріального тиску та ін.);

· для оцінки даних медико-соціальних та санітарно-гігієнічних досліджень (середнє число лабораторних досліджень, середні норми харчового раціону, рівень радіаційного забруднення та інші).

За допомогою середніх можна порівнювати між собою сукупності, що мають різну варіабельність ознак. Середні величини широко використовуються для порівняння у часі, що дозволяє характеризувати найважливіші закономірності розвитку явища. Так, наприклад, закономірність збільшення росту дітей певного віку знаходить своє вираження в узагальнених показниках фізичного розвитку. Закономірності динаміки (збільшення чи зменшення) частоти пульсу, дихання, клінічних параметрів при певних захворюваннях знаходять свій прояв у статистичних показниках, які відображають фізіологічні параметри організму та інше. При цьому в окремих індивідуальних випадках дана тенденція не завжди буде визначатися. Наприклад, при лабораторних дослідженнях діагностується загальне збільшення числа лейкоцитів, яке виявляють у певних осіб під впливом тих чи інших причин (радіаційне забруднення території). В різні роки рівень даного параметра може не збільшуватися, проявлятися неоднаково в регіонах внаслідок різних конкретних умов. У зв’язку з цим дуже важливо, щоб середні показники були обґрунтовані на масовому узагальненні фактів. Це дозволяє виявити загальну тенденцію та показати типовий для даного періоду часу та регіону рівень явища. В такій ситуації середні величини нівелюють випадкові відхилення індивідуальних величин від загальної тенденції, які притаманні генеральній сукупності. В цьому проявляється дія закону великих чисел.

Найчастіше при вивченні медико-біологічних даних використовуються:

· середня арифметична

· середня гармонійна

· середня геометрична.

Крім того, практичне застосування знаходять узагальнюючі описові (непараметричні) характеристики варіативних ознак – мода і медіана.

Середні величини повинні визначатися на основі масового узагальнення фактів та застосовуватися до якісно однорідних сукупностей – це основна умова їх практичного та наукового використання. Середні величини не можна визначати, якщо сукупність досліджуваних ознак, процесів, явищ складається з неоднорідних елементів. Обгрунтованість середніх величин набуває науково-практичного значення тільки за умови правильного групування. Основними вимогами при розрахунку середньої величини є якісно однорідна сукупність та достатнє число спостережень. Якісно однорідна сукупність означає, що всі її одиниці належать до одного виду явищ. Наприклад, число днів непрацездатності хворих за певною нозологічною формою, маса дітей – хлопчиків 7 років; пульс дітей одного віку при певному захворюванні та інше. Змішування сукупностей, які визначаються різними якісними ознаками, призводить до розрахунку нетипових середніх величин. Таким чином, середні величини в статистиці тільки тоді можуть бути основою наукового аналізу, коли відображають якісно однорідну сукупність. Якісна однорідність явищ, їх типовість, базується на основі теоретичного аналізу їх суті.

Обов’язковою умовою, якій повинен відповідати наявний статистичний матеріал для розрахунку середніх величин, є також достатнє число спостережень. Даний критерій можна визначити за допомогою формул, які представлені у розділі “Організація та проведення статистичного дослідження”.

Окремі елементи (значення) сукупності однорідних за якісним складом предметів, явищ, параметрів є варіантами, а всю їх сукупність можна представити у вигляді варіаційного ряду, який є основою для визначення середніх величин. Варіаційний ряд – це ряд варіант і відповідних їм частот. Варіаційні ряди дають можливість встановити характер розподілу одиниць сукупності за тією чи іншою кількісною ознакою та її варіацію – різноманітність індивідуальних значень ознак конкретних одиниць сукупності.

Окремі значення варіант певної ознаки позначаються літерою х. Число, яке показує, як часто зустрічається та чи інша варіанта у складі даного ряду, називається частотою (f). Сума частот (åf) дорівнює загальному числу спостережень (n).

Варіаційний ряд може бути простим, де кожна варіанта представлена окремо, тому частота кожної з них дорівнює одиниці. Наприклад, розподіл хворих за частотою пульсу: 68, 69, 75, 70, 65, 68, 70, 75, 74, 72, 72, 68. Даний ряд є також нерангованим, тому що варіанти не систематизовані. Систематизувавши варіанти в порядку збільшення чи зменшення їх числового значення, даний ряд можна перетворити в рангований: 65, 68, 68, 68, 69, 70, 70, 72, 72, 74, 75, 75.

Якщо варіанти згрупувати за їх абсолютним значенням, то можна отримати згрупований варіаційний ряд, де кожна варіанта представлена зі своєю частотою. Для нашого прикладу:

Наведений згрупований ряд є неінтервальним, тому що групування проведено без конкретного інтервалу за абсолютним значенням кожної варіанти.

Варіаційні ряди, де значення варіант представлено у вигляді інтервалів, називаються інтервальними. У вигляді інтервального ряду часто представляють ознаки зі значною кількістю варіант. При цьому значення кожної варіанти представлено у вигляді інтервалу (табл. 1).

Таблиця 1

Розподіл хлопчиків 7 років за зростом

Зріст (х)

Число хлопчиків (f)

125,0-126,9

127,0-128,9

129,0-130,9

131,0-132,9

Всього

n = 28

У наведеному прикладі (табл. 1) інтервали є закритими – кожен з них має верхню та нижню межу. В практиці зустрічаються відкриті інтервали (вік 60 років і старше, зріст до 120 см та інші). При аналізі ширину відкритого інтервалу, звичайно, вважають рівною ширині суміжного з ним інтервалу.

Згрупований інтервальний варіаційний ряд одержують шляхом об’єднання варіант у групи. При цьому потрібно пам’ятати, що: а) розмір варіаційних груп повинен залежати від природи явища; б) доцільно визначати однакові інтервали; в) межі варіаційних груп не повинні повторюватись.

Всі варіаційні ряди за якісною характеристикою розподіляються на дискретні (перервні), в яких варіанти можуть бути представлені тільки цілими числами чи отримані в результаті підрахунків (розподіл за частотою пульсу, числом ліжко-днів, відвідувань) та інкретні (безперервні), де варіанти можуть бути представлені як цілими, так і дробовими числами, або є результатом вимірів (табл. 1). Клінічні параметри є здебільшого прикладом інкретних варіант.

В процесі проведення дослідження питання про число варіаційних груп вирішують з огляду на характер матеріалу та чисельність сукупності. Характерні особливості розподілу не виявляться, якщо при незначному числі одиниць спостереження взяти велике число груп, або якщо число груп є недостатнім.

При використанні ЕОМ для обробки статистичних даних групування проводять за стандартними процедурами. Однією з них є формула Стерджеса для визначення оптимального числа груп:

n = 1 + 3,322 · lgN,

де:– число груп;

N – число одиниць спостереження.

Використання даної формули доцільне при великому числі одиниць спостереження.

Іншим варіантом, більш гнучким з практичної точки зору, є метод визначення амплітуди ряду. Для вирішення питання про число груп необхідно представити статистичну сукупність у вигляді рангованого ряду, тобто розташувати її одиниці в певному порядку. При чисельності сукупності менше 100 одиниць не доцільно планувати більше 10 груп.

Різниця між максимальним та мінімальним значенням варіант називається розмахом чи амплітудою (х_max – х_min).

Етапи складання інтервального варіаційного ряду такі:

· визначення амплітуди ряду;

· визначення числа груп;

· визначення величини інтервалу.

Розрахунок середніх величин базується на значеннях варіант. Якщо варіанта представлена у вигляді інтервалу, за величину її у кожному з них приймають центральну варіанту, тобто середину інтервалу. Для дискретного ряду центральна варіанта визначається як півсума одного інтервалу. Для інкретного ряду (табл. 1) нею є півсума початкових значень двох сусідніх інтервалів: (125,0 + 127,0) : 2 = 126 см.

Загальну характеристику варіаційного ряду проводять за допомогою наступних параметрів: середньої арифметичної (`Х), середнього квадратичного відхилення (d), середньої похибки середньої величини (m), коефіцієнта варіації (С), амплітуди (х_max – х_min).

Крім вказаних, у деяких випадках для характеристики ряду доцільно визначати також моду та медіану.

Мода – це варіанта, яка має найбільшу частоту. Моду використовують у тих випадках, коли потрібно дати характеристику ознаки, яка найбільш часто зустрічається в досліджуваній сукупності. Її використовують тільки у великих сукупностях.

Медіаною в статистиці називається варіанта, яка займає серединне (центральне) положення у варіаційному ряду. Медіана поділяє ряд навпіл – по обидва боки від неї знаходиться однакова кількість одиниць сукупності.

Середня арифметична – найбільш поширений за частотою використання вид середніх величин. Вона може бути простою і зваженою. Для простого варіаційного ряду, в якому кожна варіанта повторяється один раз, визначається проста середня арифметична, яка розраховується як відношення суми значень варіант до загального числа спостережень.

де: V – значення окремих варіант;

n – загальне число спостережень.

Для прикладу за частотою пульсу, наведеного вище, визначимо:

Для згрупованого варіаційного ряду визначається зважена середня арифметична. Таким чином:

Частота, з якою зустрічається кожна варіанта, називається “вага” варіанти, а середня арифметична є зваженою, тому що варіанти беруть участь у загальній сумі неодноразово, а ніби зважено за числом відповідних частот.

При визначенні середньої арифметичної для згрупованого інтервального варіаційного ряду: 1) визначають середину інтервалу, як вказано вище; 2) визначають добуток кожної центральної варіанти на відповідну для неї частоту; 3) суму добутків ділять на число спостережень.

Важливі властивості середньої арифметичної:

· Добуток середньої на суму частот завжди дорівнює сумі добутку варіант на частоту.

· Якщо від кожної варіанти відняти якесь довільне число, то нова середня зменшиться на те ж число.

· Якщо до кожної варіанти додати якесь довільне число, то середня збільшиться на те ж число. Друга та третя властивості середньої арифметичної показують, що при зменшенні чи збільшенні варіант на одне і те ж число зменшується чи збільшується рівень ознаки на те ж число.

· Якщо кожну варіанту поділити на якесь довільне число, то середня арифметична зменшується у стільки ж разів.

· Якщо кожну варіанту помножити на якесь довільне число, то середня арифметична збільшується у стільки ж разів.

· Якщо всі частоти (ваги) поділити чи помножити на якесь число, то середня арифметична внаслідок цього не зміниться – якщо ми збільшуємо чи зменшуємо рівнозначно частоти всіх варіант, ми не змінюємо вагу кожної окремої варіанти ряду.

· Сума відхилень варіант від середньої арифметичної завжди дорівнює нулю. Це значить, що відносно середньої арифметичної взаємно погашаються відхилення варіант в той чи інший бік.

Загальні властивості можна використовувати, щоб полегшити техніку визначення середньої арифметичної варіаційного ряду.

Середня гармонійна розраховується в тих випадках, коли відомими є дані про чисельник при відсутності таких щодо знаменника. Наприклад, необхідно визначити середній час, затрачений на прийом одного хворого, коли відомо, що 5 лікарів вели прийом протягом 8 годин. Кожен з них затратив в середньому на прийом одного хворого відповідно 20; 16; 20; 15; 24 хвилини. Розрахунок має наступну схему: сукупний робочий час лікарів складав: n=8·5=40 годин (2400 хвилин, або 480 хвилин на одного лікаря). Навантаження на кожного лікаря визначається: для першого – 480 : 20 = 24 хворих; для другого – 480 : 16 = 30 хворих і т.д. Сумарно – 130 хворих.

Середня геометрична визначається для тих параметрів, зміни значень яких проходять в геометричній прогресії (зміна чисельності населення в період між переписами, результати титрування вакцин, приріст маси тіла новонароджених протягом окремих місяців життя та інше).

Логарифм середньої геометричної дорівнює сумі логарифмів всіх членів ряду, розділених на їх число.

Середня арифметична, яка використовується самостійно, сама по собі, часто має обмежене значення тому, що вона не відображає розміри коливання кількісних варіант ряду (варіабельність ряду). Важливою характеристикою ряду є оцінка різноманітності (мінливості, варіабельності) варіант досліджуваної сукупності. Основою даної оцінки є визначення відхилень окремих варіант від середнього значення ряду. Якщо варіаційний ряд більш компактний, варіанти менше відрізняються від середньої арифметичної. Тому можна вважати, що дана середня величина є більш типовою і краще описує дану сукупність. Якщо варіаційний ряд розкиданий, варіанти значно відрізняються від середньої. В такому випадку середня є менш типовою та не зовсім чітко характеризує ряд і властивості окремих його варіант.

Одним із критеріїв різноманітності варіант ряду є його амплітуда – різниця крайніх значень. Проте, вона не враховує характер їх розподілу. За умови високої компактності розподілу варіант в сукупності і при наявності окремих варіант, що різко відрізняються від інших (“вискакуючі” варіанти), амплітуда не відображатиме істинний характер розподілу.

Іншою величиною мінливості ознак досліджуваної сукупності є середнє квадратичне відхилення (стандартне відхилення), яке позначається символом “сигма” (δ).

Чим вищим є середнє квадратичне відхилення, тим вищим буде ступінь різноманітності ознак сукупності та менш типовою середня. Наприклад, аналіз організації госпіталізації хворих показав, що середня тривалість доопераційного періоду при плановій госпіталізації у двох стаціонарах складає:

Лікарня № 1

Лікарня № 2

Х = 3,1 дня

Х = 3,2 дня

δ = 0,3 дня

δ = 0,9 дня

Середня тривалість підготовки до операції в обох стаціонарах практично однакова, проте середнє квадратичне відхилення, що відображає його коливання, в лікарні № 1 значно менше. Це є свідченням вищої типовості середньої величини та, ймовірно, результатом кращої організації госпіталізації і підготовки до оперативного лікування.

У випадках, коли значення ознак більше відхиляються від середньої (лікарня № 2), узагальнююча варіація знаходиться під впливом більш різнорідних умов і досліджувана сукупність хворих за якістю організації їх госпіталізації є менш однорідною. Таким чином середня величина, яка характеризує цю менш однорідну сукупність, буде менш типовою.

Формула розрахунку середнього квадратичного відхилення така:

– для простого варіаційного ряду;

– для згрупованого варіаційного ряду.

Де:– 1 – число спостережень в досліджуваній сукупності (при досить великому числі спостережень –> 30 – у формулу замість n–1 можна підставити n); P – частота варіант; d = V –`M – відхилення кожної варіанти від середньої арифметичної; V – значення варіанти.

Методику розрахунку середнього квадратичного відхилення розглянемо на прикладі оцінки середньої тривалості лікування хворих з пневмонією в стаціонарі (табл. 2).

Таблиця 2.

Терміни лікування хворих з пневмонією в стаціонарі

Число днів

(х)

Число хворих (f)

V · P

d = V – M

d²

d²·P

-3

-2

128

-1

187

-0

180

n = 48

816

Σ=110

Послідовність розрахунку середнього квадратичного відхилення:

1. Визначаємо середню арифметичну (M).

2. Знаходимо відхилення варіант від середньої арифметичної (d).

3. Підносимо відхилення (d) в квадрат (для уникнення від’ємних значень та збільшення значень крайніх відхилень).

4. Перемножуємо квадрати відхилень на відповідні частоти – d²·P та визначаємо їх суму.

5. Визначаємо середнє квадратичне відхилення за наведеною формулою.

Для нашого прикладу: d = ± 1,5 дня.

Середнє квадратичне відхилення завжди визначають у тих іменованих числах, у яких представлені конкретні вимірювані варіанти та середня. Воно характеризує абсолютну міру варіації – чим більш мінливий, розсіяний ряд, тим “d” буде більше. Чим більше варіюють індивідуальні значення варіант, тим менш точно характеризується варіаційний ряд за допомогою середньої арифметичної.

Практична значимість середнього квадратичного відхилення (сигми) базується на теорії нормального розподілу варіант, згідно з якою їх відхилення від середнього значення в ту чи іншу сторону зустрічаються рівнозначно. Переважна більшість явищ при практичному аналізі медико-біологічних даних мають нормальний розподіл. Теорією статистики доведено, що в нормальному варіаційному ряду знаходиться шість середніх квадратичних відхилень – рівномірно по три з кожного боку від середньої.

Виходячи із значення середньої арифметичної (M) та середнього квадратичного відхилення (d) при симетричному ряді розподілу можна стверджувати з відомим ступенем вірогідності, що певне число варіант буде знаходитись у визначених межах. Згідно з теорією математичної статистики, що доведено на великих числах спостережень, у межах “M ± 1d” будуть мати місце не менше 68,3 % всіх варіант даної сукупності. За межами даного інтервалу може бути до 31,7 %, всіх спостережень. В межах “M ± 2d” будуть розташовані близько 95,5 % всіх варіант. Практично весь варіаційний ряд – 99,7 % варіант знаходитиметься в діапазоні “M ± 3d“. Окремі варіанти – до 0,3 % досліджуваної сукупності можуть не відповідати загальному характеру розподілу та випадати з нього внаслідок занадто низького чи високого рівня (“вискакуючі” варіанти).

Закономірностями розподілу частот варіаційного ряду можна скористатися при вирішенні практичних завдань. Для наведеного вище прикладу планова доопераційна середня тривалість госпіталізації в лікарні № 1 складає 3,1±0,3 дні. Аналіз 200 випадків лікування дозволяє зробити такий висновок: близько 68,3 % хворих (136 чоловік) матимуть тривалість доопераційного періоду в середньому 2,8 – 3,4 дні (M ± 1d). У 95,5 % хворих (округлено 190 пацієнтів) він становитиме 2,5 – 3,7 дня (M ± 2d). Інтервал 2,2 – 4,0 дні (M ± 3d) описуватиме тривалість доопераційного періоду практично для всіх обстежених хворих.

Узагальнення представленого матеріалу дозволяє зробити висновок про можливість практичного використання середнього квадратичного відхилення:

· для визначення амплітуди ряду;

· відновлення крайніх його значень;

· визначення ймовірного числа спостережень в певних інтервалах.

Наведені критерії розподілу ознак (“сигмальна оцінка”) використовують для індивідуальної оцінки показників фізичного розвитку, визначення норм клінічних та фізіологічних параметрів. Інтервал оцінки показників у межах (M±1d) в більшості випадків визначає їх середній рівень; в межах (M) ± 2d – вище чи нижче середніх; в межах (M ± 3d) – дуже високі, чи дуже низькі рівні показників.

Оцінка середнього квадратичного відхилення залежить не тільки від ступеня варіації ознаки, але й від абсолютних рівнів варіант та середньої. Тому безпосередньо порівнювати середні квадратичні відхилення варіаційних рядів з різними рівнями і одиницями виміру, які характеризують неоднорідні явища (довжина у см, вага у кг), не можна. Для можливості такого зіставлення необхідно визначити для кожного ряду відношення середнього квадратичного відхилення (сигми) до середньої арифметичної у відсотках, тобто визначити коефіцієнт варіації, мінливості (С). Він є відносною мірою варіабельності, яка виражається в абстрактних, а не іменованих числах, критерієм надійності середньої величини і визначається за формулою:

Чим вищий коефіцієнт варіації, тим більша варіабельність даної ознаки. Наприклад, визначили, що після дозованого навантаження середня частота пульсу в обстежених складала M=90 уд./хв., d=8 уд/хв., а артеріальний тиск M=135 мм. рт. ст., d=7 мм. рт. ст.

Коефіцієнт варіації для першого (за частотою пульсу) ряду:

Коефіцієнт варіації для другого (за артеріальним тиском) ряду:

Для даного прикладу артеріальний тиск є більш сталою ознакою, ніж частота пульсу. Таким чином, коефіцієнти варіації дають більш точну оцінку мінливості явищ та визначають найбільшу (найменшу) варіабельність їх ознак.

Орієнтовними критеріями оцінки варіабельності за його коефіцієнтом можна вважати: низький рівень – до 10 %; середній рівень – 10-20 %, високий рівень – вище 20 %. Високий рівень коефіцієнта свідчить про невисоку точність узагальнюючої характеристики середньої величини, одним із шляхів підвищення якої є збільшення числа спостережень.

За назвами в статистиці використовуються середня арифметична, середня хронологічна, середня геометрична, середня квадратична величини, середня гармонічна. Зміна значення показника степенної середньої величини (m) визначає вид середньої величини: якщо m = 1, то ми одержуємо середню арифметичну величину; якщо m = 2, то одержуємо середню квадратичну; якщо m = 3, то – середню кубічну; якщо m = – 1,– маємо середню гармонічну; якщо m = 0, то середню геометричну. З степенних середніх в правовій статистиці найчастіше використовують середню арифметичну, значно рідше – середню гармонічну; середня геометрична застосовується лише при обчисленні середніх темпів динаміки, а середня квадратична – при обчисленні показників варіації.

Розмір обчисленої середньої величини завжди відрізняється, оскільки обумовлюється показником степеню середньої величини. В загальному вигляді це правило має назву мажорантності середніх: чим більше показник ступеня, тим більше величина середньої. При цьому слід мати на увазі, що правильну характеристику різних сукупностей в кожному окремому випадку визначає лише певний вид середньої величини. Основний критерій визначення виду середньої величини – це механізм утворення обсягу ознаки, яка варіює. Середня тільки тоді буде вірно відображати усю сукупність, коли при заміні усіх ознак (варіантів) середньою загальний обсяг варіюючої ознаки залишиться незмінним.

Залежно від того, як формується загальний обсяг сукупності, і визначається вид середньої величини. Середня арифметична застосовується тоді, коли обсяг варіюючої ознаки утворюється як сума окремих варіантів, середня квадратична – коли обсяг варіюючої ознаки має вигляд суми квадратів окремих варіантів, середня гармонічна – коли обсяг варіюючої ознаки складається із суми обернених значень окремих варіантів, середня геометрична – коли обсяг варіюючої ознаки одержується як добуток окремих варіантів.

У правовій статистиці середні арифметичні величини застосовуються тоді, коли первинні (вихідні) дані наведені у такому вигляді, що загальний обсяг ознаки для усієї сукупності можна одержати шляхом підсумовування їх у всіх одиницях.

Середня арифметична проста (незважена) обчислюється шляхом ділення суми індивідуальних значень ознаки на їх загальну кількість. Спочатку підсумовують значення усіх варіантів, а потім ця сума ділиться на загальну кількість одиниць сукупності. Наприклад, один слідчий районної прокуратури закінчив за місяць 2 справи, інший – три. В результаті у середньому вони закінчили розгляд 2,5 справи ((2+3) : 2). При цьому не можна відкинути 0,5 справи і округлити цифру, тому що в такому разі результат буде помилковий.

Середня арифметична проста використовується дуже рідко, як правило, лише тоді, коли сукупність повністю симетрична (нормальний закон розподілу одиниць) або має невелику кількість одиниць (як в нашому прикладі).

Оцінка вірогідності результатів дослідження

Вивчення будь-якої проблеми, звичайно, супроводжується необхідністю дати відповідь на ряд питань щодо вірогідності отриманих результатів:

1. Чи завжди потрібно оцінювати їх вірогідність?

2. Наскільки вірогідним є розподіл певної ознаки в даній сукупності – чи достовірним є отриманий показник?

3. Чи відображає розподіл певного параметра в досліджуваній групі аналогічний розподіл параметра в генеральній сукупності (серед всіх хворих)?

4. Чи суттєва різниця між аналогічними показниками в різних групах (хворих, населення та інших)?

Необхідність оцінки вірогідності отриманих результатів визначається об’ємом дослідження. Вона не проводиться при суцільному дослідженні (для аналізу відібрано всі можливі одиниці спостереження), оскільки для всієї (генеральної) сукупності можна отримати тільки одне значення певного показника. Проте в системі медико-біологічних досліджень (крім даних офіційної статистики) рідко використовують суцільні методи збору інформації – переважна частина досліджень є вибірковими.

При проведенні вибіркового дослідження ми можемо зустрічатися з загальними похибками та похибками вибірки. Загальні похибки можуть мати як систематичний характер (методичні, недоліки вимірювальної апаратури), так і випадковий (помилки дослідника). Похибки вибіркового спостереження пов’язані з відбором його одиниць. Це похибки типовості, репрезентативності.

В процесі аналізу розраховані показники (середня тривалість лікування, частота ускладнень, рівень летальності та інші) розглядають як узагальнюючі величини. Якщо результати отримано на основі достатнього за кількістю та якісно однорідного матеріалу, то можна вважати, що вони досить точно характеризують досліджувані явища.

Наприклад, при вивченні ефективності нового методу лікування, апробованого на 400 хворих, встановлено, що у 12 з них виникли ускладнення. Частота їх складає 3 %. Значення узагальнюючого результату полягає в тому, що при проведенні аналогічних вибіркових досліджень, або для оцінки всієї сукупності хворих з даною патологією (генеральної сукупності) ми могли б передбачити отримання аналогічних даних. Проте не виключена ситуація, коли при проведенні повторних досліджень показник, який був визначений шляхом вибіркового спостереження, в незначній мірі може відрізнятись від результату суцільного спостереження.

Отже, оцінити вірогідність результатів вибіркового дослідження означає визначити, в якій мірі зроблені для нього висновки (результати) можна перенести на генеральну сукупність. Тобто, за частиною явища міркувати про явище в цілому та основні притаманні йому закономірності.

Для оцінки вірогідності результатів будь-яких вибіркових досліджень визначають середню похибку відносної (m_Р) чи середньої величини (m_Х).

Середня похибка для відповідних показників при значному числі спостережень (n>30) може бути розрахована за наступними формулами:

– середня похибка середньої величини;

– середня похибка відносної величини;

де: δ– середнє квадратичне відхилення;

n – число спостережень у вибірковій сукупності. При малому числі спостережень (n<30) в знаменнику замістьвикористовується n-1.

P – відносний показник;

q – величина, зворотна до показника, тобто вірогідність того, що дане явище не буде зареєстровано. Сума двох протилежних вірогідностей дорівнює одиниці: P + q = 1. Якщо показник розраховано на 100 (%), то

q = 100 – P, якщо на 1000 (%₀), то q = 1000 – P і т.д.

Для наведеного вище прикладу середня похибка показника становить:

Середня похибка відображає розміри випадкових коливань показника при вибіркових дослідженнях і залежить від числа спостережень та якісних характеристик явища. Чим більше число спостережень та чим одноріднішою є відібрана для аналізу група, тим менші межі ймовірних випадкових коливань показника.

Середня похибка дозволяє визначити довірчі межі, в яких з певною ймовірністю знаходиться істинне значення показника. Інтервал, розташований між ними, носить назву довірчого інтервалу.

Довірчі межі середньої та відносної величин визначають за формулою:

M_ген = M_виб + tm_`_х ; Р_ген = Р_виб + tm_Р_,де:

1) M_гента Р_ген – значення середніх та відносних величин для генеральної сукупності;

2) M_вибі Р_виб– значення середніх та відносних величин, розрахованих для вибіркової сукупності;

3) tm_`_хі m_Р– середні похибки відповідних показників (похибки репрезентативності);

4) t – критерій вірогідності або довірчий критерій. Він може бути заданий з різними ступенями точності і залежно від імовірності безпомилкового прогнозу складати t = 2 i t = 3.

Межі вірогідності (довірчі межі) (Р + 2m) (при t = 2) дають можливість визначити межі коливання показника з імовірністю 95,5 % (р = 0,05), а довірчі межі (Р+3m) (при t = 3) дають можливість визначити межі коливання показника з імовірністю 99,7 % (р = 0,01). Імовірність безпомилкового прогнозу і довірчий критерій визначають на етапі планування статистичного дослідження.

При заданих ступенях імовірності довірчий критерій (t) має незмінну величину, а довірчий інтервал залежить від величини середньої похибки (m), значення якої зменшується при збільшенні числа та якісного складу спостережень.

Для нашого прикладу, при використанні наведеного методу лікування частота ускладнень для генеральної сукупності з імовірністю 95,5 % (t = 2) може знаходитись в межах: Р_ген = Р_виб + tm_Р= 3,0 + 2×0,85 % – від 1,3 % до 4,7 %. З імовірністю 99,7 % довірчий інтервал складатиме від 0,45 % до 5,55 %.

Практична цінність використання середньої похибки середньої чи відносної величини полягає не тільки у визначенні довірчих меж певного показника, але й в оцінці його суттєвості (вірогідності). Якщо вона досить велика, ми можемо отримати значення довірчого інтервалу в діапазоні, який не підлягає логічній оцінці. Наприклад, при використанні певної методики вигодовування новонароджених приріст маси тіла склав 800+300 грам. Довірчий інтервал при вірогідності безпомилкового прогнозу 99 % складатиме від 100 до 1700 грам. Отже, наявність від’ємного результату не дозволяє в повній мірі за даним показником оцінити ступінь впливу даної методики на приріст маси тіла новонароджених.

У вказаній ситуації для підвищення вірогідності оцінки необхідно зменшити довірчий інтервал шляхом збільшення числа спостережень і, відповідно, зменшення середньої похибки показника. Суттєвість (вірогідність) показника визначається на основі співвідношення між абсолютним його значенням та середньою похибкою, яке повинно бути не менше трьох – Р/m_Р>3.

В медико-біологічних дослідженнях часто виникають ситуації, коли при порівнянні окремих параметрів необхідно оцінити суттєвість різниці між ними. Суттєва різниця між окремими показниками вибіркового дослідження свідчить про можливість перенесення отриманих висновків на генеральну сукупність. Критерієм оцінки суттєвості різниці є коефіцієнт вірогідності (критерій Стьюдента), який визначають за формулою:

– для середніх величин;

– для відносних величин.

При великому числі спостережень (n>30) різниця між показниками є суттєвою, якщо:

1) t ≥ 2 (відповідає вірогідності безпомилкового прогнозу 95,5 %);

2) t > 3 (відповідає вірогідності безпомилкового прогнозу 99,7 %).

За умови t<2 ступінь вірогідності безпомилкового прогнозу складає менше 95 %. В цьому випадку ми не можемо стверджувати, що різниця між показниками є суттєвою.

Наприклад, в школі № 1 навчається 1200 дітей. Профілактичні щеплення проти грипу проведено 900 дітям. В наступному році захворіло 350, в тому числі 150-и з них не були зроблені щеплення. Для того, щоб порівняти і оцінити суттєвість різниці між рівнями захворюваності серед щеплених дітей, та тих, яким щеплення не проводились, необхідно:

1) визначити рівні захворюваності в школі № 1 серед першої (з щепленнями) та другої (без щеплень) груп. Вони складають, відповідно:

Р₁=150 : 300×100=50 %.

Р₂=(350-150) : 900×100=22,2 %;

2) визначити середні похибки вказаних показників:

3) оцінити суттєвість різниці за критерієм Стьюдента:

Висновок: різниця між показниками суттєва, оскільки t>3, що відповідає рівню безпомилкового прогнозу 99,7 %.

Часто при клінічних чи експериментальних дослідженнях доводиться мати справу з малим числом спостережень (30 та менше): 5-6 лабораторних тварин, 10-12 хворих та інші. Якщо дослідження вірно організоване, відібрані однорідні групи, їх можна розглядати як вибіркові з малим числом спостережень. Проте при малому числі спостережень (n<30) оцінка вірогідності різниці між параметрами окремих груп проводиться на основі порівняння результату не з граничними значеннями критерію Стьюдента, а з його табличними значеннями для відповідного числа спостережень (n`= n₁+n₂–2). Якщо визначений t-критерій перевищує табличне значення чи дорівнює йому – різниця між показниками статистично доведена.

Критерій вірогідності (t) використовують при попарному порівнянні досліджуваних параметрів. Проте при проведенні статистичного аналізу іноді необхідно оцінити вірогідність різниці більшої від двох кількості показників клініко-статистичних груп. Попарне порівняння їх не дозволяє отримати узагальнюючу оцінку. В іншому випадку необхідно провести порівняння сукупності не тільки за узагальнюючими показниками, а й за характером розподілу ознак в досліджуваних групах.

У вказаних ситуаціях найбільш доцільним є використання критерію відповідності – χ² (критерій Пірсона), який визначають за формулою:

, де:

р – реальні частоти;

р₁ – теоретичні частоти.

В узагальненому вигляді практичне значення критерію відповідності (χ²) полягає в наступному:

· оцінка вірогідності різниці між кількома порівнюваними групами при декількох можливих результатах з різним ступенем ймовірності (наприклад, три чи чотири групи хворих з різними методами лікування та їх наслідками – різною частотою ускладнень);

· визначення наявності зв’язку між двома факторами (залежність результатів лікування від віку хворих, важкості захворювання, зв’язок між важкістю патології новонароджених та станом їх фізичного розвитку);

· оцінка ідентичності розподілу частот у двох та більше сукупностях (аналогічність розподілу хворих за рівнем клінічних параметрів при різних ступенях тяжкості патології).

Основою методу є визначення суттєвості різниці (відхилень) фактичних даних від теоретичних (очікуваних). Розрахунок теоретичних даних базується на припущенні, що між порівнюваними групами за досліджуваними факторами різниця відсутня. Дане припущення визначається як “нульова гіпотеза”.

На її основі визначають “очікувані” результати, і порівнюють їх з фактичними даними. Якщо різниця відсутня, можна зробити висновок, що “нульова гіпотеза” підтвердилась. При наявності відмінностей фактичних даних від теоретичного розподілу визначають суттєвість різниці між порівнюваними групами.

Оцінка результатів (χ²) проводиться за спеціальною таблицею. Суттєвою вважається різниця в тому випадку, коли величина розрахованого коефіцієнта перевищує табличне значення при вірогідності не нижче 95 % (імовірність похибки менше 5 % – p<0,05).

Методику розрахунку коефіцієнта відповідності розглянемо на прикладі оцінки впливу методу лікування на їх результати.

1. Наведемо фактичні результати за трьома методами лікування (табл. 1).

Таблиця 1

Результати лікування хворих за окремими методиками

Методики

лікування

Всього

хворих

Результати лікування – р (фактичні дані)

Хороші

Задовільні

Незадовільні

III

Всього

200 (100 %)

109

2. Розраховуємо “очікувані” результати згідно з “нульовою” гіпотезою, основою якої є припущення, що різниця між результатами лікування за окремими методиками відсутня. В цьому випадку за основу беремо загальний розподіл хворих, пролікованих всіма методами. Числова характеристика “нульової” гіпотези складає: хороші результати в цілому мали 54,5 %, задовільні – 26,5 % та незадовільні – 19 % хворих. Відповідно до вказаного розподілу визначають “очікувані” дані результатів лікування за окремими методиками (значення визначаємо в цілих числах) – табл. 2.

Таблиця 2

“Очікувані” дані результатів лікування за окремими методиками

Методики

Лікування

Всього

хворих

Результати лікування – р₁ (очікувані дані)

Хороші

Задовільні

Незадовільні

III

Всього

200

109 (54,5 %)

53 (26,5 %)

38 (19 %)

3. Співставимо фактичні та теоретичні дані (їх різницю) з розрахунком величини відхилення та врахуванням його напрямку (знаку) – табл. 3.

Таблиця 3

Розрахунок величини відхилення

Методики

лікування

(р – р₁)

Хороші

Задовільні

Незадовільні

III

9 (36–27)

4 (48–44)

–13 (25–38)

–2 (11–13)

–4 (17–21)

6 (25–19)

–7 (3–10)

0 (15–15)

7 (20–13)

Всього

4. Розраховуємо квадрат відхилення теоретичних даних від фактичних та середній квадрат відхилення на одну “очікувану” групу. Даний етап розрахунку має такий вигляд у зв’язку з тим, що на основі фактичних відхилень неможливо визначити його сумарну величину, оскільки вона дорівнює нулю. При піднесенні відхилень у квадрат визначаємо їх параметри для кожної групи (р – р₁)². З огляду на різне число хворих у досліджуваних групах величина відхилень може бути різною, тому квадрат їх ділимо на число відповідних спостережень кожної групи – (р – р₁)²:р₁_.Провівши розрахунки, визначаємо (р – р₁)² та (р – р₁)²:р₁(табл.4).

Таблиця 4

Квадрат відхилення теоретичних даних від фактичних та середній квадрат відхилення

Методики

лікування

(р – р₁)²

р₁

Хороші

Задовіль-ні

Незадо-вільні

Хороші

Задовіль-ні

Незадо-вільні

III

169

2,75

0,23

0,31

0,77

1,9

4,9

3,77

∑ = 17,63

5. Визначаємо χ² – підсумок результатів останнього етапу розрахунків. В нашому випадку χ² = 17,63. Порівнюємо його з табличним значенням, враховуючи число ступенів свободи (n¹), які визначають за формулою: n¹= (S – 1)(r – 1), де

S – число груп хворих (для нашого прикладу – три);

r – число результативних груп (три).

Число ступенів свободи n¹= (3 – 1)(3 – 1) = 4. Отриманий результат перевищує табличні значення χ²для n¹= 4 за всіма рівнями вірогідності. Отже, ми можемо зробити висновок про суттєвість (вірогідність) різниці та наявність зв’язку між показниками при різних методах лікування – “нульова гіпотеза” не підтвердилась.

Критерій відповідності не є абсолютно універсальним і має деякі недоліки:

· залежить від групування первинного матеріалу;

· важливе значення має однорідність наведених груп для попередження згладжування різниці між ними;

· величина χ² визначає наявність зв’язку, проте не виявляє його силу та характер;

· метод не визначає суттєвість різниці між окремими групами, тому іноді для попарного порівняння груп необхідно додатково використовувати t – критерій.

Статистичний критерій – це вирішальне правило, що забезпечує математично обґрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні критерії будуються на основі статистики ^(х₁, х₂, х_п) – деякої функції від результатів спостережень х₁, х₂, х_п. Статистика ¥ є випадковою величиною з певним законом розподілу. Серед значень статистики ¥ виділяють критичну область ¥_кр з властивістю: якщо емпіричне значення статистики ¥_емп належать області ¥ _кр, то нульову гіпотезу відхиляють (відкидають), інакше – приймають. Статистичні критерії визначають у практичній діяльності метод розрахунку певного числа, яке позначається як емпіричне значення критерію, наприклад, ґ_ем“ для ґ-критерію Стьюдента.

Співвідношення емпіричного і критичного значень критерію є підставою для підтвердження чи спростовування гіпотези. Наприклад, у разі застосування ґ-критерію Стьюдента, якщо ґ_ем” > ґ_кр , то значення статистики належать критичній області і нульова гіпотеза Н₀ відхиляється (приймається альтернативна гіпотеза Ні). Правила прийняття статистичного рішення обумовлюються для кожного критерію.

Параметричні і непараметричні критерії

Відповідно до статистичних гіпотез статистичні критерії діляться на параметричні й непараметричні.

Параметричні критерії використовуються в завданнях перевірки параметричних гіпотез і включають у свій розрахунок показники розподілу, наприклад, середні, дисперсії тощо. Це такі відомі класичні критерії, як г-критерій, ґ-критерій Стьюдента, ^-критерій Фішера та ін. Непараметричні критерії перевірки гіпотез засновані на операціях з іншими даними, зокрема, частотами, рангами тощо. Це А-критерій Колмогорова-Смірнова, Т-критерій Вілкоксона-Манна-Вітні та багато інших.

Параметричні критерії дозволяють прямо оцінити рівень основних параметрів генеральних сукупностей, різниці середніх і відмінності в дисперсіях. Критерії спроможні виявити тенденції зміни ознаки при переході від умови до умови, оцінити взаємодію двох і більш факторів у впливі на зміни ознаки. Параметричні критерії вважаються дещо більш потужними, ніж непараметричні, за умов, якщо ознака виміряна за інтервальною шкалою і нормально розподілена. Проте з інтервальною шкалою можуть виникнути певні проблеми, якщо дані, представлено не в стандартизованих оцінках. До того ж перевірка розподілу “на нормальність” вимагає досить складних розрахунків, результат яких заздалегідь невідомий. Найчастіше розподіли ознак відрізняються від нормального, тоді доводиться звертатися до непараметричних критеріїв.

Непараметричні критерії позбавлені перерахованих вище обмежень. Проте вони не дозволяють здійснити пряму оцінку рівня таких важливих параметрів, як середнє або дисперсія, з їхньою допомогою неможливо оцінити взаємодію двох і більше умов або факторів, що впливають на зміну ознаки. Непараметричні критерії дозволяють вирішити деякі важливі завдання, які супроводжують дослідження в психології і педагогіці: виявлення відмінностей у рівні досліджуваної ознаки, оцінка зсуву значень досліджуваної ознаки, виявлення відмінностей у розподілах ознак.

Застосування критеріїв для прийняття (відхилення) статистичних гіпотез завжди здійснюються з довірчою ймовірністю, інакше кажучи, на певному рівні значущості.

Рівень статистичної значущості

Рівень статистичної значущості – це ймовірність того, що ми визнали відмінності істотними (прийняли альтернативну гіпотезу і відхилили нульову), а вони насправді випадкові. Наприклад, якщо вказується, що відмінності достовірні на 5%-му рівні значущості, то мається на увазі ймовірність 0,05 того, що вони все ж таки недостовірні. Рівень значущості – це ймовірність відхилення нульової гіпотези, тоді як вона правильна.

Історично склалося так, що в психолого-педагогічних дослідженнях прийнято вважати нижчим рівнем статистичної значущості 5%-й рівень (а<0,05), достатнім – 1%-й рівень (а<0,01) і вищим – 0,1%-й рівень (а<0,001). Тому в таблицях критичних значень звичайно приводяться значення критеріїв, відповідних рівням статистичної значущості а<0,05 і а<0,01, інколи а<0,001. Пропонуємо дотримуватися правила відхилення гіпотези про відсутність відмінностей (Н₀) і прийняття гіпотези про статистичну достовірність відмінностей (ні), доки рівень статистичної значущості не досягне а=0,05.

Непараметричні критерії оцінки вірогідності результатів дослідження

Розглянуті в попередніх розділах статистичні параметри (середня арифметична, середнє квадратичне відхилення, коефіцієнт варіації, середня похибка), які використовують для аналізу варіаційних рядів, є його параметрами і вимагають представлення вихідних даних у кількісному вигляді. Проте при проведенні медичних досліджень досить часто доводиться використовувати методи статистичного аналізу даних, представлених у напівкількісному, напів’якісному та якісному вигляді. Сукупність статистичних методів, що дозволяють оцінити їх результати як в кількісному (числовому), так і в напівкількісному та якісному вигляді об’єднують в групу непараметричних критеріїв оцінки. Використання їх не потребує розрахунку параметрів варіаційного ряду. Тут має значення порядок розташування варіант в сукупностях. Статистична оцінка спостережень за допомогою непараметричних критеріїв, як правило, простіша, ніж оцінка параметричними методами та не вимагає громіздких розрахунків.

Переважна більшість параметричних статистичних методик передбачає наявність нормального розподілу варіант у досліджуваній сукупності. Але на практиці зустрічаються не тільки нормальні, але й інші види розподілу ознак. За наявності таких ситуацій використання параметричних критеріїв підвищує ймовірність помилок. Практичне застосування непараметричних критеріїв, не пов’язане з певною формою розподілу досліджуваних ознак, робить доцільним їх самостійне використання або в комплексі з параметричними.

Незважаючи на певну простоту методик, надійність непараметричних критеріїв досить висока. Вони можуть бути використані для оцінки вірогідності медико-біологічних результатів однієї сукупності, різниці двох та більше вибіркових сукупностей.

Зважаючи, що одним із найбільш важливих розділів їх використання є оцінка вірогідності різниці порівнюваних спостережень, весь комплекс вказаних методик можна розподілити на дві групи: 1) непараметричні критерії оцінки вірогідності різниці у двох взаємопов’язаних сукупностях; 2) непараметричні критерії оцінки вірогідності різниці у двох незалежних сукупностях.

Першу групу використовують для оцінки вірогідності різниці за результатами, які отримані для однієї групи хворих протягом різних періодів (до лікування – після лікування, перший день – п’ятий день та інші). Порівняння їх результатів може бути проведено за критеріями знаків та Вілкоксона.

Критерій знаків дозволяє включати в аналіз до 100 пар спостережень і базується на підрахунку числа однонаправлених результатів при парному їх порівнянні.

В табл. 1 наведено динаміку швидкості осідання еритроцитів (ШОЕ) за 10-денний період лікування.

Таблиця 1

Динаміка швидкості осідання еритроцитів (ШОЕ)

Хворі

(№ п/п)

ШОЕ

Спрямованість різниці

1 день

10 день

–

Основні етапи розрахунку за критерієм знаків:

1. Визначення спрямованості різниці в порівнюваних групах результатів. Динаміка при цьому позначається відповідними знаками: +, –, =. З подальшого розрахунку виключають результати без динаміки (=).

2. Підрахунок числа спостережень з позитивними та негативними результатами. З 10 наведених зміни виявились у 9 хворих.

3. Підрахунок числа знаків, які рідше зустрічаються. Зниження ШОЕ (–) виявлено у 6 хворих, а приріст (+) зареєстровано в трьох випадках.

4. Порівняння меншого числа знаків (критерій Z) з табличними критичними значеннями для відповідного числа спостережень. Для= 9 визначений критерій Z=3 вище граничного табличного (Z_0,05= 2). Отже, не можна зробити висновок про суттєвість динаміки швидкості осідання еритроцитів – ймовірність похибки більше 5 % (р>0,05).

Т-критерій Вілкоксона передбачає можливість попарного порівняння від 6 до 25 пар спостережень. Його доцільно використовувати в тих випадках, коли виявляються неоднозначні кількісні зміни досліджуваного параметра (зниження та підвищення). При цьому враховують не тільки спрямованість різниці, а і її величину.

Методика аналізу за Т-критерієм Вілкоксона наведена в табл. 2.

1. Визначається різниця в парах спостереження між кінцевим та початковим рівнями артеріального тиску.

2. Рангування отриманих результатів за величиною різниці між показниками без врахування спрямованості змін. Результати без динаміки виключають з подальшої оцінки. Якщо два результати мають однакові абсолютні значення змін, їх ранги визначають як півсуму порядкових номерів.

3. Підрахунок суми однозначних рангів (позитивних та негативних).

4. Оцінка за меншою сумою рангів шляхом порівняння визначеного Т-критерію з табличним значенням при відповідному числі пар спостережень.

Таблиця 2

Рівень артеріального тиску у хворих на гіпертонічну хворобу до та після лікування (мм. рт. ст.).

Хворі

Рівень артеріального тиску

Різниця

Ранг різниці

Сума рангів

“+”

Сума рангів

” – “

до лікування

після лікування

В.

Д.

К.

Р.

Н.

П.

А.

С.

Ю.

Т.

210

180

185

160

175

190

155

180

200

170

175

180

140

185

145

150

160

155

–35

+25

–30

–40

–20

–45

–15

6,5

–

6,5

Т=40

Т = 5

Критерій Вілкоксона Т=5 не перевищує табличного значення для даного числа спостережень –= 9, T_0,05 = 6. Отже, можна зробити висновок про суттєвість (статистичну вірогідність) динаміки артеріального тиску у хворих після лікування.

Друга група непараметричних критеріїв – критерії, що застосовують у випадку порівняння незалежних сукупностей. Типовими прикладами їх практичного використання є порівняння дослідної та контрольної груп хворих, результатів двох груп спостережень, що відносяться до різних захворювань чи ступенів важкості патології.

Для порівняння незалежних сукупностей використовують:

· серійний критерій;

· критерій Уайта;

· Ван дер Вардена.

Але найбільш потужним в даній групі є критерій Колмогорова-Смирнова (λ²), методика застосування якого наведена нижче (табл. 3):

Таблиця 3

Зміна радіоактивності крові опромінених тварин, що отримували (Х) та не отримували (У) лікування (в умовних одиницях)

Варіанти по ряду Х та У

Частоти варіант по групах

Накопичені частоти по групах

Накопичені частки по групах

Різниця

Рх

Ру

0,23

0,56

0,67

0,23

0,44

0,78

0,34

0,44

0,89

0,34

0,55

0,45

0,55

0,56

0,44

0,67

0,33

0,89

0,11

Nx=9

Ny=8

1. Числові значення двох варіаційних рядів об’єднують в один варіаційний ряд, варіанти якого розташовують в порядку зростання.

2. Визначають частоти варіант для обох груп спостережень.

3. Визначають накопичені частоти для обох груп.

4. Визначають накопичені частки, для чого накопичені частоти діляться на число спостережень для кожної групи.

5. Розраховується різниця накопичених часток груп Х та У без врахування знаків.

6. Визначають максимальну різницю – Д = 0,55 (графа 8, табл. 3).

7. Визначають критерій λ²за формулою:

Порівнюємо отриманий результат з граничним значенням критерія Колмогорова-Смирнова. Якщо λ²більше граничного значення, різниця між порівнюваними групами є суттєвою.

Для даного завдання λ²= 1,28. Порівнюючи отриманий результат з граничним значенням λ²_0,05= 1,84 та λ²_0,01= 2,65, робимо висновок про несуттєвість різниці між порівнюваними групами.

Типи і загальна схема перевірки статистичних гіпотез

Типи статистичних гіпотез визначаються сукупністю тих завдань і методів їх розв’язання, які мають місце в психолого-педагогічних дослідженнях. За своїм прикладним змістом статистичні гіпотези можна поділити на декілька основних типів щодо :

v закону розподілу випадкових величин тих чи інших властивостей;

v чисельних показників параметрів (середніх, дисперсій, кореляцій та ін.);

v однорідності двох або декількох вибірок

v відмінностей у рівні ознак досліджуваного явища або процесу;

v відмінностей у розподілі ознак.

Загальна схема перевірки статистичних гіпотез. Незважаючи на різноманітність типів гіпотез і критеріїв, схему перевірки статистичних гіпотез можна представити у вигляді послідовності таких процедур:

1) формулювання гіпотез Н₀ і Н_і на основі завдань дослідження;

2) перевірка припущень щодо відповідності розподілу параметричному сімейству, параметрів вибірки та іншої додаткової інформації;

3) прийняття рівня значущості а;

4) вибір статистичного критерію;

5) розрахунки емпіричного критерію;

6) визначення області критичних значень критерію;

7) прийняття статистичного рішення;

8) формулювання статистичних висновків;

9) прийняття рішення щодо продовження (припинення) досліджень;

10) формулювання змістовних висновків.

У прикладній статистиці використовують два стилі викладу методів перевірки гіпотез. За одним формулюють і нульову, і альтернативну гіпотези (або набору гіпотез), перевірки яких відбувається за певними критеріями. При іншому стилі виклад будують як алгоритмічний опис критеріїв для перевірки нульової гіпотези, про альтернативи навіть не згадується. У посібнику пропонується перший варіант.

Вимірювання кореляційного зв’язку

Всі зміни, що відбуваються в природі, є взаємопов’язаними та взаємообумовленими. Мінливість певної ознаки, як наслідок зміни інших параметрів, в свою чергу обумовлює мінливість інших ознак. Проте вказана залежність в окремих ситуаціях проявляється по-різному. Так, якщо зміна одного параметра на певну величину, завжди призводить до зміни іншого також на певну фіксовану величину, можна говорити про функціональну залежність між ними. Такий взаємозв’язок часто має місце при вивченні хімічних та фізичних явищ (закон Бойля-Маріотта), в математиці, геометрії (зміна радіуса на певну величину призведе до зміни довжини кола також на певну фіксовану величину).

В медико-біологічних дослідженнях залежність між окремими параметрами не має функціонального зв’язку – певному значенню одного параметра може відповідати декілька значень іншого, що можна визначити як кореляційний зв’язок. При зміні однієї ознаки неможливо абсолютно прогнозувати величину, на яку зміняться інші. Прикладом такої залежності є вага та зріст дітей, тяжкість патології та терміни лікування, концентрація шкідливих речовин в робочій зоні та рівень захворюваності працівників, число еритроцитів і вміст гемоглобіну та інші.

Визначення характеру зв’язку між певними параметрами проводять шляхом розрахунку коефіцієнта кореляції, який залежно від його характеру та форми представлення даних може бути розрахований різними методами.

1. Коефіцієнт парної кореляції відображає характер зв’язку двох ознак. Він може бути розрахованим при зіставленні двох рядів у вигляді рангового коефіцієнта кореляції ( ρ ) і лінійного коефіцієнта кореляції (r). Парний коефіцієнт кореляції дає характеристику узагальненого, “неочищеного” зв’язку між параметрами. При цьому можливий вплив інших факторів, які не враховуються, тому самостійна цінність парного коефіцієнта невисока і його розрахунок є одним з елементів кореляційно-регресійного аналізу.

2. Множинний коефіцієнт кореляції (R) – визначає взаємозв’язок між трьома та більше ознаками і показує ступінь впливу кожної з них.

3. Парціальний коефіцієнт кореляції (розрахунок проводиться на основі парних та множинного коефіцієнтів кореляції) – відображає “чистий” взаємозв’язок між конкретним фактором та рівнем здоров’я, виключаючи вплив інших.

Кореляційна залежність відрізняється за направленістю, силою та формою зв’язку (табл. 1).

Лінійність зв’язку має першочергове значення при попарному порівнянні факторів, але втрачає свою значимість при багатофакторних моделях. Направленість зв’язку визначається за алгебраїчним знаком коефіцієнта кореляції, сила зв’язку – за абсолютним значенням коефіцієнта кореляції. Якщо r = 0, можна говорити про відсутність зв’язку, а при r = 1 – про функціональний зв’язок між досліджуваними факторами.

Таблиця 1

Кореляційна залежність за направленістю, силою та формою зв’язку

Форма зв’язку

Прямолінійна – рівномірна зміна одного параметра відповідає рівномірним змінам іншого параметра (при незначних коливаннях)

Криволінійна – рівномірна зміна одного параметра відповідає нерівномірним змінам іншого параметра (нерівномірність має певну закономірність)

Направленість зв’язку – визначається за знаком коефіцієнта кореляції

Прямий зв’язок (позитивний) – динаміка параметрів є однонаправленою – збільшення одного параметра обумовлює збільшення іншого (зростання екологічного навантаження обумовлює зростання рівня захворюваності населення)

Зворотний зв’язок (негативний, від’ємний) – динаміка параметрів є різнонаправленою – збільшення одного параметра обумовлює зменшення іншого (при збільшенні віку дітей спостерігається зниження рівня захворюваності)

Сила зв’язку

Слабка

r = 0,01 – 0,29

Середня

r = 0,30 – 0,69

Сильна

r = 0,70 – 0,99

Ранговий коефіцієнт кореляції (Спірмена) відноситься до непараметричних критеріїв оцінки взаємозв’язку. Особливість коефіцієнта – простота обчислення при недостатній точності дозволяє його використовувати для орієнтовного аналізу з проведенням швидких розрахунків, при визначенні даних у напівкількісному, описовому вигляді. Він базується на визначенні рангу кожного значення ряду. Методику розрахунку наведено на прикладі характеристики взаємозв’язку між рівнем перинатального ризику у вагітних та частотою післяпологових ускладнень (табл. 2).

Порядок розрахунків:

1. Визначаємо ранги для значень кожної величини ряду (х) та (у). Рангування обох рядів повинно бути однонаправленим, наприклад, від меншого до більшого.

2. Визначаємо відхилення значень першого ряду від другого (d_ху). Їх сума з врахуванням знаків повинна дорівнювати нулю.

3. Підносимо отримані результати до квадрата та визначаємо їх суму (Σd²_ху= 4).

Таблиця 2

Перинатальний ризик (бали)

Частота післяпологових ускладнень (%)

Порядкові номери (ранги)

Різниця рангів

Квадрат різниці рангів

d_ху = x – y

d²_ху

До 2

0,4

3–4

0,8

–1

5–6

0,6

7–8

1,4

–1

9–10

1,3

Σd²_ху= 4

4. Підставляємо отримані результати у формулу:

Висновок: між рівнем перинатального ризику вагітних та частотою післяпологових ускладнень виявлено сильний, прямий кореляційний зв’язок.

Похибка рангового коефіцієнта кореляції для нашого випадку (n<30) визначається за формулою:

При великому числі спостережень (n>30) середня похибка рангового коефіцієнта кореляції може бути визначена за формулою:

Оцінка вірогідності коефіцієнта кореляції проводиться за тими ж принципами, що використовуються для інших показників з розрахунком критерію вірогідності (t) і врахуванням числа спостережень (число ступенів свободи варіаційних рядів n`= – 2). Отримані результати порівнюють з табличними значеннями. Загалом, слід пам’ятати, що для оцінки вірогідності результатів коефіцієнт кореляції повинен перевищувати свою похибку не менше ніж в 2,5-3 рази при достатньому числі спостережень.

Для нашого випадку m_ρ= 0,346 і t = ρ/m_ρ= 0,80/0,346 = 2,31, що, відповідно, нижче граничних значень (t = 3,2 при p<0,05). Отриманий результат (t) не дозволяє зробити висновок про вірогідність даного рангового коефіцієнта кореляції. Доцільним в даному випадку є використання більшого числа спостережень.

Спрощений метод оцінки рангового коефіцієнта кореляції передбачає порівняння його з критичним табличним значенням для відповідного числа пар спостережень. Коефіцієнт кореляції є значимим з вірогідністю похибки не вище 5 % (p<0,05), якщо отриманий результат вище чи дорівнює табличному значенню. Для нашого прикладу для 5 пар спостереження табличне значення ρ = 0,900 (при p<0,05), що вище фактичного значення. Отже, отриманий результат не можна вважати суттєвим.

Для розрахунку коефіцієнта прямолінійної кореляції існує багато методів. Вони визначаються метою, характером та об’ємом дослідження, наявністю обчислювальної техніки. Один з методів був запропонований К. Пірсоном, в науковій літературі відомий як лінійний коефіцієнт кореляції Пірсона. Формула його розрахунку така:

де: х і у – варіанти порівнюваних варіаційних рядів; d_x i d_y – відхилення кожної варіанти від своєї середньої арифметичної.

Наприклад: визначити залежність між тривалістю паління (роки) та частотою виявлення хронічних бронхітів у молодому віці (до 29 років).

Таблиця 3

Тривалість паління (роки) (х)

Частота хронічних бронхітів (%) (у)

d_x

d_y

d_x*d_y

d_x²

d_y²

6,0

–3,5

–11,0

38,5

12,25

121,0

9,0

–2,5

–8,0

20,0

6,25

64,0

12,0

–1,5

–5,0

7,5

2,25

25,0

13,0

–0,5

–4,0

2,0

0,25

16,0

14,0

0,5

–3,0

1,5

0,25

9,0

21,0

1,5

4,0

6,0

2,25

16,0

26,0

2,5

9,0

22,5

6,25

81,0

35,0

3,5

18,0

63,0

12,25

324,0

Σ=52

Σ=136

Σd_x=0

Σd_y=0

Σd_x*d_y=161

Σd_x²=42

Σd_у²=656

`Х_х=6,5

`Х_у=17

Розрахунок лінійного коефіцієнта кореляції:

1. Визначають середні значення для кожного ряду (Х_х,`Х_у).

2. Визначають відхилення кожного із значень ряду від середньої величини d_x i d_y.

3. Підносять визначені відхилення до квадрату та визначають їх суми: Σd_x²=42 та Σd_у²=656.

4. Підставивши отримані значення у формулу Пірсона, отримаємо:

Висновок: між тривалістю паління в молодому віці та частотою хронічних бронхітів існує сильний прямий зв’язок.

Вірогідність отриманого результату визначимо за співвідношенням

t = r / m_r, де m_r при малому числі спостережень (n<30) дорівнює:

Для нашого випадку коефіцієнт вірогідності:

що значно вище гранично допустимих значень при вірогідності похибки p<0,05.

При великому числі спостережень (n>30) формула для розрахунку середньої похибки коефіцієнта кореляції має інший вигляд:

Прямолінійний кореляційний зв’язок між параметрами характеризується тим, що кожному з однакових вимірів одного показника відповідає певне середнє значення іншого показника. Дану залежність можна описати коефіцієнтом регресії. Він показує, на яку величину в середньому зміниться другий параметр при зміні першого на певну одиницю виміру.

Розраховується коефіцієнт регресії за формулою:

де: R_x_/y – коефіцієнт регресії ознак х по у;

r_xy – коефіцієнт кореляції;

δ_х та δ_у – середні квадратичні відхилення рядів (х) та (у).

Розглянемо використання коефіцієнта регресії на прикладі.

При аналізі даних фізичного розвитку 7-річних хлопчиків отримані наступні параметри фізичного розвитку за зростом (`Х_х) та вагою (`Х_у):

`Х_х = 120,0 см; δ_х= 6,0 см та `Х_у = 26,0 кг; δ_у= 2,2 кг; r_xy= 0,76.

Коефіцієнт регресії за даних умов складає:

Отже, при зміні зросту на 1 см вага хлопчиків в середньому зміниться на 0,28 кг. Визначений коефіцієнт регресії можна використати в рівнянні регресії при прогнозуванні ситуації – яка вага в середньому буде відповідати зросту хлопчиків 125,0 см:

Коефіцієнти регресії досить широко використовуються для побудови рівнянь регресії при розробці багатьох медико-соціальних та клінічних проблем, в тому числі для оцінки фізичного розвитку дітей та підлітків. Дані рівняння являють собою математичну модель, яка описує характер взаємозв’язку між досліджуваними параметрами. Це особливо актуально при побудові багатофакторних моделей і прогнозуванні рівнів результативного параметра системи при фіксованих рівнях окремих компонентів (показників).

Графік кореляційного поля.

Наведені вище методики розрахунку парних коефіцієнтів кореляції є основою і лише першим етапом багатофакторного кореляційного аналізу. Парні коефіцієнти показують характер зв’язку (загального, “неочищеного”) між досліджуваними параметрами без врахування впливу інших факторів. Оцінка “чистого” взаємозв’язку в багатофакторних моделях визначається на основі парціальних коефіцієнтів кореляції. Основою для їх розрахунку є парні коефіцієнти. Множинний коефіцієнт кореляції відображає зв’язок одночасно комплексу факторів з досліджуваним результативним фактором (клінічними показниками та ін.).

Ще одним параметром багатофакторного кореляційного аналізу є коефіцієнт детермінації, який відображає питому вагу (%) впливу факторів, що вивчаються (факторіальні ознаки), на рівень результативних ознак (показники здоров’я населення, клінічні показники та інші).

Методики практичної реалізації багатофакторного аналізу не розглядаються в даному розділі, тому що вони є досить об’ємними та широко наведені в спеціальній літературі. Враховуючи значні об’єми розрахунків, реалізація багатофакторного кореляційного аналізу не можлива без використання обчислювальної техніки. Дані методики реалізовані в багатьох пакетах прикладних програм: SPSS, STATISTICA, STADIA, AXUM, MULTIFAC, STATGRAPHICS plus, SAS та інших. Їх повноцінне використання в клінічних та медико-соціальних дослідженнях не можливе без знань основ медичної статистики.