Home » Динамічні ряди

Динамічні ряди

28 Червня, 2024

ДИНАМІЧНІ РЯДИ.

ПЕРЕСІЧНІ ВЕЛИЧИНИ.

ОЦІНКА ДОСТОВІРНОСТІ РЕЗУЛЬТАТІВ СТАТИСТИЧНОГО ДОСЛІДЖЕННЯ З ПОЗИЦІЙ ДОКАЗОВОЇ МЕДИЦИНИ.

Динамічні ряди

Окремі явища чи параметри, які вивчаються різними галузями медичної науки та практики, протягом часу часто змінюють свою інтенсивність. Ці зміни позначаються на розвитку явищ. Тому при їх вивченні необхідно враховувати величину та напрямок змін. Особливо велике значення для практичної охорони здоров’я має інформація про зміни, які притаманні демографічним процесам, захворюваності населення, діяльності закладів охорони здоров’я та інші. Адекватність спрямованості та реалізації практичних рекомендацій та заходів у значній мірі залежить від вірної оцінки їх характеру. Оскільки такі зміни часто є наслідком практичних оздоровчих заходів, аналіз їх дозволяє оцінити ефективність проведеної роботи.

Для охорони здоров’я практичний інтерес має і тенденція розвитку деяких явищ. Оцінка її на даний момент часто дозволяє передбачити зміни в майбутньому і відповідно намітити та реалізувати необхідні практичні заходи.

Динамічний ряд – це послідовність чисел, які характеризують зміну соціально-економічного явища.

Динамічний ряд – перелік хроно-логічних моментів (дат) або інтервалів часу і їм відповідні статистичні показники, які називають – рівнями ряду. За ознакою часу ряди дина-міки поділяються на інтервальні та моментні. У математичній статистиці ряд динаміки – це реалізація випадкового процесу. У ста-ціонарних випадкових процесах основні характеристики обчислюються за однією реалізацією, тому що є рівновага щодо певного середнього рівня. На жаль, динамічні процеси в економіці нестаціонарні та інерційні.

При вивченні закономірностей статистика розв’язує завдання: вимірює інтенсивність динаміки, описує тенденції, оцінює структурні зру-шення, сталість і коливання рядів.

Передумовою аналізу динамічного ряду є порівнянність статистичних даних. Порівнянність статистичних даних забезпечується наявністю таких факторів:

– незмінність у методології обліку та розрахунку показників, використання однакових одиниць вимірювання;

– незмінність у структурі сукупності;

– рівні критичні моменти реєстрації даних;

– незмінність цін для вартісних показників.

Характеристики інтенсивності динаміки: якщо відносно постійної бази – так вони називаються базисними; якщо кожен рівень ряду порівнюється з попереднім – так вони називаються ланцюговими.

Процес розвитку змін окремих явищ (в тому числі медико-соціальних) за часом в статистиці прийнято називати динамікою, для відображення якої будують відповідні ряди. Отже, динамічний ряд – це ряд статистичних величин, що відтворюють зміни явища у часі і розташовані в хронологічному порядку через певні проміжки часу.

Складовими елементами ряду динаміки є його рівні та показники часу (роки, квартали, місяці і т.д.) чи моменти (періоди часу). Рівні ряду – це величини, з яких складається динамічний ряд – розмір того чи іншого явища, досягнутий протягом певного періоду чи на певний момент часу.

Залежно від того, як рівні ряду відображають стан явища, динамічні ряди за своїм видом можуть бути :

· Моментними – величини ряду характеризують явище на будь-який певний момент часу (штати, ліжка на кінець календарного року, виявлені хворі при медичному огляді).

· Інтервальними – рівні ряду визначають за певний період часу (число випадків госпіталізації в стаціонар, число летальних випадків протягом року, число викликів швидкої допомоги протягом доби).

Для різних за характером інтервальних і моментних динамічних рядів виявляють деякі особливості рівнів. Оскільки рівнями інтервального ряду є сумарний розмір явища за певний проміжок часу, то вони залежать від тривалості даного періоду часу і можуть бути представлені у вигляді підсумку. В моментних рядах рівні містять елементи повторного підрахунку (наприклад, чисельність населення України за даними переписів), тому підводити їх підсумок неможливо.

Соціально-економічні процеси динамічні, що виявляються сталою зміною рівнів динамічного ряду. Поряд з динамічністю їм притаманна інерційність: зберігається механізм формування явищ і характер розвитку (темпи, напрям, коливання). При значній інерційності процесу й незмінності комплексу умов його розвитку правомірно очікувати в майбутньому ті властивості й характер розвитку, які були виявлені в минулому. Діалектична єдність мінливості і сталості, динамічності та інерційності формує характер динаміки, уможливлюючи статистичне прогнозування соціально-економічних процесів.

При вивченні закономірностей соціально-економічного розвитку статистика розв’язує низку завдань: вимірює інтенсивність динаміки, виявляє й описує тенденції, оцінює структурні зрушення, сталість і коливання рядів; виявляє фактори, які спричинюють зміни.

Передумовою аналізу будь-якого динамічного ряду є порівнянність статистичних даних, які його формують. Непорівнянність даних може зумовлюватися різними причинами:

· змінами в методології обліку та розрахунку показника, зокрема використання різних одиниць для вимірювання;

· змінами в структурі сукупності, а також територіальними змінами;

· різними критичними моментами реєстрації даних чи тривалістю періодів, до яких належать рівні;

· зміною цін для вартісних показників.

Порівнянність даних забезпечується на етапах їх збирання та обробки. Використовують також спеціальні прийоми зведення даних до порівнянного вигляду — «статистичні ключі» зімкнення динамічних рядів. Припустимо, помісячні рівні витрат сировини на виробництво продукції в І півріччі непорівнянні, оскільки у квітні змінився порядок обліку витрат (табл. 8.1). Подолати переривчастість ряду можна двома способами. Перший — спосіб відносних рівнів, коли за базу порівняння для кожного ряду беруть квітневий рівень. Два ряди відносних рівнів об’єднуються в один.

Таблиця 8.1

ЗІМКНЕННЯ ДИНАМІЧНИХ РЯДІВ

Місяці

Обсяг витрат, т

Зімкнений ряд

Старий порядок реєстрації

Новий порядок реєстрації

Відносних

величин, %

Абсолютних

величин, т

Січень

—

44,0

Лютий

—

49,5

Березень

—

52,8

Квітень

100

55,0

Травень

—

105

58,0

Червень

—

109

60,0

Другий спосіб ґрунтується на співвідношенні квітневих рівнів: 55 : 50 = 1,1. Помноживши рівні першого ряду на цей коефіцієнт, дістанемо єдиний зімкнений (порівнянний) ряд динаміки за весь період (остання графа таблиці).

Величини, які вивчають в динаміці (рівні ряду), можуть бути представлені у вигляді абсолютних чисел, відносних (інтенсивні показники, співвідношення) та середніх величин. За даним критерієм динамічні ряди можна розділити на ряди абсолютних, відносних та середніх величин.

Для аналізу динаміки не завжди доцільно використовувати абсолютні величини, оскільки їх зміна досить часто пов’язана зі зміною чисельності середовища чи основи для формування. Наприклад, зменшення числа випадків госпіталізації до стаціонару може бути пов’язане зі скороченням ліжкового фонду за відповідний проміжок часу, а не з фактичними показниками здоров’я населення.

Розгляд в динаміці екстенсивних показників (структури) у більшості випадків є недоцільним і може бути проведений тільки в особливих випадках, за умови чіткої інтерпретації та обов’язкового врахування змін в структурі всієї сукупності.

Залежно від відстані між рівнями динамічні ряди можна розподілити на рівновіддалені (рівномірні інтервали між датами) та нерівновіддалені (нерівномірні проміжки чи перервні періоди).

Характер основної тенденції досліджуваних процесів, представлених у вигляді динамічних рядів, ділить їх на стаціонарні та нестаціонарні. Якщо математично очікувані (прогнозовані) значення ознак та параметри їх стабільності (середнє квадратичне відхилення, коефіцієнт варіації) є постійними, не залежать від часу, то такий процес є стаціонарним. Дані ряди також називаються стаціонарними. Медико-соціальні процеси за часом, звичайно, не є стаціонарними, оскільки кожен з них містить в собі певну тенденцію розвитку.

Важливою умовою вірної побудови динамічного ряду і його подальшої характеристики є можливість зіставлення його окремих рівнів. Порівнюючи дані в динаміці, необхідно завжди пам’ятати про територіальне та якісне зіставлення результатів. Основними причинами, що утруднюють або роблять неможливим співставлення рівнів динамічного ряду можна визначити:

· зміна одиниць вимірювання чи підрахунку (оцінка економічної ефективності роботи лікувально-профілактичних закладів в різних грошових еквівалентах на певні періоди – рублі, купони, гривні, У.О.);

· нерівномірна періодизація динаміки (кількісна – за роками, якісна – за соціально-економічними періодами, зміною пріоритетності різних типів закладів у структурі лікувально-профілактичної допомоги);

· зміна переліку об’єктів аналізу (перехід ряду лікувально-профілактичних закладів з одного підпорядкування до іншого);

· зміна територіальних меж областей, районів та інші.

За наявності вищевказаних умов проблему, звичайно, вирішують в процесі збору та обробки даних або шляхом їх перерахунку.

Методи медичної статистики дозволяють вимірювати розміри змін, що відбулись протягом певного періоду часу, та кількісно охарактеризувати спрямованість їх розвитку. З даною метою використовують наступні показники: абсолютний приріст, темп росту, темп приросту.

Абсолютний приріст – це різниця між даним рівнем ряду і тим, що взято за основу (попереднім, початковим). Абсолютний приріст може бути як позитивним, так і негативним. Він відображає, на скільки одиниць в абсолютному виразі змінився рівень того чи іншого періоду порівняно з базовим. Один і той самий абсолютний приріст відносно різних вихідних рівнів може означати різний темп динаміки, тому необхідно визначити також у скільки разів рівень одного періоду є вищим чи нижчим рівня іншого періоду.

Темп росту –відношення даного рівня ряду до рівня, взятого за основу, виражене у відсотках. Дозволяє відповісти на питання: на скільки відсотків він збільшився чи зменшився. Якщо оцінка в динамічному ряду проводиться відносно до попереднього рівня, можна говорити про темпи росту, розраховані при змінній основі. При розрахунках, проведених відносно висхідного рівня, говоримо про показники, розраховані на постійну основу, які ще мають назву показників наочності.

Темп приросту – відношення абсолютного приросту за даний період часу до абсолютного рівня попереднього періоду, виражене у відсотках. Абсолютний приріст може бути позитивним чи негативним, а відповідно, темп приросту також може бути позитивним чи негативним.

Абсолютне значення 1 % приросту – відношення абсолютного приросту до темпу приросту. В певних ситуаціях, незважаючи на зниження темпу приросту, ми можемо відмічати одночасне збільшення значення 1 % приросту, який залежить від початкового рівня.

Показник

Базисний розрахунок

Ланцюговий розрахунок

Абсолютний приріст

Коефіцієнт зростання

Темп зростання

Коефіцієнт приросту

Темп приросту

Абсолютне значення одного проценту приросту

Способи розрахунку вказаних показників представлені на наступному прикладі.

Таблиця 1

Динаміка перинатальної смертності (на 1000 народжених)

Рік

Абсолютний рівень

Абсолютний приріст

Темп росту, %

Темп приросту, %

При змінній основі

При постійній основі

1991

14,3

–

100,0

–

1992

7,4

–6,9

51,7

–48,3

1993

12,8

5,4

173,0

89,5

73,0

1994

12,3

–0,5

96,1

86,0

–3,9

1995

12,2

–0,1

99,2

85,3

–0,8

1996

12,2

0,0

100,0

85,3

0,0

1997

12,2

0,0

100,0

85,3

0,0

1997

11,2

–1,0

91,8

78,3

–8,2

Спостереження, які проводять протягом тривалого часу, не завжди дають можливість виявити чітку тенденцію в динаміці певного явища. В подібних ситуаціях доцільним є застосування методів вирівнювання динамічного ряду, які поділяються на дві основні групи:

1. Згладжування, чи механічне вирівнювання окремих членів ряду з використанням фактичних значень сусідніх рівнів (зведення ряду до однієї основи, метод усереднення по лівій та правій половині, метод укрупнення інтервалів, метод групов*ої та ковзної середньої).

2. Вирівнювання з використанням кривої, проведеної між конкретними рівнями таким чином, щоб вона відображала тенденцію, притаманну ряду, і одночасно звільнила його від незначних коливань (вирівнювання за методом найменших квадратів).

Зведення ряду до однієї основи проводиться шляхом обчислення показників наочності. Динаміка в даному випадку виражається достатньо чітко.

Метод усереднення по лівій та правій половині (графічний метод). Ряд розподіляється на дві частини. Для кожної його половини знаходять середнє арифметичне значення і проводять через отримані точки лінію на графіку.

Метод укрупнення (збільшення) інтервалів. Якщо розглядати певні медико-соціальні показники за ряд років, то внаслідок впливу різноманітних факторів можна відмітити зниження і підвищення окремих рівнів ряду. Це заважає виявити основну тенденцію розвитку певного явища. Тому для наочного представлення динаміки використовують метод, що базується на збільшенні періодів часу, до яких відносяться рівні ряду. Наприклад, щодобове число викликів швидкої допомоги можна замінити відповідним показником, визначеним за тиждень.

Метод ковзної середньої. Часто даний метод використовують при проведенні характеристики сезонних коливань. Особливість його полягає в тому, що проводиться заміна окремих рівнів ряду середніми значеннями, розрахованим з певного та сусідніх рівнів. Розраховують середній рівень для певного числа (частіше трьох) перших за порядком рівнів ряду, потім – середній рівень для аналогічного числа рівнів, але починаючи з другого, далі з третього і т.д. Таким чином, методика ковзної середньої дозволяє виявити тенденцію, яка була замаскована випадковими коливаннями показників.

Метод найменших квадратів. Дана методика базується на математичному законі – через ряд емпіричних точок можна провести тільки одну пряму лінію, яка відповідає вимозі: сума квадратів відхилень фактичних даних від вирівняних буде найменшою. За даним методом визначається лінія, яка найбільше підходить для емпіричних даних та дає характеристику спрямованості досліджуваного явища. Нею є парабола відповідного порядку. Для прикладу розглянемо вирівнювання по прямій (парабола першого порядку).

Рівняння прямої лінії має вигляд: y` = a₀+ a₁x, де х – порядковий номер року чи іншого періоду часу; y`- теоретичні рівні; a₀– початковий рівень; a₁ – початкова швидкість ряду. Розрахунок по прямій за методом найменших квадратів спрощується відповідним підбором способу розрахунку часу (х) таким чином, щоб S_х= 0. За таких умов розрахунок параметрів a₀та a₁ проводиться за формулами:

де a₀і a₁– постійні параметри для підстановки їх в рівняння;– число членів ряду; х – позначення одиниці часу.

Методика вирівнювання наведена на прикладі динаміки смертності немовлят в Україні за 1992-1998 роки (таблиця 2).

1. Беремо середній період часу за початок відліку (1993 рік). Час наведено в умовних одиницях від середини відліку (ряд х), S_х= 0.

2. Визначаємо постійну величину рівняння (a₀):

3. Отримуємо добуток ряду Y на ряд Х. Для 1992 року: 14,0 · (–3) = – 42,0.

4. Значення ряду (х) підносимо до квадрату.

5. Визначаємо другу постійну величину рівняння (a₁):

6. Визначаємо вирівняні рівні ряду (У`_x):

У_х = a₀+ a₁x

У₁ = 14,17 + (-0,2) · (-3) = 14,77

У₂ = 14,17 + (-0,2) · (-2) = 14,57

. . . . . . . .

У₇ = 14,17 + (-0,2) · 3 = 13,57

Аналіз динаміки медико-соціальних явищ, визначення та характеристика головних тенденцій їх розвитку формують основу для подальшого прогнозування, визначення майбутніх розмірів рівня явища.

Таблиця 2

Динаміка смертності немовлят в Україні (‰)

Роки

Рівні ряду (у)

Умовний час (х)

ху

х²

Вирівняні дані У′_х

1999

14,0

–3

–42,0

14,77

2000

14,9

–2

–29,8

14,57

2001

14,5

–1

–14,5

14,37

2002

14,7

14,17

2003

14,3

13,97

2004

14,0

28,0

13,77

2005

12,8

38,4

13,57

Σу = 99,2

Σху = –5,6

Σх² = 28

Особливо актуальними питання прогнозування стають в умовах переходу на нову методологію обліку певних явищ, в період реформування системи охорони здоров’я. Прогнозування передбачає збереження основних закономірностей в майбутньому, таким чином, воно базується на екстраполяції. Екстраполяція, яка спрямована в майбутнє чи минуле, називається, відповідно, перспективною та ретроспективною.

Теоретичною основою поширення тенденції на майбутнє є інерційність основних соціальних, медичних, економічних процесів. Чим коротшим є термін екстраполяції, тим більш надійним та точним є прогноз. Залежно від того, які принципи та висхідні дані покладені в основу прогнозу, виділяють наступні елементарні методи екстраполяції:

· середнього абсолютного приросту;

· середнього темпу росту;

· вирівнювання рядів за певною аналітичною формулою, що є найбільш поширеним методом, методологічна основа якого наведена вище.

В процесі аналізу динамічних рядів іноді доводиться визначати деякі невідомі рівні всередині даного ряду, що має назву інтерполяція. Вона базується на принципах, аналогічних екстраполяції, проте ступінь точності прогнозування очікуваного результату, звичайно, значно вища.

Щоб зробити вирівнювання, треба передовсім намалювати графічне зображення ряду і згідно його вигляду підібрати відповідну математичну модель. Найчастіше зустрічаються такі типи графіків.

Розглянемо вирівнювання динамічного ряду чисел згідно парабол першого та другого порядку, що найчастіше зустрічаються на практиці.

1. Вирівнювання динамічного ряду чисел згідно параболи першого порядку

Роки

Зайнятість

ліжка

(в днях),

t²

Y_T

Y_T=a+bt

1987

340.1

-3

-1020.3

341.4

1988

340.9

-2

-681.8

341.9

1989

338.0

-1

-338.0

342.4

1990

341.2

342.9

1991

343.0

343

343.4

1992

339.1

678.2

343.9

1993

344.2

1032.6

344.4

S(сума)

2386.5

13.7

1994

344.9

1995

345.4

Y_{T —}теоретична лінія;

t — часова точка (серединне число ряду приймається за 0, якщо ряд непарний, за 1, якщо ряд парний);

а — розмір висхідного теоретичного рівня;

b — розмір часового приросту теоретичної лінії або кут її нахилу (тенденція).

Отже, як видно із наведеного прикладу, зайнятість ліжка має тенденцію до зростання, яку прогнозовано на 1994 і 1995 роки.

1. Вирівнювання динамічного ряду чисел згідно параболи другого порядку

Роки

Смертність немовлят

y, ‰

t²

t²y

t⁴

Y_T

1986

14.3

-7

-100.1

700.7

2401

14.3

1987

14.5

-5

-72.5

362.5

625

14.2

1988

14.7

-3

-44.1

132.3

14.1

1989

14.3

-1

-14.3

14.3

13.9

1990

14.6

13.7

1991

13.9

41.7

125.1

13.6

1992

13.6

340

625

13.3

1993

13.4

93.8

656.6

2401

13.1

S(сума)

113.3

168

-12.9

2346.1

6216

1994

12.9

1995

12.6

Як бачимо, в даному прикладі смертність немовлят має тенденцію до зниження.

Динамічні ряди – ряди чисел, що характеризують зміну величини суспільного явища в часі. Динамічні ряди є матеріалом, вихідною базою для аналізу розвитку соціально-економічних явищ. В результаті статистичного спостереження і підведення підсумків одержують абсолютні показники двох видів. Одні з них характеризують стан явища на певний момент часу, або, іншими словами, наявність будь-яких одиниць станом на певний момент часу (наприклад, на критичний момент перепису). До таких показників відносять кількість населення, кількість робітників і службовців, парк тракторів, поголів’я худоби, житловий фонд тощо. Характер цих показників такий, що їх величину безпосередньо можна визначити лише станом на певний момент часу, тому їх називають моментами, а динамічні ряди з них – моментними інші показники характеризують підсумки будь-якого процесу за певний період часу (доба, місяць, квартал, рік тощо).

Такими показниками є, наприклад, кількість новонароджених, кількість виробленої електроенергії, введення в експлуатацію житлових будинків тощо. Вони мають інший характер, бо їх величину можна визначити лише за певний період (інтервал) часу. Тому їх називають інтервалами, а динамічні ряди з них – інтервальними. Отже, моментні та інтервальні показники мають різний зміст, різне економічне значення, навіть якщо вони характеризують один і той же об’єкт. Так, якщо йдеться про кількість наявних тракторів на певну дату, то це момент ний показник, і кожний його рівень належить до певного моменту часу. Якщо ж йдеться про кількість випущених товарів, то це інтервальний показник, і кожний його рівень належить до проміжку часу між двома датами (моментами).

Моментні та інтервальні динамічні ряди – основні види динамічних рядів, оскільки показники, що покладено в їх основу, безпосередньо одержують при підведенні підсумків. Розрізняють також похідний вид динамічних рядів – динамічний ряд середніх величин, який одержують внаслідок відповідної аналітичної обробки моментних та інтервальних динамічних рядів. Так, маючи інтервальний ряд грошового виторгу та кількості проданих товарів одного асортименту, можна визначити середню ціну (діленням виторгу на кількість товарів), яка й є динамічним рядом середніх величин. Таким же динамічним рядом (похідним) є середня собівартість продукції, середня заробітна плата тощо.

Особливий вид динамічних рядів – динамічний ряд хронологічних величин, один із різновидів моментного динамічного ряду. Усі показники динамічного ряду прийнято називати рівнями, і в процесі аналізу вони підлягають певній аналітичній обробці. Розрізняють початкові, кінцеві (або звітні) та середні рівні динамічного ряду. Середні рівні інтервальних динамічних рядів розраховують за допомогою середньої арифметичної, моментних – за допомогою середньої хронологічної.

Динамічні ряди мають відповідати таким вимогам: 1) рівні рядів повинні бути зіставними в часі, за територіями, об’єктами, 2) рівні ряду повинні бути однозначні за економічним змістом, 3) необхідно дотримуватися єдиної методології розрахунку показників динамічних рядів. Завдання статистики полягає в тому, щоб у процесі аналізу динаміки розкрити й охарактеризувати закономірності, що виявляються на різних етапах розвитку певного явища, виявити тенденції цього розвитку та їх особливості. У процесі аналізу динаміки розраховують і використовують її аналітичні показники: абсолютний приріст, темп зростання й приросту, а також абсолютне значення 1% приросту. Абсолютний приріст, темп зростання й приросту розраховують базисним або ланцюговими способами.

Порівняння рядів динаміки

Методи порівняння рядів, які є непорівнянними:

 прямі перерахунки даних;

 непрямі перерахунки даних (метод ключів);

 змикання рядів;

 зведення рядів до однакової основи;

 поділення ряду на інші періоди.

Особливу увагу слід приділяти методам розрахунку середніх показників рядів динаміки, які є узагальнюючою характеристикою його абсолютних рівнів, абсолютної швидкості та інтенсивності зміни рівнів рядів динаміки.

Система середніх показників динаміки включає:

– середній рівень ряду;

– середній абсолютний приріст;

– середній темп зростання;

– середній темп приросту.

Середній рівень ряду – це показник, що узагальнює підсумки розвитку явища за одиничний інтервал або момент часу. Методи розрахунку середнього рівня ряду динаміки залежать від його виду та величини інтервалу, що відповідає кожному рівню.

Для інтервальних рядів з рівними періодами часу середній рівень розраховується наступним чином: .

У моментному ряді з рівними відрізками часу обчислюється як середня хронологічна: .

Для визначення середнього рівня моментного ряду з нерівними проміжками між датами розраховується середня арифметична зважена; в якості вагових коефіцієнтів використовують тривалість проміжків часу між моментами, в яких відбуваються зміни в рівнях динамічного ряду:

де t_i – кількість днів (місяців) між суміжними датами.

Середній абсолютний приріст розраховується за формулою:

де п – число членів ряду.

Для характеристики темпів зростання та приростів за весь період, охоплений рядом динаміки, обчислюють середній темп зростання та темп приросту.

Середній темп зростання обчислюють за формулою:

або ,

де т – число коефіцієнтів росту (К_р).

Середній темп приросту обчислюється за формулою:

Вибіркове спостереження

З усіх видів несуцільного спостереження в практиці статистичних досліджень найбільше визнання і застосування дістало вибіркове спостереження.

Вибірковим спостереженням називають вид несу цільного спостереження, за характеристикою відібраної частини одиниць якого судять про всю сукупність.

Розрізняють генеральну і вибіркову сукупності.

Генеральною сукупністю називають загальну масу одиниць, з якої здійснюють відбір для дослідження.

Частину генеральної сукупності, яку відібрано для обстеження, називають вибірковою.

Обсяг генеральної сукупності позначають N, вибіркової – n.

Узагальню вальними показниками генеральної сукупності є: середній розмір ознаки , частка Р, генеральна дисперсія ; в разі вибіркової сукупності: середні вибіркова , вибіркова частка W і дисперсія.

Вибірковий метод відрізняється від інших видів несу цільного спостереження двома ознаками – наперед визначають:

1) яку частину одиниць генеральної сукупності треба обстежувати;

2) послідовність відбору одиниць, який достатньою мірою відтворює (репрезентує) розміри середніх і відносних показників генеральної сукупності.

До вибіркового спостереження статистика вдається у випадках, коли потрібно у стислі строки та з мінімальними затратами праці і коштів одержати кількісні характеристики досліджуваної сукупності, або коли не можна чи недоцільно здійснювати суцільне спостереження.

Існує ціла низка причин, унаслідок яких у багатьох випадках вибірковому спостереженню надається перевага перед суцільним. Серед них найсуттєвіші це: економія часу і засобів унаслідок скорочення обсягу обсягу робіт статистичного дослідження; зведення до мінімуму псування чи знищення досліджуваних об’єктів; забезпечення детальнішого вивчення кожної одиниці спостереження за неможливості охоплення всіх одиниць; досягнення високої точності результатів обстеження за рахунок зменшення помилок реєстрації.

Вибіркове спостереження застосовують також у поєднанні з суцільним для поглиблення дослідження або для вивчення і контролю результатів суцільного спостереження.

Етапи вибіркового спостереження:

1) обґрунтування мети вибіркового спостереження;

2) складання програми спостереження і розробка відповідних даних;

3) вирішення організаційних питань щодо спостереження;

4) визначення частки і способу відбору одиниць у вибіркову сукупність;

5) здійснення відбору;

6) реєстрація ознак досліджуваних одиниць;

7) узагальнення даних спостереження та визначення їхніх вибіркових характеристик;

8) обчислення похибок вибірки;

9) поширення кількісних характеристик вибіркового спостереження на всю сукупність.

Завдання, які вирішує вибіркове спостереження:

1) визначення середнього розміру досліджуваної ознаки;

2) визначення питомої ваги (частки) досліджуваної ознаки в певній сукупності;

3) визначення середньої та граничної похибки вибірки;

4) знаходження меж для середньої і частки при повторному і без повторному відборі;

5) визначення потрібної чисельності вибірки;

6) поширення даних вибіркового спостереження на всю сукупність.

Науковим обґрунтуванням можливості застосування вибіркового спостереження є діалектична єдність одиничного, особливого і загального, згідно з якою в кожному одиничному є риси особливого і загального, а загальне має риси одиничного і особливого. Це дає змогу за одиничним і особливим судити про загальне, за частиною – про ціле, якщо правильно знайдено зв’язок між ними.

Особливістю вибіркового спостереження порівняно з іншими видами несу цільного спостереження є те, що відбір одиниць у вибіркову сукупність забезпечує рівну можливість потрапляння кожної одиниці у вибірку. Це досягається шляхом неупередженого строгого випадкового відбору за схемами, розробленими в математичній статистиці.

Відповідь на запитання про те, з якою ймовірністю можна судити про збіг між генеральними і вибірковими узагальню вальними показниками, дає теорія вибіркового методу, що ґрунтується на основі закону великих чисел. За допомогою цього закону вирішують два взаємопов’язаних завдання:

– розраховують при заданій імовірності межі можливих відхилень вибіркового показника від відповідного показника в генеральній сукупності;

– визначають імовірність перевищення встановленої межі можливими відхиленнями вибіркового показника від генерального.

Масові явища, які вивчає статистика, перебувають під впливом багатьох випадкових чинників. Тому, використовуємо основний висновок граничних теорем ймовірності про те, що сукупна дія багатьох випадкових факторів приводить за деяких умов до результату, майже незалежного від випадку. Оскільки вибіркове спостереження пов’язане з випадковими відхиленнями характеристик вибіркової і генеральної сукупностей, то основне положення граничних теорем дає змогу стверджувати, що результати вибіркового спостереження достовірні в разі достатньо великої кількості відібраних одиниць. За цих умов вибіркові характеристики надійно відтворюють генеральні характеристики.

У разі масового спостереження розподіл емпіричних частот більшості явищ підпорядковується закону нормального розподілу. За будь-якого розподілу частот у генеральній сукупності їхні вибіркові середні мають розподіл, близький до нормального.

Доведено, що за нормального розподілу більшість величин зосереджена навколо генеральної середньої. Близько 68,3% чисельності вибіркової середньої лежить у межах генеральної середньої; 95,4% цієї чисельності – в межах і 99,7% – не виходить за межі . Нормальний розподіл указує на частоту виникнення похибок даного розміру середньої.

Випадкові похибки реєстрації при великому числі спостережень не впливають суттєво на результат дослідження, оскільки вони взаємно погашаються, а тому від них можна абстрагуватись і в подальшому розглядати тільки похибки вибірки. Принцип строгої випадковості, який покладено в основу вибірки, забезпечує її об’єктивність, дає змогу встановити межі можливих похибок і дістати майже достовірні дані для характеристики всієї сукупності явищ. Таку вибіркову сукупність називають представницькою, або репрезентативною сукупністю. До її складу входять представники всіх груп генеральної сукупності.

Точність результатів вибіркового спостереження нарешті залежатиме від способу відбору одиниць, ступеня коливання ознаки в сукупності та від кількості відібраних одиниць.

Варіаційні ряди розподілу

Різноманітність статистичних сукупностей – передумова різних форм співвідношення частот і значень варіаційної ознаки. За своєю формою ряди розподілу поділяються на одно-, дво- і багатовершинні. Наявність двох і більше вершин свідчить про неоднорідність сукупності, про поєднання в ній груп з різними рівнями ознаки. Розподіли якісно однорідних сукупностей переважно одновершинні. Серед одновершинних розподілів є симетричні та асиметричні (скошені), гостро- і плосковершинні.

Якщо частоти варіантів рівновіддалені від центра значень ознаки, такий варіаційний ряд називається симетричним, якщо ж вершина розподілу зміщена, тобто частоти по обидва боки від центра змінюються неоднаково, тоді варіаційний ряд називається асиметричним, або скошеним. Розрізняють правосторонню і лівосторонню асиметрії. Напрям асиметрії протилежний напряму зміщення вершини розподілу. В разі правосторонньої асиметрії вершина розподілу зміщена вліво, при лівосторонній – вправо. Асиметрія – результат обмеженої варіації ознак в одному напрямі або вплив переважної причини розвитку явища, яка відповідає за зміщення центра його розподілу.

Відхилення між середньою арифметичною і медіаною або модою виражають міру асиметрії. В симетричному розподілі необхідною умовою є рівність трьох характеристик: середньої арифметичної, моди і медіани:

У разі чіткої асиметрії варіаційного ряду для глибшого вивчення економічних явищ середнє значення ознаки має доповнюватися модою і медіаною.

Стандартизоване відхилення свідчить про незначну лівосторонню асиметрію, а тому розподіл посівних площ гречки за врожайністю можна вважати симетричним.

Крутість варіаційного ряду, тобто його високовершинність (гостровершинність) або низьковершинність (плосковершинність) називають ексцесом. Розподілам більш гостровершинним, ніж нормальним, відповідає позитивний ексцес, а більш плоско вершинним – від’ємний. На практиці в одному розподілі часто поєднуються всі особливості: одновершинний розподіл може бути симетричним і високо вершинним або скошеним та низьковершинним.

За узагальню вальніхарактеристики як міру крутості розподілу використовують моменти. За їх допомогою можна описати будь-який розподіл.

$Описание: C:\Users\User\Desktop\Normal_Distribution_PDF.svg.png$

Середні величини

Середні величини відносяться до узагальнюючих показників.

У статистиці усі показники розподіляються на індивідуальні та середні. Індивідуальні показники завжди характеризують окремі одиниці сукупності. Усі суспільні явища, в тому числі й правові, мають масовий характер і обов`язково відносяться до статистичних сукупностей. Кожна одиниця сукупності відрізняється від інших її одиниць розмірами ознаки, яка вивчається в процесі дослідження, тому дати узагальнюючу характеристику статистичної сукупності можна тільки за допомогою середніх показників. Наприклад, щоб об`єктивно оцінити, на якому підприємстві вища заробітна плата, слід спочатку обчислити середню заробітну плату на кожному підприємстві і тільки потім їх порівняти.

Закон великих чисел іноді називають законом середньої величини. Дійсно, значення кожної окремої одиниці може істотно змінюватися під впливом різних умов. В нашому прикладі заробітна плата кожного окремого робітника розрізнюється залежно від стажу роботи, рівня кваліфікації, кількості відпрацьованого робочого часу та інших умов. Але якщо проаналізувати середню заробітну плату, то можна встановити тенденції її зміни і різницю в оплаті праці залежно від виду підприємства і проміжку часу, за який наведені дані. Обчислена середня величина характеризує найбільш типові закономірності у розвитку явища, абстрагуючись від тих відхилень, які властиві окремим одиницям сукупності.

Необхідність в обчисленні середньої величини обумовлюється тим, що суспільні явища, які вивчаються й правовою статистикою, завжди носять масовий характер, а ознаки у окремих одиниць сукупності відрізняються одна від одної, інакше кажучи, варіюють. Якщо припустити можливість існування сукупності, в якій у всіх одиниць будуть однакові розміри ознаки, то в такій сукупності середню величину обчислювати безглуздо.

Середня величина в статистиці – це узагальнюючий показник, який характеризує типовий розмір ознаки якісно однорідної сукупності в конкретних умовах простору і часу.

Головною передумовою для обчислення і застосування середніх величин є те, що вони не можуть обчислюватися для різнорідної сукупності. Це визначає, що наукове використання середніх величин базується на поєднанні його з методом групування: спочатку слід поділити сукупність на окремі групи, а лише після цього обчислювати середні величини для якісно однорідних груп сукупності та сукупності в цілому.

Середні величини дуже широко застосовуються для обчислення середнього рівня сукупності, порівняння двох або більше об`єктів, характеристики динаміки явищ, вивчення зв`язку між ними.

У правовій статистиці середні величини використовуються для: обчислення зміни у структурі злочинності; середньої кількості осіб, яка припадає на один злочин, характеристики зміни у середньому віці злочинців по окремих видах злочинів і по усій злочинності в цілому, для характеристики додержання процесуальних строків (середні строки попереднього слідства, розгляду кримінальних, цивільних та адміністративних справ), середньої величини збитків по окремих видах злочинів та інші показники.

Існують різні точки зору на визначення поняття середньої величини. Прихильники діалектичного підходу вважають, що в реальності існують різні індивідуальні одиниці, а середня величина лише абстракція, яка характеризує у загальному вигляді сукупність в цілому. На думку інших вчених, навпаки, – існує лише середня величина, а кожна окрема одиниця, яка відхиляється від середньої, – це атавізм або ненормальний стан. Звісно, що така точка зору значно спрощує статистичний аналіз – не треба вивчати окремі одиниці сукупності, достатньо вивчити лише середні величини та визначити тенденції їх зміни.

Нам здається, що точка зору прихильників діалектичного підходу є більш вірною. Представники багатьох наук вважають, що окрім встановлення елементарних математичних закономірностей, усі науки у своїх дослідженнях повинні виявляти статистичні, а не функціональні закономірності. Лише в елементарній математиці ми можемо одержати точний результат, а вже коли із чотирьох добуваємо квадратний корінь, то одержуємо два результати: зі знаком або мінус два, або плюс два.

Таким чином середній показник має лише оціночне значення. В правовій статистиці, де окремі явища часто є унікальними він ні в якому разі не може підмінювати, і тим більше замінювати, вивчення індивідуального. Крім того, індивідуальні явища характеризують розподіл сукупності і дають змогу встановити одиниці, які істотно відрізняються від інших одиниць.

Щоб встановити їх закономірності та особливості в розвитку явища загальна середня величина, обчислена для усієї сукупності, повинна доповнюватися вивченням середніх по окремих групах. У правовій статистиці дуже часто загальна середня величина по країні в цілому доповнюється середніми показниками по окремих регіонах. Взагалі середня величина є вельми небезпечним показником. Вона можна не тільки виявити, а і приховати закономірності розвитку явища.

Будь-яке статистичне дослідження, незалежно від його об’єму, крім оцінки відносного рівня досліджуваного явища чи його структури, завершується розрахунком та оцінкою узагальнюючих статистичних критеріїв. Найбільш поширеною формою статистичних показників є середні величини, які дають узагальнену кількісну характеристику певної ознаки в статистичній сукупності за певних умов місця та часу. Вони відображають типові риси варіаційних ознак досліджуваних явищ. Зважаючи на те, що кількісна характеристика ознаки пов’язана з її якісною стороною, середні величини слід розглядати тільки у світлі умов якісного аналізу. Крім узагальнюючої оцінки певної ознаки необхідність визначення середніх для сукупності мінливих кількісних величин виникає також тоді, коли порівнюють дві їх групи, які якісно відрізняються одна від одної.

В практиці охорони здоров’я середні величини використовують досить широко:

· для характеристики організації роботи закладів охорони здоров’я (середня зайнятість ліжка, термін перебування в стаціонарі, кількість відвідувань на одного мешканця та інше);

· для характеристики показників фізичного розвитку (довжина, маса тіла, окружність голови новонароджених та інше);

· для визначення медико-фізіологічних показників організму (частота пульсу, дихання, рівня артеріального тиску та ін.);

· для оцінки даних медико-соціальних та санітарно-гігієнічних досліджень (середнє число лабораторних досліджень, середні норми харчового раціону, рівень радіаційного забруднення та інші).

За допомогою середніх можна порівнювати між собою сукупності, що мають різну варіабельність ознак. Середні величини широко використовуються для порівняння у часі, що дозволяє характеризувати найважливіші закономірності розвитку явища. Так, наприклад, закономірність збільшення росту дітей певного віку знаходить своє вираження в узагальнених показниках фізичного розвитку. Закономірності динаміки (збільшення чи зменшення) частоти пульсу, дихання, клінічних параметрів при певних захворюваннях знаходять свій прояв у статистичних показниках, які відображають фізіологічні параметри організму та інше. При цьому в окремих індивідуальних випадках дана тенденція не завжди буде визначатися. Наприклад, при лабораторних дослідженнях діагностується загальне збільшення числа лейкоцитів, яке виявляють у певних осіб під впливом тих чи інших причин (радіаційне забруднення території). В різні роки рівень даного параметра може не збільшуватися, проявлятися неоднаково в регіонах внаслідок різних конкретних умов. У зв’язку з цим дуже важливо, щоб середні показники були обгрунтовані на масовому узагальненні фактів. Це дозволяє виявити загальну тенденцію та показати типовий для даного періоду часу та регіону рівень явища. В такій ситуації середні величини нівелюють випадкові відхилення індивідуальних величин від загальної тенденції, які притаманні генеральній сукупності. В цьому проявляється дія закону великих чисел.

Найчастіше при вивченні медико-біологічних даних використовуються:

· середня арифметична

· середня гармонійна

· середня геометрична.

Крім того, практичне застосування знаходять узагальнюючі описові (непараметричні) характеристики варіативних ознак – мода і медіана.

Середні величини повинні визначатися на основі масового узагальнення фактів та застосовуватися до якісно однорідних сукупностей – це основна умова їх практичного та наукового використання. Середні величини не можна визначати, якщо сукупність досліджуваних ознак, процесів, явищ складається з неоднорідних елементів. Обгрунтованість середніх величин набуває науково-практичного значення тільки за умови правильного групування. Основними вимогами при розрахунку середньої величини є якісно однорідна сукупність та достатнє число спостережень. Якісно однорідна сукупність означає, що всі її одиниці належать до одного виду явищ. Наприклад, число днів непрацездатності хворих за певною нозологічною формою, маса дітей – хлопчиків 7 років; пульс дітей одного віку при певному захворюванні та інше. Змішування сукупностей, які визначаються різними якісними ознаками, призводить до розрахунку нетипових середніх величин. Таким чином, середні величини в статистиці тільки тоді можуть бути основою наукового аналізу, коли відображають якісно однорідну сукупність. Якісна однорідність явищ, їх типовість, базується на основі теоретичного аналізу їх суті.

Обов’язковою умовою, якій повинен відповідати наявний статистичний матеріал для розрахунку середніх величин, є також достатнє число спостережень. Даний критерій можна визначити за допомогою формул, які представлені у розділі “Організація та проведення статистичного дослідження”.

Окремі елементи (значення) сукупності однорідних за якісним складом предметів, явищ, параметрів є варіантами, а всю їх сукупність можна представити у вигляді варіаційного ряду, який є основою для визначення середніх величин. Варіаційний ряд – це ряд варіант і відповідних їм частот. Варіаційні ряди дають можливість встановити характер розподілу одиниць сукупності за тією чи іншою кількісною ознакою та її варіацію – різноманітність індивідуальних значень ознак конкретних одиниць сукупності.

Окремі значення варіант певної ознаки позначаються літерою х. Число, яке показує, як часто зустрічається та чи інша варіанта у складі даного ряду, називається частотою (f). Сума частот (åf) дорівнює загальному числу спостережень (n).

Варіаційний ряд може бути простим, де кожна варіанта представлена окремо, тому частота кожної з них дорівнює одиниці. Наприклад, розподіл хворих за частотою пульсу: 68, 69, 75, 70, 65, 68, 70, 75, 74, 72, 72, 68. Даний ряд є також нерангованим, тому що варіанти не систематизовані. Систематизувавши варіанти в порядку збільшення чи зменшення їх числового значення, даний ряд можна перетворити в рангований: 65, 68, 68, 68, 69, 70, 70, 72, 72, 74, 75, 75.

Якщо варіанти згрупувати за їх абсолютним значенням, то можна отримати згрупований варіаційний ряд, де кожна варіанта представлена зі своєю частотою. Для нашого прикладу:

Наведений згрупований ряд є неінтервальним, тому що групування проведено без конкретного інтервалу за абсолютним значенням кожної варіанти.

Варіаційні ряди, де значення варіант представлено у вигляді інтервалів, називаються інтервальними. У вигляді інтервального ряду часто представляють ознаки зі значною кількістю варіант. При цьому значення кожної варіанти представлено у вигляді інтервалу (табл. 1).

Таблиця 1

Розподіл хлопчиків 7 років за зростом

Зріст (х)

Число хлопчиків (f)

125,0-126,9

127,0-128,9

129,0-130,9

131,0-132,9

Всього

n = 28

У наведеному прикладі (табл. 1) інтервали є закритими – кожен з них має верхню та нижню межу. В практиці зустрічаються відкриті інтервали (вік 60 років і старше, зріст до 120 см та інші). При аналізі ширину відкритого інтервалу, звичайно, вважають рівною ширині суміжного з ним інтервалу.

Згрупований інтервальний варіаційний ряд одержують шляхом об’єднання варіант у групи. При цьому потрібно пам’ятати, що: а) розмір варіаційних груп повинен залежати від природи явища; б) доцільно визначати однакові інтервали; в) межі варіаційних груп не повинні повторюватись.

Всі варіаційні ряди за якісною характеристикою розподіляються на дискретні (перервні), в яких варіанти можуть бути представлені тільки цілими числами чи отримані в результаті підрахунків (розподіл за частотою пульсу, числом ліжко-днів, відвідувань) та інкретні (безперервні), де варіанти можуть бути представлені як цілими, так і дробовими числами, або є результатом вимірів (табл. 1). Клінічні параметри є здебільшого прикладом інкретних варіант.

В процесі проведення дослідження питання про число варіаційних груп вирішують з огляду на характер матеріалу та чисельність сукупності. Характерні особливості розподілу не виявляться, якщо при незначному числі одиниць спостереження взяти велике число груп, або якщо число груп є недостатнім.

При використанні ЕОМ для обробки статистичних даних групування проводять за стандартними процедурами. Однією з них є формула Стерджеса для визначення оптимального числа груп:

n = 1 + 3,322 · lgN,

де:– число груп;

N – число одиниць спостереження.

Використання даної формули доцільне при великому числі одиниць спостереження.

Іншим варіантом, більш гнучким з практичної точки зору, є метод визначення амплітуди ряду. Для вирішення питання про число груп необхідно представити статистичну сукупність у вигляді рангованого ряду, тобто розташувати її одиниці в певному порядку. При чисельності сукупності менше 100 одиниць не доцільно планувати більше 10 груп.

Різниця між максимальним та мінімальним значенням варіант називається розмахом чи амплітудою (х_max – х_min).

Етапи складання інтервального варіаційного ряду такі:

· визначення амплітуди ряду;

· визначення числа груп;

· визначення величини інтервалу.

Розрахунок середніх величин базується на значеннях варіант. Якщо варіанта представлена у вигляді інтервалу, за величину її у кожному з них приймають центральну варіанту, тобто середину інтервалу. Для дискретного ряду центральна варіанта визначається як півсума одного інтервалу. Для інкретного ряду (табл. 1) нею є півсума початкових значень двох сусідніх інтервалів: (125,0 + 127,0) : 2 = 126 см.

Загальну характеристику варіаційного ряду проводять за допомогою наступних параметрів: середньої арифметичної (`Х), середнього квадратичного відхилення (d), середньої похибки середньої величини (m), коефіцієнта варіації (С), амплітуди (х_max – х_min).

Крім вказаних, у деяких випадках для характеристики ряду доцільно визначати також моду та медіану.

Мода – це варіанта, яка має найбільшу частоту. Моду використовують у тих випадках, коли потрібно дати характеристику ознаки, яка найбільш часто зустрічається в досліджуваній сукупності. Її використовують тільки у великих сукупностях.

Медіаною в статистиці називається варіанта, яка займає серединне (центральне) положення у варіаційному ряду. Медіана поділяє ряд навпіл – по обидва боки від неї знаходиться однакова кількість одиниць сукупності.

Середня арифметична – найбільш поширений за частотою використання вид середніх величин. Вона може бути простою і зваженою. Для простого варіаційного ряду, в якому кожна варіанта повторяється один раз, визначається проста середня арифметична, яка розраховується як відношення суми значень варіант до загального числа спостережень.

де: V – значення окремих варіант;

n – загальне число спостережень.

Для прикладу за частотою пульсу, наведеного вище, визначимо:

Для згрупованого варіаційного ряду визначається зважена середня арифметична. Таким чином:

Частота, з якою зустрічається кожна варіанта, називається “вага” варіанти, а середня арифметична є зваженою, тому що варіанти беруть участь у загальній сумі неодноразово, а ніби зважено за числом відповідних частот.

При визначенні середньої арифметичної для згрупованого інтервального варіаційного ряду: 1) визначають середину інтервалу, як вказано вище; 2) визначають добуток кожної центральної варіанти на відповідну для неї частоту; 3) суму добутків ділять на число спостережень.

Важливі властивості середньої арифметичної:

· Добуток середньої на суму частот завжди дорівнює сумі добутку варіант на частоту.

· Якщо від кожної варіанти відняти якесь довільне число, то нова середня зменшиться на те ж число.

· Якщо до кожної варіанти додати якесь довільне число, то середня збільшиться на те ж число. Друга та третя властивості середньої арифметичної показують, що при зменшенні чи збільшенні варіант на одне і те ж число зменшується чи збільшується рівень ознаки на те ж число.

· Якщо кожну варіанту поділити на якесь довільне число, то середня арифметична зменшується у стільки ж разів.

· Якщо кожну варіанту помножити на якесь довільне число, то середня арифметична збільшується у стільки ж разів.

· Якщо всі частоти (ваги) поділити чи помножити на якесь число, то середня арифметична внаслідок цього не зміниться – якщо ми збільшуємо чи зменшуємо рівнозначно частоти всіх варіант, ми не змінюємо вагу кожної окремої варіанти ряду.

· Сума відхилень варіант від середньої арифметичної завжди дорівнює нулю. Це значить, що відносно середньої арифметичної взаємно погашаються відхилення варіант в той чи інший бік.

Загальні властивості можна використовувати, щоб полегшити техніку визначення середньої арифметичної варіаційного ряду.

Середня гармонійна розраховується в тих випадках, коли відомими є дані про чисельник при відсутності таких щодо знаменника. Наприклад, необхідно визначити середній час, затрачений на прийом одного хворого, коли відомо, що 5 лікарів вели прийом протягом 8 годин. Кожен з них затратив в середньому на прийом одного хворого відповідно 20; 16; 20; 15; 24 хвилини. Розрахунок має наступну схему: сукупний робочий час лікарів складав: n=8·5=40 годин (2400 хвилин, або 480 хвилин на одного лікаря). Навантаження на кожного лікаря визначається: для першого – 480 : 20 = 24 хворих; для другого – 480 : 16 = 30 хворих і т.д. Сумарно – 130 хворих.

Середня геометрична визначається для тих параметрів, зміни значень яких проходять в геометричній прогресії (зміна чисельності населення в період між переписами, результати титрування вакцин, приріст маси тіла новонароджених протягом окремих місяців життя та інше).

Логарифм середньої геометричної дорівнює сумі логарифмів всіх членів ряду, розділених на їх число.

Середня арифметична, яка використовується самостійно, сама по собі, часто має обмежене значення тому, що вона не відображає розміри коливання кількісних варіант ряду (варіабельність ряду). Важливою характеристикою ряду є оцінка різноманітності (мінливості, варіабельності) варіант досліджуваної сукупності. Основою даної оцінки є визначення відхилень окремих варіант від середнього значення ряду. Якщо варіаційний ряд більш компактний, варіанти менше відрізняються від середньої арифметичної. Тому можна вважати, що дана середня величина є більш типовою і краще описує дану сукупність. Якщо варіаційний ряд розкиданий, варіанти значно відрізняються від середньої. В такому випадку середня є менш типовою та не зовсім чітко характеризує ряд і властивості окремих його варіант.

Одним із критеріїв різноманітності варіант ряду є його амплітуда – різниця крайніх значень. Проте, вона не враховує характер їх розподілу. За умови високої компактності розподілу варіант в сукупності і при наявності окремих варіант, що різко відрізняються від інших (“вискакуючі” варіанти), амплітуда не відображатиме істинний характер розподілу.

Іншою величиною мінливості ознак досліджуваної сукупності є середнє квадратичне відхилення (стандартне відхилення), яке позначається символом “сигма” (δ). Чим вищим є середнє квадратичне відхилення, тим вищим буде ступінь різноманітності ознак сукупності та менш типовою середня. Наприклад, аналіз організації госпіталізації хворих показав, що середня тривалість доопераційного періоду при плановій госпіталізації у двох стаціонарах складає:

Лікарня № 1

Лікарня № 2

Х = 3,1 дня

Х = 3,2 дня

δ = 0,3 дня

δ = 0,9 дня

Середня тривалість підготовки до операції в обох стаціонарах практично однакова, проте середнє квадратичне відхилення, що відображає його коливання, в лікарні № 1 значно менше. Це є свідченням вищої типовості середньої величини та, ймовірно, результатом кращої організації госпіталізації і підготовки до оперативного лікування.

У випадках, коли значення ознак більше відхиляються від середньої (лікарня № 2), узагальнююча варіація знаходиться під впливом більш різнорідних умов і досліджувана сукупність хворих за якістю організації їх госпіталізації є менш однорідною. Таким чином середня величина, яка характеризує цю менш однорідну сукупність, буде менш типовою.

Формула розрахунку середнього квадратичного відхилення така:

– для простого варіаційного ряду;

– для згрупованого варіаційного ряду.

Де:– 1 – число спостережень в досліджуваній сукупності (при досить великому числі спостережень –> 30 – у формулу замість n–1 можна підставити n); P – частота варіант; d = V –`M – відхилення кожної варіанти від середньої арифметичної; V – значення варіанти.

Методику розрахунку середнього квадратичного відхилення розглянемо на прикладі оцінки середньої тривалості лікування хворих з пневмонією в стаціонарі (табл. 2).

Таблиця 2.

Терміни лікування хворих з пневмонією в стаціонарі

Число днів

(х)

Число хворих (f)

V · P

d = V – M

d²

d²·P

-3

-2

128

-1

187

-0

180

n = 48

816

Σ=110

Послідовність розрахунку середнього квадратичного відхилення:

1. Визначаємо середню арифметичну (M).

2. Знаходимо відхилення варіант від середньої арифметичної (d).

3. Підносимо відхилення (d) в квадрат (для уникнення від’ємних значень та збільшення значень крайніх відхилень).

4. Перемножуємо квадрати відхилень на відповідні частоти – d²·P та визначаємо їх суму.

5. Визначаємо середнє квадратичне відхилення за наведеною формулою.

Для нашого прикладу: d = ± 1,5 дня.

Середнє квадратичне відхилення завжди визначають у тих іменованих числах, у яких представлені конкретні вимірювані варіанти та середня. Воно характеризує абсолютну міру варіації – чим більш мінливий, розсіяний ряд, тим “d” буде більше. Чим більше варіюють індивідуальні значення варіант, тим менш точно характеризується варіаційний ряд за допомогою середньої арифметичної.

Практична значимість середнього квадратичного відхилення (сигми) базується на теорії нормального розподілу варіант, згідно з якою їх відхилення від середнього значення в ту чи іншу сторону зустрічаються рівнозначно. Переважна більшість явищ при практичному аналізі медико-біологічних даних мають нормальний розподіл. Теорією статистики доведено, що в нормальному варіаційному ряду знаходиться шість середніх квадратичних відхилень – рівномірно по три з кожного боку від середньої.

Виходячи із значення середньої арифметичної (M) та середнього квадратичного відхилення (d) при симетричному ряді розподілу можна стверджувати з відомим ступенем вірогідності, що певне число варіант буде знаходитись у визначених межах. Згідно з теорією математичної статистики, що доведено на великих числах спостережень, у межах “M ± 1d” будуть мати місце не менше 68,3 % всіх варіант даної сукупності. За межами даного інтервалу може бути до 31,7 %, всіх спостережень. В межах “M ± 2d” будуть розташовані близько 95,5 % всіх варіант. Практично весь варіаційний ряд – 99,7 % варіант знаходитиметься в діапазоні “M ± 3d“. Окремі варіанти – до 0,3 % досліджуваної сукупності можуть не відповідати загальному характеру розподілу та випадати з нього внаслідок занадто низького чи високого рівня (“вискакуючі” варіанти).

Закономірностями розподілу частот варіаційного ряду можна скористатися при вирішенні практичних завдань. Для наведеного вище прикладу планова доопераційна середня тривалість госпіталізації в лікарні № 1 складає 3,1±0,3 дні. Аналіз 200 випадків лікування дозволяє зробити такий висновок: близько 68,3 % хворих (136 чоловік) матимуть тривалість доопераційного періоду в середньому 2,8 – 3,4 дні (M ± 1d). У 95,5 % хворих (округлено 190 пацієнтів) він становитиме 2,5 – 3,7 дня (M ± 2d). Інтервал 2,2 – 4,0 дні (M ± 3d) описуватиме тривалість доопераційного періоду практично для всіх обстежених хворих.

Узагальнення представленого матеріалу дозволяє зробити висновок про можливість практичного використання середнього квадратичного відхилення:

· для визначення амплітуди ряду;

· відновлення крайніх його значень;

· визначення ймовірного числа спостережень в певних інтервалах.

Наведені критерії розподілу ознак (“сигмальна оцінка”) використовують для індивідуальної оцінки показників фізичного розвитку, визначення норм клінічних та фізіологічних параметрів. Інтервал оцінки показників у межах (M±1d) в більшості випадків визначає їх середній рівень; в межах (M) ± 2d – вище чи нижче середніх; в межах (M ± 3d) – дуже високі, чи дуже низькі рівні показників.

Оцінка середнього квадратичного відхилення залежить не тільки від ступеня варіації ознаки, але й від абсолютних рівнів варіант та середньої. Тому безпосередньо порівнювати середні квадратичні відхилення варіаційних рядів з різними рівнями і одиницями виміру, які характеризують неоднорідні явища (довжина у см, вага у кг), не можна. Для можливості такого зіставлення необхідно визначити для кожного ряду відношення середнього квадратичного відхилення (сигми) до середньої арифметичної у відсотках, тобто визначити коефіцієнт варіації, мінливості (С). Він є відносною мірою варіабельності, яка виражається в абстрактних, а не іменованих числах, критерієм надійності середньої величини і визначається за формулою:

Чим вищий коефіцієнт варіації, тим більша варіабельність даної ознаки. Наприклад, визначили, що після дозованого навантаження середня частота пульсу в обстежених складала M=90 уд./хв., d=8 уд/хв., а артеріальний тиск M=135 мм. рт. ст., d=7 мм. рт. ст.

Коефіцієнт варіації для першого (за частотою пульсу) ряду:

Коефіцієнт варіації для другого (за артеріальним тиском) ряду:

Для даного прикладу артеріальний тиск є більш сталою ознакою, ніж частота пульсу. Таким чином, коефіцієнти варіації дають більш точну оцінку мінливості явищ та визначають найбільшу (найменшу) варіабельність їх ознак.

Орієнтовними критеріями оцінки варіабельності за його коефіцієнтом можна вважати: низький рівень – до 10 %; середній рівень – 10-20 %, високий рівень – вище 20 %. Високий рівень коефіцієнта свідчить про невисоку точність узагальнюючої характеристики середньої величини, одним із шляхів підвищення якої є збільшення числа спостережень.

За назвами в статистиці використовуються середня арифметична, середня хронологічна, середня геометрична, середня квадратична величини, середня гармонічна. Зміна значення показника степенної середньої величини (m) визначає вид середньої величини: якщо m = 1, то ми одержуємо середню арифметичну величину; якщо m = 2, то одержуємо середню квадратичну; якщо m = 3, то – середню кубічну; якщо m = – 1,– маємо середню гармонічну; якщо m = 0, то середню геометричну. З степенних середніх в правовій статистиці найчастіше використовують середню арифметичну, значно рідше – середню гармонічну; середня геометрична застосовується лише при обчисленні середніх темпів динаміки, а середня квадратична – при обчисленні показників варіації.

Розмір обчисленої середньої величини завжди відрізняється, оскільки обумовлюється показником степеню середньої величини. В загальному вигляді це правило має назву мажорантності середніх: чим більше показник ступеня, тим більше величина середньої. При цьому слід мати на увазі, що правильну характеристику різних сукупностей в кожному окремому випадку визначає лише певний вид середньої величини. Основний критерій визначення виду середньої величини – це механізм утворення обсягу ознаки, яка варіює. Середня тільки тоді буде вірно відображати усю сукупність, коли при заміні усіх ознак (варіантів) середньою загальний обсяг варіюючої ознаки залишиться незмінним.

Залежно від того, як формується загальний обсяг сукупності, і визначається вид середньої величини. Середня арифметична застосовується тоді, коли обсяг варіючої ознаки утворюється як сума окремих варіантів, середня квадратична – коли обсяг варіючої ознаки має вигляд суми квадратів окремих варіантів, середня гармонічна – коли обсяг варіючої ознаки складається із суми обернених значень окремих варіантів, середня геометрична – коли обсяг варіючої ознаки одержується як добуток окремих варіантів.

У правовій статистиці середні арифметичні величини застосовуються тоді, коли первинні (вихідні) дані наведені у такому вигляді, що загальний обсяг ознаки для усієї сукупності можна одержати шляхом підсумовування їх у всіх одиницях.

Середня арифметична проста (незважена) обчислюється шляхом ділення суми індивідуальних значень ознаки на їх загальну кількість. Спочатку підсумовують значення усіх варіантів, а потім ця сума ділиться на загальну кількість одиниць сукупності. Наприклад, один слідчий районної прокуратури закінчив за місяць 2 справи, інший – три. В результаті у середньому вони закінчили розгляд 2,5 справи ((2+3) : 2). При цьому не можна відкинути 0,5 справи і округлити цифру, тому що в такому разі результат буде помилковий.

Середня арифметична проста використовується дуже рідко, як правило, лише тоді, коли сукупність повністю симетрична (нормальний закон розподілу одиниць) або має невелику кількість одиниць (як в нашому прикладі).

Оцінка вірогідності результатів дослідження

Вивчення будь-якої проблеми, звичайно, супроводжується необхідністю дати відповідь на ряд питань щодо вірогідності отриманих результатів:

1. Чи завжди потрібно оцінювати їх вірогідність?

2. Наскільки вірогідним є розподіл певної ознаки в даній сукупності – чи достовірним є отриманий показник?

3. Чи відображає розподіл певного параметра в досліджуваній групі аналогічний розподіл параметра в генеральній сукупності (серед всіх хворих)?

4. Чи суттєва різниця між аналогічними показниками в різних групах (хворих, населення та інших)?

Необхідність оцінки вірогідності отриманих результатів визначається об’ємом дослідження. Вона не проводиться при суцільному дослідженні (для аналізу відібрано всі можливі одиниці спостереження), оскільки для всієї (генеральної) сукупності можна отримати тільки одне значення певного показника. Проте в системі медико-біологічних досліджень (крім даних офіційної статистики) рідко використовують суцільні методи збору інформації – переважна частина досліджень є вибірковими.

При проведенні вибіркового дослідження ми можемо зустрічатися з загальними похибками та похибками вибірки. Загальні похибки можуть мати як систематичний характер (методичні, недоліки вимірювальної апаратури), так і випадковий (помилки дослідника). Похибки вибіркового спостереження пов’язані з відбором його одиниць. Це похибки типовості, репрезентативності.

В процесі аналізу розраховані показники (середня тривалість лікування, частота ускладнень, рівень летальності та інші) розглядають як узагальнюючі величини. Якщо результати отримано на основі достатнього за кількістю та якісно однорідного матеріалу, то можна вважати, що вони досить точно характеризують досліджувані явища.

Наприклад, при вивченні ефективності нового методу лікування, апробованого на 400 хворих, встановлено, що у 12 з них виникли ускладнення. Частота їх складає 3 %. Значення узагальнюючого результату полягає в тому, що при проведенні аналогічних вибіркових досліджень, або для оцінки всієї сукупності хворих з даною патологією (генеральної сукупності) ми могли б передбачити отримання аналогічних даних. Проте не виключена ситуація, коли при проведенні повторних досліджень показник, який був визначений шляхом вибіркового спостереження, в незначній мірі може відрізнятись від результату суцільного спостереження.

Отже, оцінити вірогідність результатів вибіркового дослідження означає визначити, в якій мірі зроблені для нього висновки (результати) можна перенести на генеральну сукупність. Тобто, за частиною явища міркувати про явище в цілому та основні притаманні йому закономірності.

Для оцінки вірогідності результатів будь-яких вибіркових досліджень визначають середню похибку відносної (m_Р) чи середньої величини (m_Х).

Середня похибка для відповідних показників при значному числі спостережень (n>30) може бути розрахована за наступними формулами:

– середня похибка середньої величини;

– середня похибка відносної величини;

де: δ– середнє квадратичне відхилення;

n – число спостережень у вибірковій сукупності. При малому числі спостережень (n<30) в знаменнику замістьвикористовується n-1.

P – відносний показник;

q – величина, зворотна до показника, тобто вірогідність того, що дане явище не буде зареєстровано. Сума двох протилежних вірогідностей дорівнює одиниці: P + q = 1. Якщо показник розраховано на 100 (%), то

q = 100 – P, якщо на 1000 (%₀), то q = 1000 – P і т.д.

Для наведеного вище прикладу середня похибка показника становить:

Середня похибка відображає розміри випадкових коливань показника при вибіркових дослідженнях і залежить від числа спостережень та якісних характеристик явища. Чим більше число спостережень та чим одноріднішою є відібрана для аналізу група, тим менші межі ймовірних випадкових коливань показника.

Середня похибка дозволяє визначити довірчі межі, в яких з певною ймовірністю знаходиться істинне значення показника. Інтервал, розташований між ними, носить назву довірчого інтервалу.

Довірчі межі середньої та відносної величин визначають за формулою:

M_ген = M_виб + tm_`_х ; Р_ген = Р_виб + tm_Р_,де:

1) M_гента Р_ген – значення середніх та відносних величин для генеральної сукупності;

2) M_вибі Р_виб– значення середніх та відносних величин, розрахованих для вибіркової сукупності;

3) tm_`_хі m_Р– середні похибки відповідних показників (похибки репрезентативності);

4) t – критерій вірогідності або довірчий критерій. Він може бути заданий з різними ступенями точності і залежно від імовірності безпомилкового прогнозу складати t = 2 i t = 3.

Межі вірогідності (довірчі межі) (Р + 2m) (при t = 2) дають можливість визначити межі коливання показника з імовірністю 95,5 % (р = 0,05), а довірчі межі (Р+3m) (при t = 3) дають можливість визначити межі коливання показника з імовірністю 99,7 % (р = 0,01). Імовірність безпомилкового прогнозу і довірчий критерій визначають на етапі планування статистичного дослідження.

При заданих ступенях імовірності довірчий критерій (t) має незмінну величину, а довірчий інтервал залежить від величини середньої похибки (m), значення якої зменшується при збільшенні числа та якісного складу спостережень.

Для нашого прикладу, при використанні наведеного методу лікування частота ускладнень для генеральної сукупності з імовірністю 95,5 % (t = 2) може знаходитись в межах: Р_ген = Р_виб + tm_Р= 3,0 + 2×0,85 % – від 1,3 % до 4,7 %. З імовірністю 99,7 % довірчий інтервал складатиме від 0,45 % до 5,55 %.

Практична цінність використання середньої похибки середньої чи відносної величини полягає не тільки у визначенні довірчих меж певного показника, але й в оцінці його суттєвості (вірогідності). Якщо вона досить велика, ми можемо отримати значення довірчого інтервалу в діапазоні, який не підлягає логічній оцінці. Наприклад, при використанні певної методики вигодовування новонароджених приріст маси тіла склав 800+300 грам. Довірчий інтервал при вірогідності безпомилкового прогнозу 99 % складатиме від 100 до 1700 грам. Отже, наявність від’ємного результату не дозволяє в повній мірі за даним показником оцінити ступінь впливу даної методики на приріст маси тіла новонароджених.

У вказаній ситуації для підвищення вірогідності оцінки необхідно зменшити довірчий інтервал шляхом збільшення числа спостережень і, відповідно, зменшення середньої похибки показника. Суттєвість (вірогідність) показника визначається на основі співвідношення між абсолютним його значенням та середньою похибкою, яке повинно бути не менше трьох – Р/m_Р>3.

В медико-біологічних дослідженнях часто виникають ситуації, коли при порівнянні окремих параметрів необхідно оцінити суттєвість різниці між ними. Суттєва різниця між окремими показниками вибіркового дослідження свідчить про можливість перенесення отриманих висновків на генеральну сукупність. Критерієм оцінки суттєвості різниці є коефіцієнт вірогідності (критерій Стьюдента[1]), який визначають за формулою:

– для середніх величин;

– для відносних величин.

При великому числі спостережень (n>30) різниця між показниками є суттєвою, якщо:

1) t ≥ 2 (відповідає вірогідності безпомилкового прогнозу 95,5 %);

2) t > 3 (відповідає вірогідності безпомилкового прогнозу 99,7 %).

За умови t<2 ступінь вірогідності безпомилкового прогнозу складає менше 95%. В цьому випадку ми не можемо стверджувати, що різниця між показниками є суттєвою.

Наприклад, в школі № 1 навчається 1200 дітей. Профілактичні щеплення проти грипу проведено 900 дітям. В наступному році захворіло 350, в тому числі 150-и з них не були зроблені щеплення. Для того, щоб порівняти і оцінити суттєвість різниці між рівнями захворюваності серед щеплених дітей, та тих, яким щеплення не проводились, необхідно:

1) визначити рівні захворюваності в школі № 1 серед першої (з щепленнями) та другої (без щеплень) груп. Вони складають, відповідно:

Р₁=150 : 300×100=50 %.

Р₂=(350-150) : 900×100=22,2 %;

2) визначити середні похибки вказаних показників:

3) оцінити суттєвість різниці за критерієм Стьюдента:

Висновок: різниця між показниками суттєва, оскільки t>3, що відповідає рівню безпомилкового прогнозу 99,7 %.

Часто при клінічних чи експериментальних дослідженнях доводиться мати справу з малим числом спостережень (30 та менше): 5-6 лабораторних тварин, 10-12 хворих та інші. Якщо дослідження вірно організоване, відібрані однорідні групи, їх можна розглядати як вибіркові з малим числом спостережень. Проте при малому числі спостережень (n<30) оцінка вірогідності різниці між параметрами окремих груп проводиться на основі порівняння результату не з граничними значеннями критерія Стьюдента, а з його табличними значеннями для відповідного числа спостережень (n`= n₁+n₂–2). Якщо визначений t-критерій перевищує табличне значення чи дорівнює йому – різниця між показниками статистично доведена.

Критерій вірогідності (t) використовують при попарному порівнянні досліджуваних параметрів. Проте при проведенні статистичного аналізу іноді необхідно оцінити вірогідність різниці більшої від двох кількості показників клініко-статистичних груп. Попарне порівняння їх не дозволяє отримати узагальнюючу оцінку. В іншому випадку необхідно провести порівняння сукупності не тільки за узагальнюючими показниками, а й за характером розподілу ознак в досліджуваних групах.

У вказаних ситуаціях найбільш доцільним є використання критерію відповідності – χ² (критерій Пірсона), який визначають за формулою:

де

р – реальні частоти;

р₁ – теоретичні частоти.

В узагальненому вигляді практичне значення критерію відповідності (χ²) полягає в наступному:

· оцінка вірогідності різниці між кількома порівнюваними групами при декількох можливих результатах з різним ступенем ймовірності (наприклад, три чи чотири групи хворих з різними методами лікування та їх наслідками – різною частотою ускладнень);

· визначення наявності зв’язку між двома факторами (залежність результатів лікування від віку хворих, важкості захворювання, зв’язок між важкістю патології новонароджених та станом їх фізичного розвитку);

· оцінка ідентичності розподілу частот у двох та більше сукупностях (аналогічність розподілу хворих за рівнем клінічних параметрів при різних ступенях тяжкості патології).

Основою методу є визначення суттєвості різниці (відхилень) фактичних даних від теоретичних (очікуваних). Розрахунок теоретичних даних базується на припущенні, що між порівнюваними групами за досліджуваними факторами різниця відсутня. Дане припущення визначається як “нульова гіпотеза”.

На її основі визначають “очікувані” результати, і порівнюють їх з фактичними даними. Якщо різниця відсутня, можна зробити висновок, що “нульова гіпотеза” підтвердилась. При наявності відмінностей фактичних даних від теоретичного розподілу визначають суттєвість різниці між порівнюваними групами.

Оцінка результатів (χ²) проводиться за спеціальною таблицею. Суттєвою вважається різниця в тому випадку, коли величина розрахованого коефіцієнта перевищує табличне значення при вірогідності не нижче 95 % (імовірність похибки менше 5 % – p<0,05).

Методику розрахунку коефіцієнта відповідності розглянемо на прикладі оцінки впливу методу лікування на їх результати.

1. Наведемо фактичні результати за трьома методами лікування (табл. 1).

Таблиця 1

Результати лікування хворих за окремими методиками

Методики

лікування

Всього

хворих

Результати лікування – р (фактичні дані)

Хороші

Задовільні

Незадовільні

III

Всього

200 (100 %)

109

2. Розраховуємо “очікувані” результати згідно з “нульовою” гіпотезою, основою якої є припущення, що різниця між результатами лікування за окремими методиками відсутня. В цьому випадку за основу беремо загальний розподіл хворих, пролікованих всіма методами. Числова характеристика “нульової” гіпотези складає: хороші результати в цілому мали 54,5 %, задовільні – 26,5 % та незадовільні – 19 % хворих. Відповідно до вказаного розподілу визначають “очікувані” дані результатів лікування за окремими методиками (значення визначаємо в цілих числах) – табл. 2.

Таблиця 2

“Очікувані” дані результатів лікування за окремими методиками

Методики

Лікування

Всього

хворих

Результати лікування – р₁ (очікувані дані)

Хороші

Задовільні

Незадовільні

III

Всього

200

109 (54,5 %)

53 (26,5 %)

38 (19 %)

3. Співставимо фактичні та теоретичні дані (їх різницю) з розрахунком величини відхилення та врахуванням його напрямку (знаку) – табл. 3.

Таблиця 3

Розрахунок величини відхилення

Методики

лікування

(р – р₁)

Хороші

Задовільні

Незадовільні

III

9 (36–27)

4 (48–44)

–13 (25–38)

–2 (11–13)

–4 (17–21)

6 (25–19)

–7 (3–10)

0 (15–15)

7 (20–13)

Всього

4. Розраховуємо квадрат відхилення теоретичних даних від фактичних та середній квадрат відхилення на одну “очікувану” групу. Даний етап розрахунку має такий вигляд у зв’язку з тим, що на основі фактичних відхилень неможливо визначити його сумарну величину, оскільки вона дорівнює нулю. При піднесенні відхилень у квадрат визначаємо їх параметри для кожної групи (р – р₁)². З огляду на різне число хворих у досліджуваних групах величина відхилень може бути різною, тому квадрат їх ділимо на число відповідних спостережень кожної групи – (р – р₁)²:р₁_.Провівши розрахунки, визначаємо (р – р₁)² та (р – р₁)²:р₁(табл.4).

Таблиця 4

Квадрат відхилення теоретичних даних від фактичних та середній квадрат відхилення

Методики

лікування

(р – р₁)²

р₁

Хороші

Задовіль-ні

Незадо-вільні

Хороші

Задовіль-ні

Незадо-вільні

III

169

2,75

0,23

0,31

0,77

1,9

4,9

3,77

∑ = 17,63

5. Визначаємо χ² – підсумок результатів останнього етапу розрахунків. В нашому випадку χ² = 17,63. Порівнюємо його з табличним значенням, враховуючи число ступенів свободи (n¹), які визначають за формулою: n¹= (S – 1)(r – 1), де

S – число груп хворих (для нашого прикладу – три);

r – число результативних груп (три).

Число ступенів свободи n¹= (3 – 1)(3 – 1) = 4. Отриманий результат перевищує табличні значення χ²для n¹= 4 за всіма рівнями вірогідності. Отже, ми можемо зробити висновок про суттєвість (вірогідність) різниці та наявність зв’язку між показниками при різних методах лікування – “нульова гіпотеза” не підтвердилась.

Критерій відповідності не є абсолютно універсальним і має деякі недоліки:

· залежить від групування первинного матеріалу;

· важливе значення має однорідність наведених груп для попередження згладжування різниці між ними;

· величина χ² визначає наявність зв’язку, проте не виявляє його силу та характер;

· метод не визначає суттєвість різниці між окремими групами, тому іноді для попарного порівняння груп необхідно додатково використовувати t – критерій.

Статистичний критерій – це вирішальне правило, що забезпечує математично обґрунтоване прийняття істинної і відхилення помилкової гіпотези. Статистичні критерії будуються на основі статистики ^(х₁, х₂, х_п) – деякої функції від результатів спостережень х₁, х₂, х_п. Статистика ¥ є випадковою величиною з певним законом розподілу. Серед значень статистики ¥ виділяють критичну область ¥_кр з властивістю: якщо емпіричне значення статистики ¥_емп належать області ¥ _кр, то нульову гіпотезу відхиляють (відкидають), інакше – приймають. Статистичні критерії визначають у практичній діяльності метод розрахунку певного числа, яке позначається як емпіричне значення критерію, наприклад, ґ_ем“ для ґ-критерію Стьюдента.

Співвідношення емпіричного і критичного значень критерію є підставою для підтвердження чи спростовування гіпотези. Наприклад, у разі застосування ґ-критерію Стьюдента, якщо ґ_ем” > ґ_кр , то значення статистики належать критичній області і нульова гіпотеза Н₀ відхиляється (приймається альтернативна гіпотеза Ні).Правила прийняття статистичного рішення обумовлюються для кожного критерію.

Параметричні і непараметричні критерії

Відповідно до статистичних гіпотез статистичні критерії діляться на параметричні й непараметричні.

Параметричні критерії використовуються в завданнях перевірки параметричних гіпотез і включають у свій розрахунок показники розподілу, наприклад, середні, дисперсії тощо. Це такі відомі класичні критерії, як г-критерій, ґ-критерій Стьюдента, ^-критерій Фішера та ін. Непараметричні критерії перевірки гіпотез засновані на операціях з іншими даними, зокрема, частотами, рангами тощо. Це А-критерій Колмогорова-Смірнова, [/-критерій Вілкоксона-Манна-Вітні та багато інших.

Параметричні критерії дозволяють прямо оцінити рівень основних параметрів генеральних сукупностей, різниці середніх і відмінності в дисперсіях. Критерії спроможні виявити тенденції зміни ознаки при переході від умови до умови, оцінити взаємодію двох і більш факторів у впливі на зміни ознаки. Параметричні критерії вважаються дещо більш потужними, ніж не-параметричні, за умов, якщо ознака виміряна за інтервальною шкалою і нормально розподілена. Проте з інтервальною шкалою можуть виникнути певні проблеми, якщо дані, представлено не в стандартизованих оцінках. До того ж перевірка розподілу “на нормальність” вимагає досить складних розрахунків, результат яких заздалегідь невідомий. Найчастіше розподіли ознак відрізняються від нормального, тоді доводиться звертатися до непараметричних критеріїв.

Непараметричні критерії позбавлені перерахованих вище обмежень. Проте вони не дозволяють здійснити пряму оцінку рівня таких важливих параметрів, як середнє або дисперсія, з їхньою допомогою неможливо оцінити взаємодію двох і більше умов або факторів, що впливають на зміну ознаки. Непараметричні критерії дозволяють вирішити деякі важливі завдання, які супроводжують дослідження в психології і педагогіці: виявлення відмінностей у рівні досліджуваної ознаки, оцінка зсуву значень досліджуваної ознаки, виявлення відмінностей у розподілах ознак.

Застосування критеріїв для прийняття (відхилення) статистичних гіпотез завжди здійснюються з довірчою ймовірністю, інакше кажучи, на певному рівні значущості.

Рівень статистичної значущості

Рівень статистичної значущості – це ймовірність того, що ми визнали відмінності істотними (прийняли альтернативну гіпотезу і відхилили нульову), а вони насправді випадкові. Наприклад, якщо вказується, що відмінності достовірні на 5%-му рівні значущості, то мається на увазі ймовірність 0,05 того, що вони все ж таки недостовірні. Рівень значущості – це ймовірність відхилення нульової гіпотези, тоді як вона правильна.

Історично склалося так, що в психолого-педагогічних дослідженнях прийнято вважати нижчим рівнем статистичної значущості 5%-й рівень (а<0,05), достатнім – 1%-й рівень (а<0,01) і вищим – 0,1%-й рівень (а<0,001). Тому в таблицях критичних значень звичайно приводяться значення критеріїв, відповідних рівням статистичної значущості а<0,05 і а<0,01, інколи а<0,001. Пропонуємо дотримуватися правила відхилення гіпотези про відсутність відмінностей (Н₀) і прийняття гіпотези про статистичну достовірність відмінностей (ні), доки рівень статистичної значущості не досягне а=0,05.

Непараметричні критерії оцінки вірогідності результатів дослідження

Розглянуті в попередніх розділах статистичні параметри (середня арифметична, середнє квадратичне відхилення, коефіцієнт варіації, середня похибка), які використовують для аналізу варіаційних рядів, є його параметрами і вимагають представлення вихідних даних у кількісному вигляді. Проте при проведенні медичних досліджень досить часто доводиться використовувати методи статистичного аналізу даних, представлених у напівкількісному, напів’якісному та якісному вигляді. Сукупність статистичних методів, що дозволяють оцінити їх результати як в кількісному (числовому), так і в напівкількісному та якісному вигляді об’єднують в групу непараметричних критеріїв оцінки. Використання їх не потребує розрахунку параметрів варіаційного ряду. Тут має значення порядок розташування варіант в сукупностях. Статистична оцінка спостережень за допомогою непараметричних критеріїв, як правило, простіша, ніж оцінка параметричними методами та не вимагає громіздких розрахунків.

Переважна більшість параметричних статистичних методик передбачає наявність нормального розподілу варіант у досліджуваній сукупності. Але на практиці зустрічаються не тільки нормальні, але й інші види розподілу ознак. За наявності таких ситуацій використання параметричних критеріїв підвищує ймовірність помилок. Практичне застосування непараметричних критеріїв, не пов’язане з певною формою розподілу досліджуваних ознак, робить доцільним їх самостійне використання або в комплексі з параметричними.

Незважаючи на певну простоту методик, надійність непараметричних критеріїв досить висока. Вони можуть бути використані для оцінки вірогідності медико-біологічних результатів однієї сукупності, різниці двох та більше вибіркових сукупностей.

Зважаючи, що одним із найбільш важливих розділів їх використання є оцінка вірогідності різниці порівнюваних спостережень, весь комплекс вказаних методик можна розподілити на дві групи: 1) непараметричні критерії оцінки вірогідності різниці у двох взаємопов’язаних сукупностях; 2) непараметричні критерії оцінки вірогідності різниці у двох незалежних сукупностях.

Першу групу використовують для оцінки вірогідності різниці за результатами, які отримані для однієї групи хворих протягом різних періодів (до лікування – після лікування, перший день – п’ятий день та інші). Порівняння їх результатів може бути проведено за критеріями знаків та Вілкоксона.

Критерій знаків дозволяє включати в аналіз до 100 пар спостережень і базується на підрахунку числа однонаправлених результатів при парному їх порівнянні.

В табл. 1 наведено динаміку швидкості осідання еритроцитів (ШОЕ) за 10-денний період лікування.

Таблиця 1

Динаміка швидкості осідання еритроцитів (ШОЕ)

Хворі

(№ п/п)

ШОЕ

Спрямованість різниці

1 день

10 день

–

Основні етапи розрахунку за критерієм знаків:

1. Визначення спрямованості різниці в порівнюваних групах результатів. Динаміка при цьому позначається відповідними знаками: +, –, =. З подальшого розрахунку виключають результати без динаміки (=).

2. Підрахунок числа спостережень з позитивними та негативними результатами. З 10 наведених зміни виявились у 9 хворих.

3. Підрахунок числа знаків, які рідше зустрічаються. Зниження ШОЕ (–) виявлено у 6 хворих, а приріст (+) зареєстровано в трьох випадках.

4. Порівняння меншого числа знаків (критерій Z) з табличними критичними значеннями для відповідного числа спостережень. Для= 9 визначений критерій Z=3 вище граничного табличного (Z_0,05= 2). Отже, не можна зробити висновок про суттєвість динаміки швидкості осідання еритроцитів – ймовірність похибки більше 5 % (р>0,05).

Т-критерій Вілкоксона передбачає можливість попарного порівняння від 6 до 25 пар спостережень. Його доцільно використовувати в тих випадках, коли виявляються неоднозначні кількісні зміни досліджуваного параметра (зниження та підвищення). При цьому враховують не тільки спрямованість різниці, а і її величину.

Методика аналізу за Т-критерієм Вілкоксона наведена в табл. 2.

1. Визначається різниця в парах спостереження між кінцевим та початковим рівнями артеріального тиску.

2. Рангування отриманих результатів за величиною різниці між показниками без врахування спрямованості змін. Результати без динаміки виключають з подальшої оцінки. Якщо два результати мають однакові абсолютні значення змін, їх ранги визначають як півсуму порядкових номерів.

3. Підрахунок суми однозначних рангів (позитивних та негативних).

4. Оцінка за меншою сумою рангів шляхом порівняння визначеного Т-критерію з табличним значенням при відповідному числі пар спостережень.

Таблиця 2

Рівень артеріального тиску у хворих на гіпертонічну хворобу до та після лікування (мм. рт. ст.).

Хворі

Рівень артеріального тиску

Різниця

Ранг різниці

Сума рангів

“+”

Сума рангів

” – “

до лікування

після лікування

В.

Д.

К.

Р.

Н.

П.

А.

С.

Ю.

Т.

210

180

185

160

175

190

155

180

200

170

175

180

140

185

145

150

160

155

–35

+25

–30

–40

–20

–45

–15

6,5

–

6,5

Т=40

Т = 5

Критерій Вілкоксона Т=5 не перевищує табличного значення для даного числа спостережень –= 9, T_0,05 = 6. Отже, можна зробити висновок про суттєвість (статистичну вірогідність) динаміки артеріального тиску у хворих після лікування.

Друга група непараметричних критеріїв – критерії, що застосовують у випадку порівняння незалежних сукупностей. Типовими прикладами їх практичного використання є порівняння дослідної та контрольної груп хворих, результатів двох груп спостережень, що відносяться до різних захворювань чи ступенів важкості патології.

Для порівняння незалежних сукупностей використовують:

· серійний критерій;

· критерій Уайта;

· Ван дер Вардена.

Але найбільш потужним в даній групі є критерій Колмогорова-Смирнова (λ²), методика застосування якого наведена нижче (табл. 3):

Таблиця 3

Зміна радіоактивності крові опромінених тварин, що отримували (Х) та не отримували (У) лікування (в умовних одиницях)

Варіанти по ряду Х та У

Частоти варіант по групах

Накопичені частоти по групах

Накопичені частки по групах

Різниця

Рх

Ру

0,23

0,56

0,67

0,23

0,44

0,78

0,34

0,44

0,89

0,34

0,55

0,45

0,55

0,56

0,44

0,67

0,33

0,89

0,11

Nx=9

Ny=8

1. Числові значення двох варіаційних рядів об’єднують в один варіаційний ряд, варіанти якого розташовують в порядку зростання.

2. Визначають частоти варіант для обох груп спостережень.

3. Визначають накопичені частоти для обох груп.

4. Визначають накопичені частки, для чого накопичені частоти діляться на число спостережень для кожної групи.

5. Розраховується різниця накопичених часток груп Х та У без врахування знаків.

6. Визначають максимальну різницю – Д = 0,55 (графа 8, табл. 3).

7. Визначають критерій λ²за формулою:

Порівнюємо отриманий результат з граничним значенням критерія Колмогорова-Смирнова. Якщо λ²більше граничного значення, різниця між порівнюваними групами є суттєвою.

Для даного завдання λ²= 1,28. Порівнюючи отриманий результат з граничним значенням λ²_0,05= 1,84 та λ²_0,01= 2,65, робимо висновок про несуттєвість різниці між порівнюваними групами.

Типи і загальна схема перевірки статистичних гіпотез

Типи статистичних гіпотез визначаються сукупністю тих завдань і методів їх розв’язання, які мають місце в психолого-педагогічних дослідженнях. За своїм прикладним змістом статистичні гіпотези можна поділити на декілька основних типів щодо :

v закону розподілу випадкових величин тих чи інших властивостей;

v чисельних показників параметрів (середніх, дисперсій, кореляцій та ін.);

v однорідності двох або декількох вибірок

v відмінностей у рівні ознак досліджуваного явища або процесу;

v відмінностей у розподілі ознак.

Загальна схема перевірки статистичних гіпотез. Незважаючи на різноманітність типів гіпотез і критеріїв, схему перевірки статистичних гіпотез можна представити у вигляді послідовності таких процедур:

1) формулювання гіпотез Н₀ і Н_і на основі завдань дослідження;

2) перевірка припущень щодо відповідності розподілу параметричному сімейству, параметрів вибірки та іншої додаткової інформації;

3) прийняття рівня значущості а;

4) вибір статистичного критерію;

5) розрахунки емпіричного критерію;

6) визначення області критичних значень критерію;

7) прийняття статистичного рішення;

8) формулювання статистичних висновків;

9) прийняття рішення щодо продовження (припинення) досліджень;

10) формулювання змістовних висновків.

У прикладній статистиці використовують два стилі викладу методів перевірки гіпотез. За одним формулюють і нульову, і альтернативну гіпотези (або набору гіпотез), перевірки яких відбувається за певними критеріями. При іншому стилі виклад будують як алгоритмічний опис критеріїв для перевірки нульової гіпотези, про альтернативи навіть не згадується. У посібнику пропонується перший варіант.