Home » Динамические ряды

Динамические ряды

June 14, 2024

ХАРАКТЕРИСТИКА И АНАЛИЗ СТАТИСТИЧЕСКИХ ДАННЫХ. СРЕДНИЕ ВЕЛИЧИНЫ И ПОКАЗАТЕЛИ ВАРИАЦИИ. ПАРАМЕТРИЧЕСКИЕ И НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ОЦЕНКИ И АНАЛИЗА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. АНАЛИЗ ВЗАИМОСВЯЗИ МЕЖДУ ИССЛЕДУЕМЫМИ ПАРАМЕТРАМИ СТАТИСТИЧЕСКОЙ СОВОКУПНОСТИ.

Обозначим количество всех подлежащих обследованию объектов N . Допустим, что каждому i объекту соответствует значение x_i. Согласно данному ранее определению совокупность всех возможных значений (теоретически домысливаемых) N объектов называется генеральной совокупностью, а N – объемом генеральной совокупности. Генеральная совокупность может быть конечной или бесконечной. Пусть количество реально наблюдаемых объектов из N равно n. Тогда x_i, – выборка из генеральной совокупности, – объем выборки. Выборка из генеральной совокупности должна обладать следующими свойствами:

• каждый элемент x_i выбран случайно;

• все x_i имеют одинаковую вероятность попасть в выборку;

•должно быть настолько велико, насколько это позволяет решать задачу с требуемым качеством (выборка должна быть репрезентативной, представительной).

В дальнейшем будем иметь дело с выборкой, обладающей такими свойствами.

Принято считать, что при≥ 60 выборка большая, или репрезентативная, а при n < 60 – малая. Такое деление выборки на большую и малую условно. Разные авторы используют разное пограничное, делящее выборки на малые и большие, которое к тому же зависит от решаемой статистической задачи. Понятие репрезентативная выборка не всегда можно связать с ее объемом n. Чаще это зависит от реально исследуемого объекта или явления, объема генеральной совокупности, и даже от трудоемкости и стоимости получения наблюдений или измерений для формирования выборки.

Возможны ситуации, когда генеральная совокупность мала. Например, исследуется время наработки до отказа уникального оборудования, когда в эксплуатации находится заведомо малое количество его экземпляров (N). Доступного для исследования оборудования (n) может быть еще меньше. Поэтому выборка объемом n, близким к объему генеральной совокупности N, может считаться репрезентативной и одновременно быть малой (n < 60).

Рассмотрим некоторые формы представления выборки из генеральной совокупности.

1. Представление выборки из генеральной совокупности в негруппированном виде x_i, . Такая форма связана с наличием сведений о каждом элементе выборки.

2. Представление выборки в виде вариационного ряда (в упорядоченном виде)

х₍₁₎ ≤ х₍₂₎ ≤ … ≤ х_(i) ≤ … ≤ х_(n) .

В этом случае х_(i) – член вариационного ряда, или варианта. Часто х_(i)называют порядковой статистикой /1, 4/. Индекс (i) указывает на порядковый номер элемента в вариационном ряду. Часто х_(i) обозначают х_(R), где R – ранг порядковой статистики. Иногда используют обозначение х_Ri_,где R_i – ранг i-го наблюдения в исходной (неупорядоченной) выборке. Любую функцию порядковых статистик также называют порядковой статистикой.

Форма представления выборки из генеральной совокупности в виде вариационного ряда не приводит к потере информации о каждом элементе выборки, но искажает информацию, устанавливая зависимость между соседними элементами выборки.

Необходимо помнить! Члены вариационного ряда, в отличие от элементов исходной выборки, уже не являются взаимно независимыми (по причине их предварительной упорядоченности).

3. Представление выборки в группированном виде. Такая форма представления выборки из генеральной совокупности связана с разбиением области задания случайной величины Х на L интервалов группирования. При этом известно только количество элементов выборки n_j, , попавших в j интервал и последовательность границ интервалов разбиения. Для определения числа L интервалов искусственного группирования можно, в частности, воспользоваться формулой Старджеса /5/

L = 1 + 3.322Чlg.

(1)

Иногда L может быть задано природой исследуемого явления или условиями проведения эксперимента. В данном случае ширина каждого интервала может быть отличной от других (неравноточное группирование). На некоторых этапах статистического анализа необходимо исходную выборку представлять в группированном виде.

Рассмотрим последовательность процедуры группирования неупорядоченной выборки из генеральной совокупности.

1. Формирование вариационного ряда.

2. Выделение минимального и максимального элементов выборки

х_min = х₍₁₎,

х_max = х_(n).

3. Определение числа интервалов группирования осуществляется или из соображения точности и устанавливается эмпирическим путем в зависимости от объема выборки, либо по формуле Старджеса /5/, либо определяется природой явления или условиями проведения эксперимента. Округление при нахождении L осуществляется до ближайшего целого числа.

4. Определение ширины интервалов гистограммы (при равноточном группировании)

(2)

Если при вычислении h необходимо округлить результат, следует помнить, что последний интервал группирования будет меньше ширины h при округлении в большую сторону и больше h – при округлении в меньшую сторону.

5. Формирование последовательности границ интервалов разделения.
Образуемый вариационный ряд границ интервалов группирования будет выглядеть как

х₍₁₎, х₍₁₎ + h, х₍₁₎ + 2h, … , х₍₁₎+ (L-1) Чh, х_(n).

Иногда, для того чтобы x₍₁₎ и х_(n)попали внутрь соответственно 1-го и L-го интервалов группирования, границы х₍₁₎ и х_(n)корректируют следующим образом:

x^‘₍₁₎ = x₍₁₎ – h/2,

x^‘_(n) = x_(n) + h/2.

Следовательно, число интервалов разделения увеличивается на 1

L′ = L + 1.

При этом последовательность границ интервалов разделения будет представлена в виде

x¢₍₁₎, х¢₍₁₎+ h, х¢₍₁₎+ 2h, … , х¢₍₁₎ + LЧh, х¢_(n).

6. Определение количества элементов выборки n_j, попавших в каждый j интервал.

Группированная форма представления случайной величины не содержит информации о каждом элементе выборки. При этом часто в качестве значения случайных величин, попавших в текущий интервал, принимается его середина.

Это важно! От негруппированной выборки всегда можно перейти к группированной, но не наоборот. Необходимо помнить, что переход к группированной форме представления выборки сопряжен с потерей информации об исследуемом объекте, процессе или явлении.

Любые характеристики случайной величины, полученные по выборке из генеральной совокупности, называются выборочными, или эмпирическими, характеристиками, а характеристики, полученные по генеральной совокупности, – теоретическими, или генеральными, характеристиками.

Задачи математической статистики. Основная задача математической статистики состоит в определении свойств генеральной совокупности по выборке ограниченного объема n, используя по возможности априорные предположения.
К задачам математической статистики относятся следующие:

· разработка и применение методов оценивания числовых и функционных характеристик генеральной совокупности по выборке из нее;

· описание эмпирических данных вероятностными моделями;

· проверка статистических гипотез;

· определение взаимосвязи между характеристиками исследуемых объектов, процессов, явлений;

· выявление согласия наблюдаемых (эмпирических) данных с теорией;

· принятие решений;

· другие задачи.

Все методы математической статистики можно разделить на параметрические методы, основанные на использовании знаний о вероятностной модели, и непараметрические, когда априорных представлений о виде модели нет или она не используется.

Параметрические методы рекомендуется применять для объема выборки≥ 60.

Средние величины

Любое статистическое исследование, независимо от его объема, кроме оценки относительного уровня исследуемого явления или его структуры, завершается расчетом и оценкой обобщающих статистических критериев. Наиболее распространенной формой статистических показателей являются средние величины, которые дают обобщенную количественную характеристику определенного признака в статистической совокупности при определенных условиях места и времени. Они отображают типичные черты вариационных признаков исследуемых явлений. Ввиду того, что количественная характеристика признака связана с ее качественной стороной, средние величины следует рассматривать только в свете условий качественного анализа. Кроме обобщающей оценки определенного признака необходимость определения средних для совокупности изменчивых количественных величин возникает также тогда, когда сравнивают две их группы, которые качественно отличаются одна от другой.

В практике здравоохранения средние величины используют достаточно широко:

· для характеристики организации работы учреждений здравоохранения (средняя занятость койки, срок пребывания в стационаре, количество посещений на одного жителя и другое);

· для характеристики показателей физического развития (длина, масса тела, окружность председателя новорожденных и другое);

· для определения медико-физиологичных показателей организма (частота пульса, дыхания, уровня артериального давления и др.);

· для оценки данных медико-социальных и санитарно-гигиенических исследований (среднее число лабораторных исследований, средние нормы пищевого рациона, уровень радиационного загрязнения и другие).

С помощью средних можно сравнивать между собой совокупность, которая имеет разную вариабельность признаков. Средние величины широко используются для сравнения во времени, что позволяет характеризовать важнейшие закономерности развития явления. Да, например, закономерность увеличения роста детей определенного возраста находит свое выражение в обобщенных показателях физического развития. Закономерности динамики (увеличение или уменьшение) частоты пульса, дыхания, клинических параметров при определенных заболеваниях находят свое проявление в статистических показателях, которые отображают физиологичные параметры организма и другое. При этом в частных индивидуальных случаях дана тенденция не всегда будет определяться.

Например, при лабораторных исследованиях диагностируется общее увеличение числа лейкоцитов, которое обнаруживают у определенных лиц под воздействием тех или других причин (радиационное загрязнение территории). В разные годы уровень данного параметра может не увеличиваться, проявляться неодинаково в регионах в результате разных конкретных условий. В связи с этим очень важно, чтобы средние показатели были обоснованы на массовом обобщении фактов. Это позволяет обнаружить общую тенденцию и показать типичный для данного периода времени и региона уровень явления. В такой ситуации средние величины нивелируют случайные отклонения индивидуальных величин от общей тенденции, какие присущие генеральной совокупности. В этом проявляется действие закона больших чисел.

Чаще всего при изучении медико-биологических данных используются:

· средняя арифметическая

· средняя гармоничная

· средняя геометрическая.

Кроме того, практическое применение находят обобщающие описательные (непараметрические) характеристики вариабельных признаков – мода и медиана.

Средние величины должны определяться на основе массового обобщения фактов и применяться к качественно однородной совокупности – это основное условие их практического и научного использования. Средние величины нельзя определять, если совокупность исследуемых признаков, процессов, явлений состоит из неоднородных элементов. Обоснованность средних величин приобретает научно-практическое значение только при условии правильного группирования. Основными требованиями при расчете средней величины является качественно однородная совокупность и достаточное число наблюдений. Качественно однородная совокупность значит, что все ее единицы принадлежат к одному виду явлений. Например, число дней неработоспособности больных за определенной нозологической формой, масса детей – мальчиков 7 лет; пульс детей одного возраста при определенном заболевании и другое. Смешивание совокупности, которая определяется разными качественными признаками, приводит к расчету нетипичных средних величин. Таким образом, средние величины в статистике только тогда могут быть основой научного анализа, когда отображают качественно однородную совокупность. Качественная однородность явлений, их типичность, базируется на основе теоретического анализа их сути.

Обязательным условием, которому должен отвечать имеющийся статистический материал для расчета средних величин, является также достаточное число наблюдений. Данный критерий можно определить с помощью формул, которые представлены в разделе “Организация и проведение статистического исследования”.

Отдельные элементы (значение) совокупности однородных за качественным составом предметов, явлений, параметров являются вариантами, а всю их совокупность можно представить в виде вариационного ряда, который является основой для определения средних величин. Вариационный ряд – это ряд вариант и соответствующих им частот. Вариационные ряды дают возможность установить характер деления единиц совокупности по тому или другому количественному признаку и ее вариацию – разнообразие индивидуальных значений признаков конкретных единиц совокупности.

Отдельные значения вариант определенного признака отражаются буквой х. Число, которое показывает, как часто встречается но другая ли варианта в составе данного ряда, называется частотой (f). Сумма частот (f) равняется общему числу наблюдений (n).

Вариационный ряд может быть простым, где каждая варианта представленная отдельно, потому частота каждой из них равняется единице. Например, деление больных за частотой пульса: 68, 69, 75, 70, 65, 68, 70, 75, 74, 72, 72, 68. Данный ряд есть также неранжированим, потому что варианты не систематизированы. Систематизировав варианты в порядке увеличения или уменьшения их числового значения, данный ряд можно превратить в ранжированний: 65, 68, 68, 68, 69, 70, 70, 72, 72, 74, 75, 75.

Если варианты сгруппировать за их абсолютным значением, то можно получить сгруппированный вариационный ряд, где каждая варианта представленная со своей частотой. Для нашего примера:

Приведен сгруппированный ряд неинтервальным, потому что группирование проведено без конкретного интервала за абсолютным значением каждой варианты.

Вариационные ряды, где значение вариант представлен в виде интервалов, называются интервальными. В виде интервального ряда часто представляют признаки со значительным количеством вариант. При этом значение каждой варианты представлены в виде интервала.

Деление мальчиков 7 лет по росту

Рост (х)

Число мальчиков (f)

125,0-126,9

127,0-128,9

129,0-130,9

131,0-132,9

Всего

n = 28

В приведенном примере интервалы являются закрытыми – каждый из них имеет верхнюю и нижнюю границу. В практике встречаются открытые интервалы (возраст 60 лет и старше, рост до 120 см и другие). При анализе ширину открытого интервала, конечно, считают ровной ширине смежного с ним интервала.

Сгруппированный интервальный вариационный ряд получают путем объединения вариант в группы. При этом нужно помнить, что: а) размер вариационных групп должен зависеть от природы явления; бы) целесообразно определять одинаковые интервалы; в) границы вариационных групп не должны повторяться.

Все вариационные ряды за качественной характеристикой распределяются на дискретные, в которых варианты могут быть представлены только целыми числами или полученные в результате подсчетов (деление за частотой пульса, числом дней кровати, посещений) и инкретные (непрерывные), где варианты могут быть представлены как целыми, так и дробными числами, или является результатом измерений. Клинические параметры являются по большей части примером инкретных вариант.

В процессе проведения исследования вопроса о числе вариационных групп решают учитывая характер материала та численность совокупности. Характерные особенности деления не окажутся, если при незначительном числе единиц наблюдения взять большое число групп, или если число групп является недостаточным.

При использовании компьютерной техники для обработки статистических данных группирования проводят по стандартным процедурам. Одной из них есть формула Стерджеса для определения оптимального числа групп:

n = 1 + 3,322 · lgN

где:– число групп;

N – число единиц наблюдения.

Использование данной формулы целесообразное при большом числе единиц наблюдение.

Другим вариантом, более гибким с практической точки зрения, является метод определения амплитуды ряда. Для решения вопроса о числе групп необходимо представить статистическую совокупность в виде рангованого ряда, то есть расположить ее единицы в определенном порядке. При численности совокупности меньше 100 единиц не целесообразно планировать больше 10 групп.

Разница между максимальным и минимальным значением вариант называется размахом или амплитудой (хmax – хmin).

Этапы составления интервального вариационного ряда таковы:

· определение амплитуды ряда;

· определение числа групп;

· определение величины интервала.

Расчет средних величин базируется на значениях вариант. Если варианта представленная в виде интервала, за величину ее в каждом из них принимают центральную варианту, то есть середину интервала. Для дискретного ряда центральная варианта определяется как полусумма одного интервала. Для инкретного ряда ею является полусумма начальных значений двух соседних интервалов: (125,0 + 127,0) : 2 = 126 см.

Общую характеристику вариационного ряда проводят с помощью следующих параметров: средней арифметической (Х), среднего квадратичного отклонения (d), средней погрешности средней величины (m), коэффициента вариации (С), амплитуды (хmax – хmin).

Кроме указанных, в некоторых случаях для характеристики ряда целесообразно определять также моду и медиану.

Мода – это варианта, которая имеет наибольшую частоту. Моду используют в тех случаях, когда нужно дать характеристику признака, который наиболее часто встречается в исследуемой совокупности. Ее используют только в большой совокупности.

Медианой в статистике называется варианта, которая занимает срединное (центральное) положение в вариационном ряду. Медиана разделяет ряд пополам – по обе стороны от нее находится одинаковое количество единиц совокупности.

Средняя арифметическая – наиболее распространен за частотой использования вид средних величин. Она может быть простой и взвешенной. Для простого вариационного ряда, в котором каждая варианта повторяється один раз, определяется простая средняя арифметическая, которая рассчитывается как отношение суммы значений вариант к общему числу наблюдений.

где: х – значение отдельных вариант;

n – общее число наблюдений.

Для примера за частотой пульса, приведенного выше, определим:

Для сгруппированного вариационного ряда определяется взвешенная средняя арифметическая.

Частота, с которой встречается каждая варианта, называется “весом” варианты, а средняя арифметическая является взвешенной, потому что варианты принимают участие в общей сумме неоднократно, а будто взвешенно за числом соответствующих частот.

При определении средней арифметической для сгруппированного интервального вариационного ряда: 1) определяют середину интервала, как указано выше; 2) определяют произведение каждой центральной варианты на соответствующую для нее частоту; 3) сумму произведений делят на число наблюдений.

Главные свойства среднего арифметического:

· Произведение средней на сумму частот всегда равняется сумме произведения вариант на частоту.

· Если от каждой варианты отнять какое-то произвольное число, то новая средняя уменьшится на то же число.

· Если к каждой варианты прибавить какое-то произвольное число, то средняя увеличится на то же число. Вторая и третья свойства среднего арифметического показывают, что при уменьшении или увеличении вариант на одно и то же число уменьшается или увеличивается уровень признака на то же число.

· Если каждую варианту разделить на какое-то произвольное число, то средняя арифметическая уменьшается в столько же раз.

· Если каждую варианту умножить на какое-то произвольное число, то средняя арифметическая увеличивается в столько же раз.

· Если все частоты (весы) разделить или умножить на какое-то число, то средняя арифметическая вследствие этого не изменится – если мы увеличиваем или уменьшаем равнозначно частоты всех вариант, мы не изменяем вес каждой отдельной варианты ряда.

· Сумма отклонений вариант от средней арифметической всегда равняется нулю. Это значит, что относительно средней арифметической взаимно погашаются отклонения вариант в ту или другую сторону.

Общие свойства можно использовать, чтобы облегчить технику определения средней арифметической вариационного ряда.

Средняя гармоничная рассчитывается в тех случаях, когда известными даны о числителе при отсутствии таких относительно знаменателя. Например, необходимо определить среднее время, тратящее на прием одного больного, когда известно, что 5 врачей вели прием на протяжении 8 часов. Каждый из них тратил в среднем на прием одного больного соответственно 20; 16; 20; 15; 24 минуты. Расчет имеет следующую схему: совокупное рабочее время врачей составляло: n=8·5=40 часов (2400 минут, или 480 минут на одного врача). Нагрузка на каждого врача определяется: для первого – 480 : 20 = 24 больных; для второго – 480 : 16 = 30 больных и т.д. Суммарно – 130 больных.

Средняя геометрическая определяется для тех параметров, изменения значений которых проходят в геометрической прогрессии (изменение численности населения в период между переписями, результаты титрования вакцин, прирост массы тела новорожденных на протяжении отдельных месяцев жизни и другое).

Логарифм средней геометрической равняется сумме логарифмов всех членов ряда, разделенных на их число.

Средняя арифметическая, которая используется самостоятельно, сама по себе, часто имеет ограниченное значение потому, что она не отображает размеры колебания количественных вариант ряда (вариабельность ряда). Важной характеристикой ряда является оценка разнообразия (изменчивость, вариабельность) вариант исследуемой совокупности. Основой данной оценки является определение отклонений отдельных вариант от среднего значения ряда. Если вариационный ряд более компактен, варианты меньше отличаются от средней арифметической. Потому можно считать, что дана средняя величина является более типичной и лучше описывает данную совокупность. Если вариационный ряд разбросан, варианты значительно отличаются от средней. В таком случае средняя является менее типичной и не совсем четко характеризует ряд и свойства отдельных его вариант.

Одним из критериев разнообразия вариант ряда является его амплитудой – разницей крайних значений. Однако, она не учитывает характер их деления. При условии высокой компактности деления вариант в совокупности и при наличии отдельных вариант, что резко отличаются от других (“випрыгивающие” варианты), амплитуда не будет отображать истинный характер деления.

Другой величиной изменчивости признаков исследуемой совокупности является среднее квадратичное отклонение (стандартное отклонение), которое отражается символом “сигма” (δ). Чем более высоким является среднее квадратичное отклонение, тем более высокой будет степень разнообразия признаков совокупности и менее типичной средняя. Например, анализ организации госпитализации больных показал, что средняя длительность дооперационного периода при плановой госпитализации в двух стационарах составляет:

Больница № 1

Больница № 2

Х = 3,1 дня

Х = 3,2 дня

д = 0,3 дня

д = 0,9 дня

Средняя длительность подготовки к операции в обоих стационарах практически одинаковая, однако среднее квадратичное отклонение, которое отображает его колебание, в больнице № 1 гораздо меньше. Это является свидетельством высшей типичности средней величины и, вероятно, результатом лучшей организации госпитализации и подготовки к оперативному лечению.

В случаях, когда значения признаков больше отклоняются от средней (больница № 2), обобщающая вариация находится под воздействием более разнородных условий и исследуемая совокупность больных по качеству организации их госпитализации является менее однородной. Таким образом средняя величина, которая характеризует эту менее однородную совокупность, будет менее типичной.

Формула расчета среднего квадратичного отклонения такова:

– для простого вариационного ряда;

– для сгруппированного вариационного ряда.

Где:– 1 – число наблюдений в исследуемой совокупности (при достаточно большом числе наблюдений –> 30 – в формулу вместо n–1 можно подставить n); f – частота вариант; d = x –Х – отклонение каждой варианты от средней арифметической; х – значение варианты.

Методику расчета среднего квадратичного отклонения рассмотрим на примере оценки средней длительности лечения больных с пневмонией в стационаре

Сроки лечения больных с пневмонией в стационаре

Число дней

(х)

Число больных (f)

x · f

d = x –Х`

d2·f

-3

-2

128

-1

187

-0

180

n = 48

816

У=110

Последовательность расчета среднего квадратичного отклонения:

1. Определяем среднюю арифметическую (Х).

2. Находим отклонение вариант от средней арифметической (d).

3. Подносим отклонение (d) в квадрат (для избежания отрицательных значений и увеличения значений крайних отклонений).

4. Перемножаем квадраты отклонений на соответствующие частоты – d2·f и определяем их сумму.

5. Определяем среднее квадратичное отклонение за приведенной формулой.

Для нашего примера: d = ± 1,5 дня.

Среднее квадратичное отклонение всегда определяют в тех именуемых числах, в которых представлены конкретные измеряемые варианты и средняя. Оно характеризует абсолютную меру вариации – чем более изменчивый, рассеян ряд, тем “” будет больше. Чем больше варьируют индивидуальные значения вариант, тем менее точно характеризуется вариационный ряд с помощью средней арифметической.

Практическая значимость среднего квадратичного отклонения (сигмы) базируется на теории нормального деления вариант, согласно с которой их отклонения от среднего значения в ту или другую сторону встречаются равнозначно. Подавляющее большинство явлений при практическом анализе медико-биологических данных имеют нормальное деление. Теорией статистики доказано, что в нормальном вариационном ряду находится шесть средних квадратичных отклонений – равномерно по три с каждой стороны от средней.

Выходя из значения средней арифметической (Х) и среднего квадратичного отклонения (d) при симметричном ряду деления можно утверждать с известной степенью достоверности, что определено число вариант будет находиться в определенных границах. Согласно с теорией математической статистики, что доказано на больших числах наблюдений, в пределах “Х ± 1d” будут иметь место не меньше 68,3 % всех вариант данной совокупности. За пределами данного интервала может быть до 31,7 %, всех наблюдений. В пределах “Х ± 2d” будут расположены около 95,5 % всех вариант. Практически весь вариационный ряд – 99,7 % вариант будет находиться в диапазоне “Х ± 3d“. Отдельные варианты – до 0,3 % исследуемой совокупности могут не отвечать общему характеру деления и выпадать из него в результате слишком низкого или высокого уровня (“випрыгивающие” варианты).

Закономерностями деления частот вариационного ряда можно воспользоваться при решении практических заданий. Для приведенного выше приложу плановая дооперационная средняя длительность госпитализации в больнице № 1 составляет 3,1±0,3 дни. Анализ 200 случаев лечения позволяет сделать такой вывод: около 68,3 % больных (136 человек) будут иметь длительность дооперационного периода в среднем 2,8 – 3,4 дни (`Х ± 1d). В 95,5 % больных (округлено 190 пациентов) он будет составлять 2,5 – 3,7 дня (`Х ± 2d). Интервал 2,2 – 4,0 дни (`Х ± 3d) будет описывать длительность дооперационного периода практически для всех обследованных больных.

Обобщение представленного материала позволяет сделать вывод о возможности практического использования среднего квадратичного отклонения:

· для определения амплитуды ряда;

· возобновление крайних его значений;

· определение вероятного числа наблюдений в определенных интервалах.

Приведены критерии деления признаков (“сигмальна оценка”) используют для индивидуальной оценки показателей физического развития, определения норм клинических и физиологичных параметров. Интервал оценки показателей в границах `(Х±1d) в большинстве случаев определяет их средний уровень; в пределах (Х ± 2d) – выше или ниже средних; в границах (`Х ± 3d) – очень высокие, очень низкие уровни ли показателей.

Оценка среднего квадратичного отклонения зависит не только от степени вариации признака, но и от абсолютных уровней вариант и средней. Потому непосредственно сравнивать средние квадратичные отклонения вариационных рядов с разными уровнями и единицами измерения, которые характеризуют неоднородные явления (длина в см, вес в кг), нельзя. Для возможности такого сопоставления необходимо определить для каждого ряда отношение среднего квадратичного отклонения (сигмы) к средней арифметической в процентах, то есть определить коэффициент вариации, изменчивости (С). Он является относительной мерой вариабельности, которая выражается в абстрактных, а не именуемых числах, критерием надежности средней величины и определяется за формулой:

Чем высший коэффициент вариации, тем большая вариабельность данного признака. Например, определили, что после дозированной нагрузки средняя частота пульса в обследованных составляла Х=90 уд./м., d=8 уд/м., а артериальное давление Х=135 мм рт. ст. d=7 мм рт. ст.

Коэффициент вариации для первого (по частоте пульса) ряда:

Коэффициент вариации для второго (по артериальному давлению) ряда:

Для данного примера артериальное давление является более постоянным признаком, чем частота пульса. Таким образом, коэффициенты вариации дают более точную оценку изменчивости явлений и определяют наибольшую (наименьшую) вариабельность их признаков.

Ориентировочными критериями оценки вариабельности его коэффициентом можно считать: низкий уровень – до 10 %; средний уровень – 10-20 %, высокий уровень – выше 20 %. Высокий уровень коэффициента свидетельствует о невысокой точности обобщающей характеристики средней величины, одним из путей повышения которой есть увеличение числа наблюдений.

Пример расчета средней величины

Задание

1. Рассчитать среднее арифметическое, среднеквадратическое отклонение и коэффициент вариации. Сделать заключение о разнообразии.

2. Сопоставить средние величины в разных комплексах и провести их сравнение

2.1. Среднее арифметическое, среднеквадратическое отклонение и коэффициент вариации одних и тех же элементов в разных комплексах.

2.2. По коэффициенту вариации сравнить разные элементы внутри одного комплекса

2.3. Сравнить все элементы всех комплексов по коэффициенту вариации и выяснить, в каком комплексе самый маленький коэффициент, а где самый большой.

Исходные данные и вычисления

1. Рассчитать среднее арифметическое, среднеквадратическое отклонение и коэффициент вариации дл мощность почв (х. см) субальпийского комплекса южного склона массива Эльбрус:

№

DХ

DХ²

4,15

17,19

-30,85

951,98

-17,85

318,77

21,15

447,15

-28,85

832,56

-18,85

355,48

-11,85

140,52

-16,85

284,06

-20,85

434,90

-13,85

191,94

-18,85

355,48

-8,85

78,40

23,15

535,73

-13,85

191,94

16,15

260,69

-3,85

14,85

-23,85

569,02

21,15

447,15

33,15

1098,65

-13,85

191,94

-25,85

668,44

-5,85

34,27

7,15

51,06

6,15

37,77

-20,85

434,90

1,15

1,31

-3,85

14,85

2,15

4,60

16,15

260,69

11,15

124,23

6,15

37,77

43,15

1861,56

21,15

447,15

120

66,15

4375,27

-3,85

14,85

-31,85

1014,69

-13,85

191,94

-3,85

14,85

-13,85

191,94

6,15

37,77

6,15

37,77

6,15

37,77

-6,85

46,98

26,15

683,60

-13,85

191,94

-13,85

191,94

26,15

683,60

31,15

970,06

Сумма

2585

0,00

20382

X_ср=

53,85

Среднее арифметическое

433,66

Дисперсия

20,82

Среднеквадратическое отклонение

0,39

Коэффициент вариации

DZ=

6,533333

М_о=

38,00

Мода

К_ас=

0,76

Коэффициент асимметрии

m_ас=

0,34

t_ф=

2,22

t_т=

2,00

Распределение величин по интервалам

Характеристика величин: средняя мощность почв составила 53,85; но дисперсия и среднеквадратическое отклонение очень большие, что говорит об очень большом разбросе в данных (от 22 до 120 см.)

2. Сопоставить средние величины в разных комплексах и провести их сравнение статистических показателей массивов Чегет и Эльбрус:

Чегет

Эльбрус

Субальпийский пояс

Лесной пояс

Субальпийский пояс

Влажность почв в %

30,2

14,0

46,3

28,0

12,0

44.0

–

Мощность почв в см.

81,0

25,0

30,0

81,0

18,1

23,0

51,0

20,2

39,6

Урожайность трав ц/га

17,3

5,7

32,6

–

21,4

5,3

24,7

Проект, покрытие трав %

62,2

14,7

22,7

–

75,0

9,5

12,6

Сопоставить среднее арифметическое, среднеквадратическое отклонение и коэффициенту вариации одних и тех же элементов в разных комплексах.

Среднее арифметическое влажности почв в массиве Чегет у субальпийского и лесного пояса отличается всего на 2.2%. при этом средняя мощность почв в этих поясах одинакова и составляет 81см. Сравнивая по среднее величине урожайность трав в массиве Чегет и Эльбрус субальпийского пояса видно, что на Эльбрусе урожайность выше, примерно на 20%, это подтверждается средним проективным покрытием трав, которое выше на 12.8%.

Среднеквадратическое отклонение и коэффициенту вариации максимальные в массиве Чегет субальпийского пояса (за исключением коэффициенту вариации мощности почв Эльбруса). Незначительно эти показатели выше для влажности и мощности почв по сравнению с лесным поясом Чегета. Исключение коэффициенту вариации связно с тем что при сопоставимом среднеквадратическим отклонением мощность почв на Эльбрусе значительно меньше чем в аналогичном поясе Чегета.

По коэффициенту вариации сравнить разные элементы внутри одного комплекса.

В субальпийском поясе Чегет самым разнородным элементом (средний по однородности) является влажность почв далее мощность почв и урожайность трав. Единственным однородным показателем является проективное покрытие трав. В лесном же поясе, если влажность почв также средняя по однородности, то мощность почв однородная. Первое связано с отношением склона по ветра, то резкое отличие мощность почв связано с уменьшением абсолютной высоты.

В лесном поясе массива Чегет известны данные только мощности почв и влажности (23,4 и 44,0) оба показателя достаточно независимо друг от друга, поэтому можно характеризовать их только отдельно: влажность средняя по однородности, мощность – однородная.

В субальпийском поясе массива Эльбрус отсутствуют данные влажности почв. В массиве Эльбрус, несмотря на то что показатель мощности почв средний по однородности; урожайность трав (24,7) и в еще большей степени проективное покрытие (12,6) – однородны.

Сравнить все элементы всех комплексов по коэффициенту вариации и выяснить, в каком комплексе самый маленький коэффициент, а где самый большой.

Наиболее однородным (12,6) является проективное покрытие трав в субальпийском поясе массива Эльбрус. В целом этот показатель является однородным для всех комплексов. Средним по однородности, также для всех комплексов, являются показатели мощности почв и урожайности трав (от 23,0 до 39,6). Наиболее разнородным (приближаясь к неоднородному: 46,3) является показатель влажности почв, субальпийского пояса Чегет.

Оценка достоверности результатов исследования

Изучение любой проблемы, конечно, сопровождается необходимостью дать ответ на ряд вопросов относительно достоверности полученных результатов:

1. Всегда нужно ли оценивать их достоверность?

2. Насколько достоверным является деление определенного признака в данной совокупности – или достоверным является полученный показатель?

3. Отображает ли деление определенного параметра в исследуемой группе аналогичное деление параметра в генеральной совокупности (среди всех больных)?

4. Существенная разница ли между аналогичными показателями в разных группах (больных, население и другие)?

Необходимость оценки достоверности полученных результатов определяется объемом исследования. Она не проводится при сплошном исследовании (для анализа отобраны все возможные единицы наблюдения), поскольку для всей (генеральной) совокупности можно получить только одно значение определенного показателя. Однако в системе медико-биологических исследований (кроме данных официальной статистики) редко используют сплошные методы сбора информации – подавляющая часть исследований является выборочной.

При проведении выборочного исследования мы можем встречаться с общими погрешностями и погрешностями выборки. Общие погрешности могут иметь как систематический характер (методические, недостатки измерительной аппаратуры), так и случайный (ошибки исследователя). Погрешности выборочного наблюдения связаны с отбором его единиц. Это погрешности типичности, репрезентативности.

В процессе анализа рассчитанные показатели (средняя длительность лечения, частота осложнений, уровень летальности и другие) рассматривают как обобщающие величины. Если результаты получены на основе достаточного за количеством и качественно однородного материала, то можно считать, что они достаточно точно характеризуют исследуемые явления.

Например, при изучении эффективности нового метода лечения, апробированного на 400 больных, установлено, что в 12 из них возникли осложнения. Частота их составляет 3 %. Значение обобщающего результата заключается в том, что при проведении аналогичных выборочных исследований, или для оценки всей совокупности больных с данной патологией (генеральной совокупности) мы могли бы предусмотреть получение аналогичных данных. Однако не исключена ситуация, когда при проведении повторных исследований показатель, который был определен путем выборочного наблюдения, в незначительной мере может отличаться от результата сплошного наблюдения.

Следовательно, оценить достоверность результатов выборочного исследования значит определить, в какой мере сделанные для него выводы (результаты) можно перенести на генеральную совокупность. То есть, за частью явления рассуждать о явлении в целом и основные присущие ему закономерности.

Для оценки достоверности результатов любых выборочных исследований определяют среднюю погрешность относительной (mР) или средней величины (mХ).

Средняя погрешность для соответствующих показателей при значительном числе наблюдений (n>30) может быть рассчитана за следующими формулами:

д – среднее квадратичное отклонение;

n – число наблюдений в выборочной совокупности. При малом числе наблюдений (n<30) в знаменателе вместоиспользуется n-1.

P – относительный показатель;

q – величина, обратная к показателю, то есть достоверность того, что данное явление не будет зарегистрировано. Сумма двух противоположных вероятностей равняется единице: P + q = 1. Если показатель рассчитан на 100 (%), то

q = 100 – P, если на 1000 (%₀), то q = 1000 – P и т.д.

Для приведенного выше примера средняя погрешность показателя составляет:

Средняя погрешность отображает размеры случайных колебаний показателя при выборочных исследованиях и зависит от числа наблюдений и качественных характеристик явления. Чем большее число наблюдений и чем более однородной отобрана для анализа группа, тем меньшие границы вероятных случайных колебаний показателя.

Средняя погрешность позволяет определить доверительные границы, в которых с определенной вероятностью находится истинное значение показателя. Интервал, расположенный между ними, носит название доверительного интервала.

Доверительные границы средней и относительной величин определяют за формулой:

`Хген = `Хвыб + tmх_{; Рген = Рвыб}+ tmР, где:

1) `Хген и Рген – значение средних и относительных величин для генеральной совокупности;

2) `Хвыб и Рвыб – значение средних и относительных величин, рассчитанных для выборочной совокупности;

3) tmх и mР – средние погрешности соответствующих показателей (погрешности репрезентативности);

4) t – критерий достоверности или доверительный критерий. Он может быть задан с разными степенями точности и в зависимости от вероятности безошибочного прогноза составлять t = 2 и t = 3.

Границы достоверности (доверительные границы) (Р + 2m) (при t = 2) дают возможность определить границы колебания показателя с вероятностью 95,5 % (р = 0,05), а доверительные границы (Р+3m) (при t = 3) дают возможность определить границы колебания показателя с вероятностью 99,7 % (р = 0,01). Вероятность безошибочного прогноза и доверительный критерий определяют на этапе планирования статистического исследования.

При заданных степенях вероятности доверительный критерий (t) имеет неизменную величину, а доверительный интервал зависит от величины средней погрешности (m), значение которой уменьшается при увеличении числа и качественного состава наблюдений.

Для нашего примера, при использовании приведенного метода лечения частота осложнений для генеральной совокупности с вероятностью 95,5 % (t = 2) может находиться в границах: Рген = Рвыб + tmР = 3,0 + 20,85 % ×– от 1,3 % до 4,7 %. С вероятностью 99,7 % доверительный интервал будет составлять от 0,45 % до 5,55 %.

Практическая ценность использования средней погрешности средней или относительной величины заключается не только в определении доверительных границ определенного показателя, но и в оценке его существенности (достоверности). Если она достаточно большая, мы можем получить значение доверительного интервала в диапазоне, который не подлежит логической оценке. Например, при использовании определенной методики выкармливания новорожденных прирост массы тела составил 800+300 грамм. Доверительный интервал при достоверности безошибочного прогноза 99 % будет составлять от 100 до 1700 грамм. Следовательно, наличие отрицательного результата не позволяет в полной мере за данным показателем оценить степень влияния данной методики на прирост массы тела новорожденных.

В указанной ситуации для повышения достоверности оценки необходимо уменьшить доверительный интервал путем увеличения числа наблюдений и, соответственно, уменьшения средней погрешности показателя. Существенность (достоверность) показателя определяется на основе соотношения между абсолютным его значением и средней погрешностью, которое должно быть не меньше трех – Р/mР >3.

В медико-биологических исследованиях часто возникают ситуации, когда при сравнении отдельных параметров необходимо оценить существенность разницы между ними. Существенная разница между отдельными показателями выборочного исследования свидетельствует о возможности перенесения полученных выводов на генеральную совокупность. Критерием оценки существенности разницы является коэффициент достоверности (критерий Стьюдента[1]), который определяют за формулой:

– для средних величин;

– для относительных величин.

При большом числе наблюдений (n>30) разница между показателями является существенной, если:

1) t > 2 (отвечает достоверности безошибочного прогноза 95,5 %);

2) t > 3 (отвечает достоверности безошибочного прогноза 99,7 %).

При условии t<2 степень достоверности безошибочного прогноза составляет меньше 95%. В этом случае мы не можем утверждать, что разница между показателями является существенной.

Например, в школе № 1 учится 1200 детей. Профилактические прививки против гриппа проведены 900 детям. В будущем году заболевший 350, в том числе 150-и из них не были сделаны прививки. Для того, чтобы сравнить и оценить существенность разницы между уровнями заболеваемости среди привитых детей, и тех, которым прививки не проводились, необходимо:

1) определить уровни заболеваемости в школе № 1 среди первой (с прививками) и второй (без прививок) групп. Они составляют, соответственно:

Р1=150 : 300100=50 %.

Р2=(350-150): 900100=22,2 %;

2) определить средние погрешности указанных показателей:

3) оценить существенность разницы за критерием Стьюдента:

Вывод: разница между показателями существенна, поскольку t>3, что отвечает уровню безошибочного прогноза 99,7 %.

Часто при клинических или экспериментальных исследованиях приходится иметь дело с малым числом наблюдений (30 и меньше): 5-6 лабораторных животных, 10-12 больных и другие. Если исследование верно организовано, отобраны однородные группы, их можно рассматривать как выборочные с малым числом наблюдений. Однако при малом числе наблюдений (n<30) оценка достоверности разницы между параметрами отдельных групп проводится на основе сравнения результата не с предельными значениями критерия Стьюдента, а с его табличными значениями для соответствующего числа наблюдений (n`= n1+n2–2). Если определенный t-критерий превышает табличное значение или равняется ему – разница между показателями статистически доказана.

Критерий достоверности (t) используют при попарном сравнении исследуемых параметров. Однако при проведении статистического анализа иногда необходимо оценить достоверность разницы большей от двух количеству показателей клинико-статистических групп. Попарное сравнение их не позволяет получить обобщающую оценку. В другом случае необходимо провести сравнение совокупности не только по обобщающим показателям, но и за характером деления признаков в исследуемых группах.

В указанных ситуациях наиболее целесообразным является использование критерия соответствия – χ² (критерий Пирсона), который определяют за формулой:

Где:

р – реальны частоты;

р1 – теоретические частоты.

В обобщенном виде практическое значение критерия соответствия (χ²) заключается в следующем:

· оценка достоверности разницы между несколькими сравниваемыми группами при нескольких возможных результатах с разной степенью вероятности (например, три или четыре группы больных с разными методами лечения и их последствиями – разной частотой осложнений);

· определение наличия связи между двумя факторами (зависимость результатов лечения от возраста больных, тяжести заболевания, связок между тяжестью патологии новорожденных и состоянием их физического развития);

· оценка идентичности деления частот в двух и больше совокупности (аналогичность деления больных за уровнем клинических параметров при разных степенях тяжести патологии).

Основой метода является определение существенности разницы (отклонений) фактических данных от теоретических (ожидаемых). Расчет теоретических данных базируется на предположении, что между сравниваемыми группами за исследуемыми факторами разница отсутствует. Данное предположение определяется как “нулевая гипотеза”.

На ее основе определяют “ожидаемые” результаты, и сравнивают их с фактическими данными. Если разница отсутствует, можно сделать вывод, что “нулевая гипотеза” подтвердилась. При наличии отличий фактических данных от теоретического деления определяют существенность разницы между сравниваемыми группами.

Оценка результатов (χ²) проводится за специальной таблицей. Существенной считается разница в том случае, когда величина рассчитанного коэффициента превышает табличное значение при достоверности не ниже 95 % (вероятность погрешности меньше 5 % – p<0,05).

Методику расчета коэффициента соответствия рассмотрим на примере оценки влияния метода лечения на их результаты.

1. Приведем фактические результаты за тремя методами лечения.

Результаты лечения больных за отдельными методиками

Методики

лечение

Всего

больных

Результаты лечения – р (фактические данные)

Хорошие

Удовлетворительные

Неудовлетворительные

III

Всего

200 (100 %)

109

2. Рассчитываем “ожидаемые” результаты согласно с “нулевой” гипотезой, основой которой является предположение, что разница между результатами лечения за отдельными методиками отсутствует. В этом случае за основу берем общее деление больных, пролеченных всеми методами. Числовая характеристика “нулевой” гипотезы составляет: хорошие результаты в целом имели 54,5 %, удовлетворительные – 26,5 % но неудовлетворительные – 19 % больных. В соответствии с указанным делением определяют “ожидаемые” данные результатов лечения за отдельными методиками (значение определяем в целых числах) –

“Ожидаемые” данные результатов лечения за отдельными методиками

Методики

Лечение

Всего

больных

Результаты лечения – р1 (ожидаемые данные)

Хорошие

Удовлетворительные

Неудовлетворительные

III

Всего

200

109 (54,5 %)

53 (26,5 %)

38 (19 %)

3. Сопоставим фактические и теоретические данные (их разницу) с расчетом величины отклонения и учетом его направления (знаку) –

Расчет величины отклонения

Методики

лечение

(р – р1)

Хорошие

Удовлетворительные

Неудовлетворительные

III

9 (36–27)

4 (48–44)

–13 (25–38)

–2 (11–13)

–4 (17–21)

6 (25–19)

–7 (3–10)

0 (15–15)

7 (20–13)

Всего

4. Рассчитываем квадрат отклонения теоретических данных от фактических и средний квадрат отклонения на одну “ожидаемую” группу. Дан этап расчета имеет такой вид в связи с тем, что на основе фактических отклонений невозможно определить его суммарную величину, поскольку она равняется нулю. При подъеме отклонений в квадрат определяем их параметры для каждой группы (р – р1)². Учитывая разное число больных в исследуемых группах величина отклонений может быть разной, потому квадрат их делимо на число соответствующих наблюдений каждой группы – (р – р1)^2:р1^.Проведя расчеты, определяем (р – р1)² и (р – р1)^2:р1

Квадрат отклонения теоретических данных от фактических и средний квадрат отклонения

Методики

лечение

(р – р1)²

р1

Хорошие

Удовлетворительные

Неудовлетворительные

Хорошие

Удовлетворительные

Неудовлетворительные

III

169

2,75

0,23

0,31

0,77

1,9

4,9

3,77

= 17,63

5. Определяем χ² – итог результатов последнего этапа расчетов. В нашем случае χ² = 17,63. Сравниваем его с табличным значением, учитывая число степеней свободы (n1), которые определяют за формулой: n1 = (S – 1)(r – 1), где

S – число групп больных (для нашего примера – три);

r – число результативных групп (три).

Число степеней свободы n1 = (3 – 1)(3 – 1) = 4. Полученный результат превышает табличные значения χ² для n1 = 4 за всеми уровнями достоверности. Следовательно, мы можем сделать вывод о существенности (достоверность) разницы и наличии связи между показателями при разных методах лечения – “нулевая гипотеза” не подтвердилась.

Критерий соответствия не является абсолютно универсальным и имеет некоторые недостатки:

· зависит от группирования первичного материала;

· важное значение имеет однородность приведенных групп для предупреждения приглаживания разницы между ними;

· величина χ² определяет наличие связи, однако не обнаруживает его силу и характер;

· метод не определяет существенность разницы между отдельными группами, потому иногда для попарного сравнения групп необходимо дополнительно использовать t – критерий.

Непараметрические критерии оценки достоверности результатов исследования

Рассмотрены в предыдущих разделах статистические параметры (средняя арифметическая, среднее квадратичное отклонение, коэффициент вариации, средняя погрешность), которые используют для анализа вариационных рядов, являются его параметрами и требуют представления выходных данных в количественном виде. Однако при проведении медицинских исследований достаточно часто приходится использовать методы статистического анализа данных, представленных в полуколичественном, полукачественном и качественном виде. Совокупность статистических методов, которые позволяют оценить их результаты как в количественном (числовому), так и в полуколичественном и качественном виде объединяют в группу непараметрических критериев оценки. Использование их не нуждается в расчете параметров вариационного ряда. Здесь имеет значение порядок расположения вариант в совокупности. Статистическая оценка наблюдений с помощью непараметрических критериев, как правило, проще, чем оценка параметрическими методами и не требует громоздких расчетов.

Подавляющее большинство параметрических статистических методик предусматривают наличие нормального деления вариант в исследуемой совокупности. Но на практике встречаются не только нормальные, но и другие виды деления признаков. При наличии таких ситуаций использование параметрических критериев повышает вероятность ошибок. Практическое применение непараметрических критериев, не связанное с определенной формой деления исследуемых признаков, делает целесообразным их самостоятельное использование или в комплексе с параметрическими.

Невзирая на определенную простоту методик, надежность непараметрических критериев достаточно высока. Они могут быть использованы для оценки достоверности медико-биологических результатов одной совокупности, разницы двух и больше выборочной совокупности.

Учитывая, что одним из наиболее важных разделов их использования есть оценка достоверности разницы сравниваемых наблюдений, весь комплекс указанных методик можно распределить на две группы: 1) непараметрические критерии оценки достоверности разницы в двух взаимоувязанной совокупности; 2) непараметрические критерии оценки достоверности разницы в двух независимой совокупности.

Первую группу используют для оценки достоверности разницы за результатами, которые получены для одной группы больных на протяжении разных периодов (до лечения – после лечения, первый день – пятый день и другие). Сравнение их результатов может быть проведено за критериями знаков и Вилкоксона.

Критерий знаков позволяет включать в анализ до 100 пар наблюдений и базируется на подсчете числа однонаправленных результатов при парном их сравнении.

Приведена динамика скорости оседания эритроцитов (СОЕ) за 10-дневной период лечения.

Динамика скорости оседания эритроцитов (СОЕ)

Больные

(№ п/п)

СОЕ

Направленность разницы

1 день

10 день

–

Основные этапы расчета за критерием знаков:

1. Определение направленности разницы в сравниваемых группах результатов. Динамика при этом отражается соответствующими знаками: +, – =. Из последующего расчета исключают результаты без динамики (=).

2. Подсчет числа наблюдений с позитивными и негативными результатами. Из 10 приведенных изменения оказались в 9 больных.

3. Подсчет числа знаков, которые реже встречаются. Снижение СОЕ (–) обнаружено в 6 больных, а прирост (+) зарегистрирован в трех случаях.

4. Сравнение меньшего числа знаков (критерий Z) с табличными критическими значениями для соответствующего числа наблюдений. Для= 9 определен критерий Z=3 выше предельного табличного (Z0,05 = 2). Следовательно, нельзя сделать вывод о существенности динамики скорости оседания эритроцитов – вероятности погрешности больше 5 % (р>0,05).

Т-критерий Вилкоксона предусматривает возможность попарного сравнения от 6 до 25 пар наблюдений. Его целесообразно использовать в тех случаях, когда оказываются неоднозначные количественные изменения исследуемого параметра (снижение и повышение). При этом учитывают не только направленность разницы, но и ее величину.

Методика анализа за Т-критерием Вилкоксона

1. Определяется разница в парах наблюдения между конечным и начальным уровнями артериального давления.

2. Ранжирование полученных результатов за величиной разницы между показателями без учета направленности изменений. Результаты без динамики исключают из последующей оценки. Если два результата имеют одинаковые абсолютные значения изменений, их ранги определяют как полгрусти порядковых номеров.

3. Подсчет суммы однозначных рангов (позитивных и негативных).

4. Оценка за меньшей суммой рангов путем сравнения определенного Т-критерия с табличным значением при соответствующем числе пар наблюдений.

5. Критерий Вилкоксона Т=5 не превышает табличного значения для данного числа наблюдений –= 9, T0,05 = 6. Следовательно, можно сделать вывод о существенности (статистическую достоверность) динамики артериального давления у больных после лечения.

6. Вторая группа непараметрических критериев – критерии, которые применяют в случае сравнения независимой совокупности. Типичными примерами их практического использования является сравнение опытной и контрольной групп больных, результатов двух групп наблюдений, которые относятся к разным заболеваниям или степеням тяжести патологии.

Уровень артериального давления у больных гипертонической болезнью к и после лечения (мм рт. ст.).

Больные

Уровень артериального давления

Разница

Ранг разницы

Сумма рангов

“+”

Сумма рангов

” – “

до лечения

после лечения

В.

Д.

К.

Г.

Н.

П.

А.

С.

Ю.

Т.

210

180

185

160

175

190

155

180

200

170

175

180

140

185

145

150

160

155

–35

+25

–30

–40

–20

–45

–15

6,5

–

6,5

Т=40

Т = 5

Для сравнения независимой совокупности используют:

· серийный критерий;

· критерий Уайта;

· Ван драл Вардена.

Но наиболее мощным в данной группе является критерий Колмогорова-Смирнова (λ²), методика применения которого нижеприведена ниже.

Изменение радиоактивности крови облученных животных, которые получали (Х) и не получали (У) лечения (в условных единицах)

Варианты по ряду Х и В

Частоты вариант по группам

Накоплены частоты по группам

Накоплены частицы по группам

Разница

Рх

Ру

0,23

0,56

0,67

0,23

0,44

0,78

0,34

0,44

0,89

0,34

0,55

0,45

0,55

0,56

0,44

0,67

0,33

0,89

0,11

Nx=9

Ny=8

Числовые значения двух вариационных рядов объединяют в один вариационный ряд, варианты которого располагают в порядке роста.

1. Определяют частоты вариант для обеих групп наблюдений.

2. Определяют накопленные частоты для обеих групп.

3. Определяют накопленные частицы, для чего накопленные частоты делятся на число наблюдений для каждой группы.

4. Рассчитывается разница накопленных частиц групп Х и У без учета знаков.

5. Определяют максимальную разницу – Д = 0,55

6. Определяют критерий λ² за формулой:

7. Сравниваем полученный результат с предельным значением критерия Колмогорова-Смирнова. Если λ² больше предельного значения, разница между сравниваемыми группами является существенной.

Для данного задания λ² = 1,28. Сравнивая полученный результат с предельным значением λ²0,05 = 1,84 и λ²0,01 = 2,65, делаем вывод о несущественности разницы между сравниваемыми группами.

Доверительный интервал

Если на основании имеющихся у нас данных (выборки из генеральной совокупности) конструируется оценка (х₁, …, х_n) параметра /1, 3, 4/, то при этом понимается, что величина является лишь приближенным значением неизвестного параметра даже в том случае, когда эта оценка состоятельна, несмещенна и эффективна.

При малыхконкретное значение оценки может очень сильно отклоняться от истинного значения характеристики . Вопрос состоит в том, как велико может быть это отклонение.

Можно найти такое и указать интервал вида (– ; +), получивший название доверительного интервала, который с заранее заданной вероятностью p (близкой к 1) покрывал бы неизвестное нам истинное значение характеристики .

Эта вероятность, называемая доверительной вероятностью, обычно задается из условия

Р{ – < } = р при малом

(20)

или

Р{ – < < + } = р.

(21)

Чем меньше , тем точнее оценка . Поэтому иногда используют в качестве характеристики точности оценки, а р – ее надежности.

Величину a = 1 – р называют уровнем значимости или вероятностью ошибки.

Для построения интервальной оценки параметра необходимо знать закон распределения оценки как случайной величины.

На рисунке представлена плотность вероятности W() симметричного распределения .

Плотность распределения вероятностей оценки

Границы доверительного интервала для неизвестной характеристики будут определяться из условия (20).

Ширина интервала (–; +) определяется величиной доверительной вероятности р или уровнем значимости . Для симметричных распределений статистики вводятся в рассмотрение вероятности ₁ = ₂ = /2.

Обычно к интервальному оцениванию характеристик прибегают при малом объеме выборки, когда точечные оценки не являются устойчивыми.

Доверительные интервалы бывают односторонними и двухсторонними.

Корреляционная связь и ее анализ

Сущность корреляционной связи

Важнейшей целью статистики является изучение объективно существующих связей между явлениями. В ходе статистического исследования этих связей необходимо выявить причинно-следственные зависимости между показателями, т.е. насколько изменение одних показателей зависит от изменения других показателей.

Существует две категории зависимостей (функциональная и корреляционная) и две группы признаков (признаки-факторы и результативные признаки). В отличие от функциональной связи, где существует полное соответствие между факторными и результативными признаками, в корреляционной связи отсутствует это полное соответствие.

Корреляционная связь – это связь, где воздействие отдельных факторов проявляется только как тенденция (в среднем) при массовом наблюдении фактических данных. Примерами корреляционной зависимости могут быть зависимости между размерами активов банка и суммой прибыли банка, ростом производительности труда и стажем работы сотрудников.

При решении типовых задач практически связанных с нормированием, прогнозом, планированием, диагностикой и другими, приходится иметь дело с объектами, процессами и системами, как правило, описываемыми многими параметрами, между которыми возможна связь.

Любой закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследований относится к задачам статистического исследования зависимостей /2/, которые включают в себя корреляционный, регрессионный, дисперсионный и ковариационный анализы.

В данном учебном пособии рассмотрены основные элементы анализа структуры и тесноты статистической связи между анализируемыми переменными, т.е. задачи корреляционного анализа. Основное содержание корреляционного анализа составляют методы, которые позволяют ответить на вопросы:

· “существует ли связь между исследуемыми переменными?”;

· “какова структура связей между параметрами исследуемого многомерного признака?”;

· “как измерить тесноту связей?”.

В задачах корреляционного анализа под структурой связей понимается лишь факт наличия или отсутствия связи, а не форма этой зависимости.

Корреляционный анализ – совокупность методов исследования параметров многомерного признака, позволяющая по выборке из генеральной совокупности сделать статистические выводы о мерах статистической зависимости между компонентами исследуемого признака.

Прежде чем приступить к изучению методов анализа структуры и тесноты связи между исследуемыми переменными рассмотрим описание общей схемы взаимосвязи параметров при статистическом исследовании зависимостей, приведенной на рисунке.

Общая схема взаимосвязи параметров при статистическом исследовании зависимостей

Здесь S – модель исследуемого реального объекта, реализующая механизм преобразования входных переменных в отклик, х_j_,, – входные переменные, описывающие условия функционирования объекта (некоторые из них могут быть подвергнуты регулированию). Эти факторы часто называют независимыми, предикторными или объясняющими.

– случайные, остаточные компоненты, влияние которых на y⁽ⁱ⁾ трудно учесть (измерить). К ним относятся также случайные ошибки в измерении анализируемых параметров. Такие компоненты называют еще латентными или просто “остатками”.

– выходные переменные (отклик), характеризующие результат функционирования объекта. Еще их называют объясняемыми переменными.

Далее будем пользоваться введенными понятиями.

При исследовании статистической связи между компонентами многомерного признака исследователю приходится решать следующие задачи:

· выбор подходящего измерителя связи с учетом специфики и природы анализируемых переменных;

· точечное или интервальное оценивание измерителя связи по выборочным данным, полученным в результате эксперимента;

· проверка гипотезы о значимости (статистически значимом отличии значения корреляционной характеристики от нуля) анализируемого измерителя связи;

· анализ структуры связей между компонентами многомерного признака.

Все это задачи корреляционного анализа. В качестве измерителей степени тесноты парных связей между количественными переменными могут использоваться индекс корреляции, коэффициент корреляции (иногда используют термин “коэффициент корреляции Пирсона”), корреляционное отношение, частный коэффициент корреляции, применяемый для исследования частных или “очищенных” связей, освобожденных от опосредованного одновременного влияния на исследуемую парную связь других переменных.

Если статистическая информация о многомерном признаке представлена не в количественной, а в порядковой шкале, то измерение парных связей осуществляется посредством ранговых выборочных измерителей связи – коэффициентов корреляции Кендалла и Спирмэна. Измерение степени тесноты множественной связи между количественными переменными возможно с помощью множественного коэффициента корреляции(или коэффициента детерминации), а между порядковыми переменными – с помощью коэффициента конкордации.

При таком многообразии измерителей статистической связи важной становится задача выбора адекватного ее измерителя.
Применимость того или иного измерителя определяется как формой представления исходной статистической информации (количественные или порядковые признаки), так и формой связи (линейная, нелинейная). От грамотного выбора адекватного измерителя связи зависит достоверность статистических выводов, распространяемых на исследуемую многомерную генеральную совокупность.

Предварительный анализ структуры связи между компонентами исследуемого многомерного признака, представленного выборкой из генеральной совокупности, осуществляют с помощью корреляционных полей.

Под корреляционным полем (диаграммой рассеяния) переменных (u, v) понимается графическое представление результатов измерений (u₁, v₁), …, (u_i, v_i ), …, (u_n, v_n), этих переменных в плоскости (u, v).

На основании анализа корреляционного поля легко решить вопрос о наличии или отсутствии связи, проследить характер связи (линейная, нелинейная, функциональная или стохастическая) и ее тенденцию (положительная, отрицательная).

Корреляционно-регрессионный метод анализа

Наиболее простым вариантом корреляционной зависимости является парная корреляция, т.е. зависимость между двумя признаками (результативным и факторным или между двумя факторными). Математически эту зависимость можно выразить как зависимость результативного показателя у от факторного показателя х. Связи могут быть прямые и обратные. В первом случае с увеличением признака х увеличивается и признак у, при обратной связи с увеличением признака х уменьшается признак у.

Важнейшей задачей является определение формы связи с последующим расчетом параметров уравнения, или, иначе, нахождение уравнения связи (уравнения регрессии).

Могут иметь место различные формы связи:

прямолинейная

криволинейная в виде:

параболы второго порядка (или высших порядков)

гиперболы

показательной функции

и т.д.

Параметры для всех этих уравнений связи, как правило, определяют из системы нормальных уравнений, которые должны отвечать требованию метода наименьших квадратов (МНК):

Если связь выражена параболой второго порядка (), то систему нормальных уравнений для отыскания параметров a₀ , a₁ , a₂ (такую связь называют множественной, поскольку она предполагает зависимость более чем двух факторов) можно представть в виде

Другая важнейшая задача – измерение тесноты зависимости – для всех форм связи может быть решена при помощи вычисления эмпирического корреляционного отношения :

где – дисперсия в ряду выравненных значений результативного показателя ; – дисперсия в ряду фактических значений у.

Для определения степени тесноты парной линейной зависимости служит линейный коэффициент корреляции r, для расчета которого можно использовать, например, две следующие формулы:

Линейный коэффициент корреляции может принимать значения в пределах от -1 до + 1 или по модулю от 0 до 1. Чем ближе он по абсолютной величине к 1, тем теснее связь. Знак указывает направление связи: «+» – прямая зависимость, «-» имеет место при обратной зависимости.

Непараметрические показатели связи

В статистической практике могут встречаться такие случаи, когда качества факторных и результативных признаков не могут быть выражены численно. Поэтому для измерения тесноты зависимости необходимо использовать другие показатели. Для этих целей используются так называемые непараметрические методы.

Наибольшее распространение имеют ранговые коэффициенты корреляции, в основу которых положен принцип нумерации значений статистического ряда. При использовании коэффициентов корреляции рангов коррелируются не сами значения показателей х и у, а только номера их мест, которые они занимают в каждом ряду значений. В этом случае номер каждой отдельной единицы будет ее рангом.

Коэффициенты корреляции, основанные на использовании ранжированного метода, были предложены К. Спирмэном и М. Кендэлом.

Коэффициент корреляции рангов Спирмэна (р) основан на рассмотрении разности рангов значений результативного и факторного признаков и может быть рассчитан по формуле

где d = N_x – N_y , т.е. разность рангов каждой пары значений х и у;- число наблюдений.

Пример.

По данным о прибыли и объему кредитных вложений 10 коммерческих банков одного из регионов Российской Федерации на 01.01.2004 г. определить с помощью коэффициента Спирмена зависимость между этими признаками.

Таблица

Расчет коэффициента Спирмена

Ранговый коэффициент корреляции Кендэла () можно определить по формуле

где S = P + Q.

К непараметрическим методам исследования можно отнести коэффициент ассоциации К_ас и коэффициент контингенции К_кон , которые используются, если, например, необходимо исследовать тесноту зависимости между качественными признаками, каждый из которых представлен в виде альтернативных признаков.

Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:

Признаки

А (да)

А (нет)

Итого

В (да)

a + b

В (нет)

c + d

Итого

a + c

b + d

Здесь а, b, c, d – частоты взаимного сочетания (комбинации) двух альтернативных признаков ;- общая сумма частот.

Коэффициент ассоциации можно расcчитать по формуле

Коэффициент контингенции рассчитывается по формуле

Нужно иметь в виду, что для одних и тех же данных коэффициент контингенции (изменяется от -1 до +1) всегда меньше коэффициента ассоциации.

Если необходимо оценить тесноту связи между альтернативными признаками, которые могут принимать любое число вариантов значений, применяется коэффициент взаимной сопряженности Пирсона (К_П ).

Для исследования такого рода связи первичную статистическую информацию располагают в форме таблицы:

Признаки

Итого

m₁₁

m₁₂

m₁₃

∑m_1j

m₂₁

m₂₂

m₂₃

∑m_2j

m₃₁

m₃₂

m₃₃

∑m_3j

Итого

∑m_j1

∑m_j2

∑m_j3

Здесь m_ij – частоты взаимного сочетания двух атрибутивных признаков; П – число пар наблюдений.

Коэффициент взаимной сопряженности Пирсона определяется по формуле

где – показатель средней квадратической сопряженности:

Коэффициент взаимной сопряженности изменяется от 0 до 1.

Наконец, следует упомянуть коэффициент Фехнера, характеризующий элементарную степень тесноты связи, который целесообразно использовать для установления факта наличия связи, когда существует небольшой объем исходной информации. Данный коэффициент определяется по формуле

где n_a – количество совпадений знаков отклонений индивидуальных величин от их средней арифметической; n_b – соответственно количество несовпадений.

Коэффициент Фехнера может изменяться в пределах -1,0 К_ф +1,0.

Частный коэффициент корреляции

Иногда в практических ситуациях не удается интерпретировать на содержательном уровне выявленную парную связь между исследуемыми компонентами признака. Причину этого часто следует искать в опосредованном влиянии на исследуемые показатели некоторого третьего фактора /2/. Роль опосредованно влияющих факторов могут играть множество неучтенных показателей. Следовательно, необходимо введение измерителей статистической связи, которые были бы очищены от такого влияния.

В качестве измерителя степени тесноты связи между переменными Х и Y при фиксированных значениях других переменных используются частные (“очищенные”) коэффициенты корреляции.

Пусть имеется многомерный нормальный вектор X

X = {x⁽¹⁾, x⁽²⁾, …, x^(p)},

где x⁽ⁱ⁾ – компоненты вектора, p – его размерность. Необходимо определить частный коэффициент корреляции r_ij между x⁽ⁱ⁾ и x^(j) компонентами вектора при фиксированном множестве переменных x^(i,j), дополняющих пару x⁽ⁱ⁾ и x^(j) .

При данных условиях

Описание: Описание: http://smc.edu.nstu.ru/r4-for38.gif

(82)

где R_ij_. – алгебраическое дополнение для элемента r_ij в определителе корреляционной матрицы R анализируемых признаков x⁽ⁱ⁾, т.е. в определителе

Выражение (82) при условии р = 3 будет иметь вид

Описание: Описание: http://smc.edu.nstu.ru/r4-for40.gif

(83)

Последовательно присоединяя к мешающим переменным все новые признаки из набора, можно получить рекуррентные соотношения для частных коэффициентов корреляции r₁₂_(3,4,…,k) порядка k (т.е. при k исключенных опосредованно влияющих параметров) по частным коэффициентам корреляции порядка k-2 (k = 1, 2, …, р-2)

Описание: Описание: http://smc.edu.nstu.ru/r4-for41.gif

(84)

Если условие нормальности вектора нарушается, то возникают проблемы, связанные с необходимостью учета фиксированного уровня значений мешающих переменных