Тема 3. Методы биостатистики.
Современная технология анализа данных
В основе обработки и анализа данных лежат известные математические методы.
Благодаря использованию информационных технологий, в настоящее время этап обработки данных стал наименее трудоемким. На первое место в отношении трудоемкости вышли такие этапы, как освоение статистических пакетов, этап подготовки данных к анализу, этап предварительного анализа данных и этап интерпретации результатов. Все в целом привело к изменениям в технологии обработки и анализа данных.
При этом для выполнения методов обработки медико-биологических данных от пользователя требуется лишь применение статистических методов обработки данных и использования соответствующих пакетов прикладных программ. Доктор, как правило, не требуется углубляться в сложные математические теории, а надо понимать, для чего и каким образом они используются.
На практике для врача обработка и анализ данных сводятся к решению следующих задач: получение представления о основные статистические методы; усвоения пакета прикладных программ; анализа и интерпретация результатов исследований.
Сам анализ данных с использованием статистического пакета (работа с пакетом, сама технология анализа данных) включает в себя следующие этапы: планирование исследования, подготовка данных к анализу предварительный анализ данных, выбор метода анализа и его реализация; интерпретация результатов; представление результатов.
Планирование исследования.
На начальных этапах исследования нет четкости относительно методов обработки результатов. Поэтому надо предусмотреть возможность использования различных способов обработки и приблизительного сравнения полученных результатов с целью определения, как обрабатывать имеющиеся данные.
Приведенная ниже таблица поможет лучше сориентироваться в основных математических методах обработки и анализа данных.
Таблица 19. Математические методы обработки и анализа данных
Источник информации, задача исследования |
Методы обработки и анализа |
Анкеты, вопросы, тесты. Исследование состояния здоровья, клинические обследования, медицинские записи, регистрации, истории болезни. Выявление взаимосвязей. Описание случаев заболеваний, сопоставление с данными прошлых лет, изучение осложнений. Исследование эффективности различных процедур, изучение связей между процедурами и их последствиями. |
Классификация данных. Создание таблиц и отчетов.
Корреляционный анализ. Факторный анализ. Регрессионный анализ. Дисперсионный анализ. Методы проверки гипотез. |
Скрининговые исследования |
Дискриминантный анализ, кластерный анализ, методы распознавания образов. |
Медико-статистические данные. Исследование заболеваемости, динамика заболеваемости, выявление периодичности. |
Методы анализа случайных процессов, спектральный анализ, математическое моделирование. Методы распознавания образов. Теория массового обслуживания. Параметрический и непараметрический статистический анализ. |
Лабораторные эксперименты и опыты на животных. |
Статистические методы планирования экспериментов. Регрессионный анализ, дисперсионный анализ, многомерный статистический анализ, методы математического моделирования. |
Клинические исследования. Сравнительные лечебные исследования, анализ выживаемости и наследственности с учетом принадлежности пациента к определенной группе, изучение дозировки препаратов. Разработка методов диагностики. |
Дисперсионный анализ, регрессионный анализ, дискриминантный анализ, методы проверки гипотез. Математическое моделирование процессов. Дискриминантный анализ, кластерный анализ, методы распознавания образов. |
Клинические лабораторные данные. Сбор, хранение и передача клинической информации, анализ качества и надежности лабораторных исследований, уход за пациентом. |
Статистический анализ. Дисперсионный анализ. Регрессионный анализ. Последовательный анализ Вальда. |
Подготовка данных к анализу
Целью этого этапа является приведение данных к виду, позволит провести следующую их обработку, и предварительное формирование представления о типе (структуру) анализируемых данных.
Обычно во время проведения медицинского исследования стараются учесть максимальное количество характеристик, которые существенны при анализе исследуемому вопросу. Исследования, как правило, состоит из нескольких серий наблюдений, во время которых в одинаковых условиях регистрируются параметры отдельных объектов (например, больных определенное заболевание). Имея дело с серией наблюдений, надо пытаться представить их в простой форме, которая позволила бы непосредственно или путем следующих вычислений сделать из них выводы.
Все данные целесообразно свести к единой таблицы, в которой по строкам расположены различные объекты наблюдения (например, больные), а по столбцам параметры (например, температура, частота сердечных сокращений, артериальное давление и др.). В этой таблице объекты могут быть объединены в несколько групп в соответствии с общим признакам (по возрасту, полу и т.д.).
Мы рассматриваем только репрезентативные выборки.
Заметим, что введенные однажды данные могут быть обработаны с помощью различных методов.
Важным этапом в подготовке данных к анализу является визуализация, или просмотр данных. Чтобы выяснить, какие методы анализа нужно использовать к данным и насколько Вас удовлетворяют полученные результаты после выполнения статистических процедур, надо иметь возможность наглядно представить себе эти данные и результаты. Ведь изучение таблиц менее удобная процедура, чем представление данных в виде графиков и диаграмм. Графические образы в медицинских научных разработках помогают наблюдать за тенденциями изменений, выявлять сложные взаимодействующие факторы и упрощает сопоставление данных.
Таким образом, использование графиков облегчает предварительный анализ информации, поэтому целесообразно строить различные графики для лучшего понимания полученного экспериментального материала позволяет получить общее представление об особенностях и закономерностях обрабатываемых. Результаты использования статистических процедур, как правило, подаются в наглядном графическом виде.
Предварительный анализ данных
Целью этого этапа является формирование представления о типе (структуру) анализируемых данных, и предварительный выбор методов анализа. Этот этап включает: уточнение структуры данных и разбиения их на группы; расчет основных статистических характеристик, выявление различий между группами данных, определение взаимосвязей между параметрами, определение эмпирических законов распределения, которым подчинены данные.
Выбор и реализация метода анализа
В современных прикладных пакетах данные достаточно просто обрабатываются с помощью различных процедур, с тем чтобы потом можно было выбрать метод, который дает наилучший результат.
Использование определенного статистического метода определяется общей целью исследования. Например, если необходимо оценить степень влияния известных факторов на величину, измеряемую, используют дисперсионный и / или регрессионный анализы. Если из множества факторов воздействия необходимо выявить несколько ведущих – используют регрессионный и факторный анализы. Для оценки особенностей явления меняется со временем, используют корреляционный и спектральный анализы. Чтобы разбить совокупность объектов, изучаемых на группы “похожих” случаев, используют кластерный анализ, дискриминатний анализ.
Интерпретация результатов анализа
У медиков-исследователей часто возникают трудности в интерпретации результатов медико-биологических данных. Поэтому на этом этапе надо использовать методы математической статистики, которые предлагаются исследователю в пакете прикладных программ.
Представление результатов
Уровень описания самого анализа, его результатов, наглядность должны быть корректными и понятными для практических медицинских работников.
Статистический анализ данных.
Законы распределения случайных величин
Случайной называется величина, которая в результате эксперимента, который может быть повторен при неизменных условиях большое количество раз, может принять значения х 1, х 2, …, х п. Дискретной случайной называется величина, которая может принимать конечное число значений (например, количество детей, родившихся в сутки в г. Киеве). Непрерывной случайной называется величина, которая может принимать любые числовые значения в данном интервале значений (например, масса тела и вес новорожденных).
Закон распределения случайных величин – функциональная зависимость между значениями случайных величин и вероятностями с которыми они принимают эти значения. Закон распределения может быть задан в виде таблицы, формулы или графика.
Функция распределения – это функция F (x), которая задает вероятность того, что случайная величина Х принимает в испытании примет значение меньше х:
F (x) = Р (Х <х).
Ее называют интегральной функцией.
Функция распределения случайной величины F (x) является неубывающей непрерывной функцией. Для дискретных случайных величин функция распределения разрывной степенной функцией.
Плотность распределения для случайной величины – это производная от функции распределения:
f (x) = F / (x) /
Параметры распределения: математическое ожидание, дисперсия.
Статистическая совокупность – это множество (масса) однокачественных (однородных) хотя бы по одному какому-либо признаку явлений, существование которых ограничено в пространстве и времени. Статистической совокупностью можно считать, к примеру, совокупность жителей России по состоянию на 1 января 1998 г., совокупность фермерских хозяйств Ростовской области в 1998 г., совокупность студентов III курса МГУ в 1998/99 учебном году и т. п. Однако статистическая совокупность (множество) совсем не обязательно представляет большую численность единиц, в принципе она может быть и очень маленькой; например, объем совокупности малой выборки может составлять иногда 8-10 единиц. От реально существующих статистических совокупностей следует отличать стохастические совокупности или гипотетические множества, т. е. совокупности, предполагаемые мысленно, нереальные, например совокупность бесконечно большого числа бросаний монеты, падающей либо «орлом», либо «решкой». Самостоятельное значение имеют совокупности социально-экономических явлений. Они представляют собой отдельные грани общественных процессов, которые более сложны и разнородны, чем природные явления, и менее многочисленны, т. е. объединяют значительно меньшее число единиц. Важнейшим свойством статистической совокупности является ее неразложимость. Это означает, что дальнейшее дробление индивидуальных явлений не вызывает потери их качественной основы. Исчезновение или ликвидация одного или ряда явлений не разрушает качественной основы статистической совокупности, так как все характеристики относятся к совокупности в целом. Так, население страны или города останется населением, несмотря на постоянно происходящие процессы механического и естественного движения населения. Существует понятие однородности статистической совокупности. Оно относительно и вовсе не означает полного соответствия всех единиц совокупности, а лишь подразумевает наличие для всех единиц совокупности основного свойства, качества, типичности. Одна и та же совокупность единиц, к примеру, может быть однородна по одному признаку и неоднородна по другому. Однородность единиц статистической совокупности формируется под воздействием определенных внутренних причин и условий. Одинаковые для всех единиц данной совокупности причины и условия существования создают то общее, что объединяет единицы совокупности, но эти же причины и условия формируют то, что отличает одну единицу совокупности от другой. В статистической совокупности эти отличия чаще имеют количественную природу. Количественные изменения значений признака при переходе от одной единицы совокупности к другой называются вариацией. Вариация возникает под воздействием случайных, прежде всего внешних, причин. Социально-экономические явления, как правило, обладают большой вариацией. Например, вариация городов страны по численности населения складывается под влиянием большого числа факторов: исторических, этногеографических, экономических, социальных и множества других. В большинстве теоретических и практических статистических исследований широко используются показатели вариации, которые показывают, как группируются значения признака вокруг средней величины совокупности. Показатели вариации выступают одновременно и мерами однородности совокупностей. |
Статистические совокупности имеют определенные свойства, носителями которых выступают единицы (отдельные элементы) совокупности (явления), обладающие определенными признаками. По форме внешнего выражения признаки делятся на:
атрибутивные (описательные, качественные);
количественные.
Атрибутивные (качественные) признаки не поддаются прямому количественному (числовому) выражению.
Отличие количественных признаков от качественных состоит в том, что первые можно выразить итоговыми значениями, например общий объем добычи нефти в стране, выплавка стали; вторые – только числом единиц в Количественные признаки делятся на дискретные (прерывные) и непрерывные.
Важнейшей категорией статистики является статистическая закономерность. Под закономерностью вообще принято называть повторяемость, последовательность и порядок изменений в явлениях.
Статистическая же закономерность в статистике рассматривается как количественная закономерность изменения в пространстве и времени массовых явлений и процессов общественной жизни, состоящих из множества элементов (единиц совокупности). Она свойственна не отдельным единицам совокупности, а всей их массе, или совокупности в целом. В силу этого закономерность, присущая данному явлению (процессу), проявляется только при достаточно большом числе наблюдений и только в среднем. Таким образом, это закономерность усредненных параметров некоторого основного свойства (качества или типичности).
Первые предположения, что статистика познает закономерности общественной жизни, были высказаны в середине XVII в. Д. Граунтом и В. Петти при исследовании бюллетеней о естественном движении населения Лондона.
Статистическая закономерность – это форма проявления причинной связи, выражающаяся в последовательности, регулярности, повторяемости событий с достаточно высокой степенью вероятности, если причины (условия), порождающие события, не изменяются или изменяются незначительно. Статистические закономерности устанавливаются на основе анализа массовых данных. Они неприложимы к отдельным явлениям, как это возможно в естественных науках (биологии, механике, физике). Данные закономерности возникают как результат воздействия большого числа постоянно действующих причин и причин случайных, действующих временами. Постоянно действующие причины придают изменениям в явлениях регулярность, повторяемость; случайные – вызывают отклонения в этой регулярности.
Статистические закономерности, представляющие собой не что иное, как статистические факты, будучи выраженные в виде обобщающих статистических показателей, дают исследователю неоценимые типизированные величины, которые чаще всего лишены конкретности. Но известно, что любое общее понятие является абстрактным и поэтому лишено конкретности: оно содержит в себе существенные признаки класса предметов и не включает их несущественные, единичные, индивидуальные свойства.
Таким образом, статистическая закономерность предопределяет типичное распределение единиц статистического множества на определенный момент времени под воздействием всей совокупности факторов. Статистическая закономерность, не определяя положение каждого случая, устанавливает общее распределение в данных условиях времени и места. Сила статистики в том, что она дает нам общую картину, тенденцию развития, исключая, «нивелируя» случайные, индивидуальные отклонения и колебания. Без статистики мы бы «утонули» в море единичных, случайных колебаний и отклонений, в «неразберихе» отдельных процессов. Статистическая закономерность – объективная количественная закономерность массового процесса. Она возникает в результате действия объективных законов, выражая каузальные отношения.
Любое заметное изменение условий существования данного множества окажет воздействие на статистическую закономерность. В этом смысле она является своего рода лакмусовой бумажкой при проверке на постоянство факторов.
Статистическая закономерность практически гарантирует сравнительно малую вероятность больших отклонений фактических частот от теоретических. Например, в магазинах имеется ассортимент продуктов или товаров, соответствующий среднему спросу, с резервным запасом, обеспечивающим его возможные колебания в нормальных условиях. Относительный размер резервного запаса уменьшается с ростом числа покупателей. Статистическая закономерность гарантирует устойчивость средних величин при сохранении постоянного комплекса условий, порождающих данное явление.
Так как статистическая закономерность обнаруживается в итоге массового статистического наблюдения, это обусловливает ее взаимосвязь с законом больших чисел.
Закон больших чисел в наиболее простой формулировке гласит, что количественные закономерности массовых явлений отчетливо проявляются лишь в достаточно большом их числе. Например, 104-106 мальчиков рождаются на 100 девочек, однако в отдельной семье и даже в небольшом населенном пункте это соотношение может быть совершенно иным.
Характеризуя роль закона больших чисел и его значение для статистики, А. Боярский отмечает, что в средней величине момент случайности оказывается снятым. Следовательно, закон больших чисел по форме говорит о том же, о чем гласит и статистика, – о результате, складывающемся из ряда (многих) элементов. Закон больших чисел позволяет определить число «необходимых» наблюдений за массовым процессом, а также и некоторые условные критерии для оценки «однородности» явлений. Он характеризует достоверность полученных результатов и необходим для понимания ошибок массового статистического наблюдения. Однако закон больших чисел не определяет собой постановку наблюдения и исследования в целом. Последняя диктуется необходимостью точного и всестороннего учета существенных факторов, влияющих на результат исследования.
Закон больших чисел выражает диалектику случайного и необходимого, единичного, особенного и всеобщего. В результате взаимопогашения случайных отклонений средние величины, исчисленные для величин одного и того же вида, становятся типичными, отражающими действие постоянных и существенных факторов в данных условиях места и времени.
В соответствии с природой массовой закономерности тенденции и закономерности, вскрытые с помощью закона больших чисел, имеют силу лишь как массовые тенденции, но не как законы, действительные для каждого отдельного факта без исключения.
При анализе общественных явлений весьма важно его вести таким образом, чтобы отразить и существенные стороны единичного, т. е. отдельного факта. О единичном в статистическом анализе нельзя забывать потому, что оно хотя и теряет свое значение в общей массе, однако продолжает существовать. Поэтому экономист часто убеждается, что как типичные выступают не только массовые, но и единичные, частные явления. Надо только уметь разобраться, имеем ли мы дело с отдельными изолированными фактами, не связанными с целым, или речь идет об уникальных явлениях, за которыми кроются определенные социальные или экономические причины.
Вообще проникновению в сущность общественных явлений лучше всего способствует сочетание статистических обобщений санализом отдельных связанных с ним фактов.
Итак, к помощи статистики прибегают тогда, когда исследователю необходимо раскрыть наличие статистических фактов, чтобы дать им соответствующее объяснение на основе причинных связей и отношений.
Метод массовых наблюдений. Начальной стадией статистических исследований является статистическое наблюдение – научно организованный сбор сведений об изучаемых социально-экономических процессах или явлениях. Результатом статистического наблюдения является получение данных, характеризующих каждую единицу наблюдения. Цель же исследования – получение характеристики объекта наблюдения в целом. Поэтому результаты статистического наблюдения представляют собой лишь исходный статистический материал, который, по выражению известного русского статистика А. Кауфмана, «относится к статистике приблизительно так же, как собранные на месте постройки запасы кирпича, балок, труб и иных строительных материалов относятся к будущему зданию, которое еще предстоит строить из этих материалов» Эти результаты необходимо определенным образом обработать с тем, чтобы из статистического «сырья» выявить статистические данные. Такая обработка является следующей после наблюдения стадией статистического исследования и представляет собой сводку исходных данных для получения обобщающих характеристик исследуемого процесса или явления, проводимую с помощью использования метода группировок и таблиц. Метод статистических группировок и таблиц. Вторая стадия статистического исследования представляет собой комплекс последовательных действий по обобщению конкретных единичных фактов, образующих совокупность в целях выявления типичных черт и закономерностей, присущих изучаемому явлению в целом. Важнейшим специфическим методом на этой стадии является метод группировок. Статистическая сводка включает в себя распределение исходных данных по группам, качественно однородным по одному или нескольким признакам, и получение групповых итогов. На правильность выводов, получаемых в результате исследования, оказывает существенное влияние обоснованный выбор группировочных признаков. Результаты статистической группировки и сводки излагаются в виде статистических таблиц, являющихся наиболее рациональной, систематизированной, компактной и наглядной формой представления массовых данных. Разновидностью табличных построений можно считать и различного рода матрицы абсолютных и относительных статистических показателей, построение которых связано с процессом компьютерной обработки информации. |
Методы анализа с помощью обобщающих показателей. Статистический анализ является заключительной стадией статистического исследования.
В соответствии с ранее сформулированными познавательными задачами статистики как науки в процессе статистического анализа исследуются структура, динамика и взаимосвязи общественных явлений или процессов.
Выделяют следующие основные этапы анализа:
констатация фактов и их оценка;
установление характерных черт и причин явления;
сопоставление явления с другими, принятыми за базу сравнения – нормативными, плановыми и прочими явлениями;
формулирование гипотез, выводов и предположений;
статистическая проверка выдвинутых гипотез с помощью специальных статистических показателей.
Характерным для статистических методов на этой стадии является применение обобщающих показателей: абсолютных, относительных, средних величин и индексных систем. Некоторые общие черты формирования обобщающих показателей устанавливаются посредством измерения их вариации. Изучение вариации наряду с применением средних и относительных величин имеет большое практическое и научное значение. Показатели вариации дополняют средние величины, за которыми скрываются индивидуальные различия. Они характеризуют степень однородности статистической совокупности по данному признаку. Показатели вариации определяют степень и границы вариации признака. Соотношение показателей вариации может выражать взаимосвязь признаков.
Изучение структуры сложных явлений – исходный пункт статистического исследования. Здесь вопросы изменения и развития возникают в отраженной форме с различным уровнем развития элементов структуры. Конечная задача статистического исследования структуры – анализ внутренних связей в объекте исследования. Характер этих связей более наглядно проявляется в динамике структурных изменений. Исследование динамики обычно носит дифференциальный или интегральный характер. Фиксация состояний процесса образует интегральный динамический ряд, который исследуется на основе обобщающих аналитических показателей, специальных приемов обработки и моделирования рядов динамики. Прогнозирование дальнейшего хода развития общественных явлений осуществляется с помощью экстраполяции.
Закономерности причинно-следственных связей общественных процессов и явлений устанавливаются с помощью корреляционно-регрессионного анализа, а также методов многомерного статистического анализа. Взаимосвязи явлений также изучаются с помощью статистических группировок, сопоставления параллельных рядов, построения систем взаимосвязанных индексов и т. д.
Широкое применение в статистике находят графические методы, позволяющие в наглядной форме представлять результаты статистических исследований.
Большое значение для развития статистической методологии имеет компьютеризация статистических исследований, позволяющая создавать базы статистических данных и программы их обработки, в значительной мере сокращать сроки обработки информации, широко использовать многомерные методы, улучшать качество и наглядность проводимого анализа.
Статистическое наблюдение может проводиться органами государственной статистики, научно-исследовательскими институтами, экономическими службами банков, бирж, фирм.
Процесс проведения статистического наблюдения включает следующие этапы:
подготовка наблюдения;
проведение массового сбора данных;
подготовка данных к автоматизированной обработке;
разработка предложений по совершенствованию статистического наблюдения.
Любое статистическое наблюдение требует тщательной, продуманной подготовки. От нее во многом будут зависеть надежность и достоверность информации, своевременность ее получения.
Подготовка статистического наблюдения – процесс, включающий разные виды работ. Сначала необходимо решить методологические вопросы, важнейшими из которых являются определение цели и объекта наблюдения, состава признаков, подлежащих регистрации; разработка документов для сбора данных; выбор отчетной единицы и единицы, относительно которой будет проводиться наблюдение, а также методов и средств получения данных.
Кроме методологических необходимо решить проблемы организационного характера, например, определить состав служб, проводящих наблюдение; подобрать и подготовить кадры для проведения наблюдения; составить календарный план работ по подготовке, проведению и обработке материалов наблюдения; провести тиражирование документов для сбора данных.
Проведение массового сбора данных включает работы, связанные непосредственно с заполнением статистических формуляров. Он начинается с рассылки переписных листов, анкет, бланков, форм статистической отчетности и заканчивается их сдачей после заполнения в органы, проводящие наблюдение.
Собранные данные на этапе их подготовки к автоматизированной обработке подвергаются арифметическому и логическому контролю. Оба эти контроля основываются на знании взаимосвязей между показателями и качественными признаками.
На заключительном этапе проведения наблюдения анализируются причины, которые привели к неверному заполнению статистических бланков, и разрабатываются предложения по совершенствованию наблюдения. Это очень важно для организации будущих обследований.
Получение сведений в ходе статистического наблюдения требует немалых затрат финансовых и трудовых ресурсов, а также времени.
Цель наблюдения. Статистические наблюдения чаще всего преследуют практическую цель – получение достоверной информации для выявления закономерностей развития явлений и процессов. Например, целью микропереписи населения России в 1994 г. было получение данных о численности, составе населения, условиях его проживания. Задача наблюдения предопределяет его программу и формы организации. Неясно поставленная цель может привести к тому, что в процессе наблюдения будут собраны ненужные данные или, наоборот, не будут получены сведения, необходимые для анализа. Объект и единица наблюдения. Отчетная единица. При подготовке наблюдения кроме цели следует точно определить, что именно подлежит обследованию, т. е. установить объект наблюдения. Под объектом наблюдения понимается некоторая статистическая совокупность, в которой протекают исследуемые социально-экономические явления и процессы. Объектом наблюдения может быть совокупность физических лиц (население отдельного региона, страны; лица, занятые на предприятиях отрасли), физические единицы (станки, машины, жилые дома), юридические лица (предприятия, фермерские хозяйства, коммерческие банки, учебные заведения). Чтобы определить объект статистического наблюдения, необходимо установить границы изучаемой совокупности. Для этого следует указать важнейшие признаки, отличающие его от других сходных объектов. Например, прежде чем проводить обследование рентабельности промышленных предприятий, следует определить формы собственности, организационно-правовые формы предприятий, отрасли промышленности и регионы, подлежащие наблюдению. Всякий объект статистического наблюдения состоит из отдельных элементов – единиц наблюдения. В статистике единицей наблюдения (в зарубежной литературе используется термин «элементарная единица») называют составной элемент объекта, являющийся носителем признаков, подлежащих регистрации. Например, при демографических обследованиях единицей наблюдения может быть человек, но может быть и семья; при бюджетных обследованиях – семья или домашнее хозяйство. Единицу наблюдения следует отличать от отчетной единицы. Отчетной единицей выступает субъект, от которого поступают данные о единице наблюдения. Так, при организации статистического наблюдения в капитальном строительстве информация может быть получена от проектных или подрядных организаций или от предприятий-застройщиков. Программа статистического наблюдения. Всякое явление обладает множеством различных признаков. Собирать информацию по всем признакам нецелесообразно, а часто и невозможно. Поэтому необходимо отобрать те признаки, которые являются существенными, основными для характеристики объекта исходя из цели исследования. Для определения состава регистрируемых признаков разрабатывают программу наблюдения. Программа наблюдения – это перечень признаков (или вопросов), подлежащих регистрации в процессе наблюдения. От того, насколько хорошо разработана программа статистического наблюдения, во многом зависит качество собранной информации. Чтобы составить правильно программу наблюдения, исследователь должен ясно представлять задачи обследования конкретного явления или процесса, определить состав используемых в анализе методов, необходимые группировки и уже на основе этого выявить те признаки, которые нужно определить при проведении работы. Обычно программа выражается в форме вопросов переписного (опросного) листа. |
К программе статистического наблюдения предъявляются следующие требования.
Программа должна содержать существенные признаки, непосредственно характеризующие изучаемое явление, его тип, основные черты, свойства. Не следует включать в программу признаки, имеющие второстепенное значение по отношению к цели обследования или значения которых заведомо будут недостоверны или отсутствовать, например, в представлении такой информации, которая является предметом коммерческой тайны.
Вопросы программы должны быть точными и недвусмысленными (иначе полученный ответ может содержать неверную информацию), а также легкими для понимания во избежание лишних трудностей при получении ответов.
При разработке программы следует не только определить состав вопросов, но и их последовательность. Логичный порядок исследования вопросов (признаков) поможет получить достоверные сведения о явлениях и процессах.
В программу целесообразно включать вопросы контрольного характера для проверки и уточнения собираемых данных. Вопросы в программе задаются в различной форме. Они могут быть закрытые и открытые.
Закрытый вопрос – это вопрос альтернативный, т. е. предполагающий выбор одного из двух ответов: «да» или «нет», или же вопрос с выборочным ответом, где предлагаются три и более вариантов ответа на выбор. Например, ответ на вопрос «состояние в браке» может быть одним из следующих: а) состоит в браке; б) никогда не состоял в браке; в) в браке; г) вдовец (вдова); д) разведен(а), разошелся(лась).
На открытые вопросы можно ответить практически бесчисленным количеством способов, если вопрос поставлен без заданной структуры ответа. Например, «какие ценности являются для вас главными?».
Для обеспечения единообразия получаемых сведений от каждой отчетной единицы (это важно при последующей обработке информации) программа оформляется в виде документа, называемого статистическим формуляром.
Статистический формуляр – это документ единого образца, содержащий программу и результаты наблюдения.
Обязательными элементами статистического формуляра являются титульная и адресная части. Первая содержит наименование статистического наблюдения и органа, проводящего наблюдение, информацию о том, кто и когда утвердил этот формуляр, иногда его номер. Вторая включает адрес отчетной единицы, ее подчиненность.
Формуляр может иметь разные названия: отчет, карточка, переписной лист, опросный бланк, анкета и т. д.
Различают две системы статистического формуляра: индивидуальную (карточную) и списочную.
Индивидуальный формуляр предусматривает запись на нем ответов на вопросы программы только об одной единице наблюдения, списочный – о нескольких единицах. Так, все формы статистической отчетности заполняются каждым предприятием в отдельности, а при проведении переписи населения члены каждой семьи записываются в один переписной лист.
Кроме формуляра разрабатывается инструкция, определяющая порядок проведения наблюдения и заполнения формы отчетности, переписного листа, анкеты. В зависимости от сложности программы наблюдения инструкция публикуется в виде отдельной брошюры или помещается на обратной стороне формуляра. Формуляр и инструкция по его заполнению составляют инструментарий статистического наблюдения.
Места и время наблюдения. Выбор места проведения обследования зависит главным образом от цели наблюдения. Если необходимо получить данные для изучения состава населения по стране, то в этом случае наблюдение охватит территорию всей страны. При сборе сведений о стоимости потребительской корзины в Москве и Санкт-Петербурге местом проведения обследования будут территории этих двух крупнейших городов страны.
Выбор времени наблюдения заключается в решении двух вопросов:
Установление критического момента (даты) или интервала времени;
Определение срока (периода) наблюдения.
Под критическим моментом (датой) понимаются конкретный день года, час дня, по состоянию на который должна быть проведена регистрация признаков по каждой единице исследуемой совокупности. Так, критическим моментом микропереписи был 0 часов в ночь с 13 на 14 февраля 1994 г. Критический момент устанавливается с целью получения сопоставимых статистических, данных. В случае исследования варьирования биржевых котировок на торгах валютных бирж в различных городах России необходимо иметь данные о курсах доллара США, японской иены, евро и других валют, зарегистрированные в один и тот же день. Если же надо проанализировать изменение объема продаж какой-либо валюты на биржевом рынке в отчетном месяце по сравнению с предыдущим месяцем, то устанавливается не критический момент, а интервал времени, за который следует получить статистические данные.
Выбор критического момента или интервала времени определяется прежде всего целью исследования.
Срок (период) наблюдения – это время, в течение которого происходит заполнение статистических формуляров, т. е. время, необходимое для проведения массового сбора данных. Этот срок определяется исходя из объема работы (числа регистрируемых признаков и единиц в обследуемой совокупности), численности персонала, занятого сбором информации. Следует учитывать, что отдаление периода наблюдения от критического момента или интервала времени может привести к снижению достоверности получаемых сведений. Например, микроперепись населения, упомянутая ранее, проводилась в течение десяти дней – с 14 по 23 февраля 1994 г.
Точностью статистического наблюдения называют степень соответствия величины какого-либо показателя (значение какого-либо признака), определенной по материалам статистического наблюдения, действительной его величине.
Расхождение между расчетным и действительным значениями изучаемых величин называется ошибкой наблюдения.
Точность данных – это основное требование, предъявляемое к статистическому наблюдению. Чтобы избежать ошибок наблюдения, предупредить, выявить и исправить, необходимо:
обеспечить качественное обучение персонала, который будет проводить наблюдение;
организовать специальные частичные или сплошные контрольные проверки правильности заполнения статистических формуляров;
провести логический и арифметический контроль полученных данных после окончания сбора информации.
В зависимости от причин возникновения различают ошибки регистрации и ошибки репрезентативности.
Ошибки регистрации – это отклонения между значением показателя, полученного в ходе статистического наблюдения, и фактическим, действительным его значением. Этот вид ошибок может быть и при сплошном, и при несплошном наблюдениях.
Ошибки регистрации бывают случайные и систематические.
Случайные ошибки – это результат действия различных случайных факторов (например, цифры переставлены местами, перепутаны соседние строки или графы при заполнении статистического формуляра). Такие ошибки имеют разную направленность: они могут и повышать, и понижать значения показателей. При достаточно большой обследуемой совокупности в результате действия закона больших чисел эти ошибки взаимно погашаются.
Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению значения показателей по каждой единице наблюдения, и поэтому величина показателя по совокупности в целом будет включать в себя накопленную ошибку. Примером статистической ошибки регистрации при проведении социологических опросов населения может служить округление возраста населения, как правило, на цифрах, оканчивающихся на 5 и 0. Многие опрашиваемые, например, вместо 48 – 49 и 51-52 лет говорят, что им 50 лет.
В отличие от ошибок регистрации ошибки репрезентативности характерны только для несплошного наблюдения. Они возникают потому, что отобранная и обследованная совокупность недостаточно точно воспроизводит (репрезентирует) всю исходную совокупность в целом.
Отклонение значения показателя обследованной совокупности от его величины по исходной совокупности называется ошибкой репрезентативности.
Ошибки репрезентативности также бывают случайные и систематические.
Случайные ошибки возникают, если отобранная совокупность неполно воспроизводит всю совокупность в целом. Ее величина может быть оценена.
Систематические ошибки репрезентативности появляются вследствие нарушения принципов отбора единиц из исходной совокупности, которые должны быть подвергнуты наблюдению.
После получения статистических формуляров следует прежде всего провести проверку полноты собранных данных, т. е. определить, все ли отчетные единицы заполнили статистические формуляры и значения всех ли показателей отражены в них. Следующим этапом контроля точности информации является арифметический контроль. Он основывается на использовании количественных связей между значениями различных показателей. Например, если среди собранных данных имеются сведения о численности промышленно-производственного персонала, выработке товарной продукции в среднем на одного работающего и стоимости товарной продукции, то произведение первых двух показателей должно дать значение третьего показателя. Если арифметический контроль покажет, что данная зависимость не выполняется, это будет свидетельствовать о недостоверности собранных данных. Поэтому в программу статистического наблюдения целесообразно включать показатели, которые дают возможность провести арифметический контроль.
Логический контроль, так же как и арифметический, основывается на знании взаимосвязей между показателями, но не количественных, а логических. Например, человек в возрасте 6 лет не может иметь высшего образования. Поэтому если в бланке переписи имеются одновременно обе записи, то это показывает, что одна из них не соответствует действительности.
|
|
В недалеком прошлом прогнозирование как специфический вид научного анализа находило более или менее широкое применение в области естественных явлений (прогноз погоды, паводков, урожайности и т.д.), ныне оно охватило самые различные сферы деятельности людей: политику, международные отношения, экономику, научно-технический прогресс, демографические и социальные процессы, образование и т.д. Формируется новое научное направление – прогностика, в котором на основе синтеза методов, заимствованных из философии, социологии, статистики, математики, и собственных методов разрабатываются перспективные оценки развития общественных процессов и явлений.
Необходимость предвидения вероятностного исхода событий в будущем никогда прежде не была столь насущной, как сейчас. Это, прежде всего, связано с бурным развитием мирового революционного процесса, высокими темпами научно-технического прогресса и многими другими явлениями современности. Предвидение событий дает возможность заблаговременно приготовиться к ним, учесть их положительные и отрицательные последствия, а если это возможно – вмешаться в ход развития, контролировать его, и что более важно – работать для претворения в жизнь одной из выявленных альтернатив будущего. Предстоящие крупные сдвиги в области науки, техники, социальных отношений, отдаленные от нас на десятки лет, в той или иной мере коренятся в событиях сегодняшнего дня. Решения, принимаемые сегодня, опираются на оценки развития явлений в будущем; в свою очередь они в большей или меньшей степени воздействуют на это будущее.
Плановое ведение хозяйства вовсе не устраняет необходимость в прогнозах. Всякий народнохозяйственный план осуществляется в обстановке, отдельными элементами которой мы не можем полностью (погода) или частично (некоторые явления международной жизни, демографические процессы) управлять, т.е. изменять в соответствии с целями и задачами своей деятельности. Таким образом, имеется целый ряд явлений и процессов, непосредственно не охватываемых народнохозяйственными планами и вместе с тем существенно влияющих на развитие народного хозяйства.
ПРОГНОЗ И ПРОНОЗИРОВАНИЕ
Прежде чем перейти к изложению существа дела, сделаем несколько замечаний о содержании некоторых терминов, употребляемых в экономической прогностике. Дело в том, что развивающийся и еще не установившийся характер прогностического подхода к общественным явлениям, самой прогностики как совокупности методологических представлений и методических приемов в рамках такого подхода обусловил значительную неопределенность, а иногда и субъективность содержания, которое вкладывается различными исследователями в эти термины.
Под прогнозированием мы понимаем научное (т.е. основанное на системе фактов и доказательств, установленных причинно-следственных связей) выявление вероятностных путей и результатов предстоящего развития явлений и процессов, оценку показателей, характеризующих эти явления и процессы для более или менее отдаленного будущего. Таким образом, прогнозирование – это научная деятельность, направленная на выявление и изучение возможных альтернатив будущего развития и структуры его вероятных траекторий. Каждая альтернативная траектория развития связывается с наличием комплекса внешних относительно исследуемой системы (явлений) условий.
Объектами прогнозирования, естественно, не могут являться любые явления или процессы. Если результат процесса однозначен, то его прогнозирование не имеет смысла. Напротив, если имеется множество возможных альтернатив для реализации процесса, то прогноз дает новую информацию.
Таким образом, прогнозирование распространяется на такие процессы, управление которыми и тем более планирование их развития (во всяком случае, в момент выработки прогноза) либо возможно в весьма малом диапазоне, либо совсем невозможно, исходя из современного уровня знаний или наличия инструментов управления, или, наконец, оно вполне возможно в принципе, но требует учета действия таких факторов, влияние которых не может быть полностью или однозначно определено.
В формулировке ООН предлагается термин проектировка для обозначения гипотетической оценки значения некоторого показателя, которое может реализоваться в будущем, если наступят некоторые оговоренные условия. Иначе говоря, проектировка – ожидаемый результат реализации какого-либо условного утверждения, которое в явном виде с помощью формальной математической модели или качественных неформальных обоснований связывается с этими условиями. Термином прогноз обозначается возможное будущее значение некоторого показателя (условное утверждение), однако в отличие от проектировки он связывается не с любыми условиями, а лишь с теми, которые будут превалировать в будущем, т.е. с условиями, имеющими наибольшую вероятность. Таким образом, прогноз в данной системе терминов можно рассматривать как наиболее вероятностную проектировку.
Периодом упреждения при прогнозировании мы называем отрезок времени от момента, для которого имеются последние статистические данные об изучаемом объекте, до момента, к которому относится прогноз. По длительности периода упреждения общепринято различать три вида прогнозов: краткосрочные – период упреждения от нескольких дней до года, полутора лет; среднесрочные – свыше года до 3-5 лет; долгосрочные – от 6 лет и выше. Указанные виды прогнозов, естественно, различаются по своему существу. Долгосрочные и, в известной мере, среднесрочные прогнозы нацелены на выявление общей тенденции развития экономической характеристики. Обычно предполагается , что в будущем в силу воздействия кратковременных, в том числе случайных факторов, будут наблюдаться некоторые отклонения от этой тенденции. Краткосрочные прогнозы предназначены для выполнения другой функции. С их помощью пытаются уловить конкретные реализации изучаемого процесса, иначе говоря, краткосрочные прогнозы оценивают влияние тех факторов, которые и приводят к отклонениям от долговременных тенденций.
Итак, прогнозирование является в нашем представлении специфическим видом научно-прикладного анализа. Главная его особенность заключается в том, что он нацелен на будущее; вторая важная черта – учет неопределенности, связанной с этим будущим. Неопределенность обусловлена отсутствием знаний о точном значении тех или иных экономических параметров, отражающих влияние основных или дополнительных факторов, о действительных условиях, в которых будет развиваться изучаемый процесс, и т.д. На наш взгляд, нельзя рассматривать перспективный анализ как прогнозирование, если он не учитывает формально (с помощью теории вероятностей) или неформально (если для применения теории вероятностей нет достаточных оснований) различного влияния неопределенности. В последнем случае экспертным путем устанавливается некоторая область ожидаемых значений прогнозируемой переменной. При этом, естественно, принимается во внимание значительно большее число качественных особенностей (и, в частности, учитывается возможность изменения окружающих условий, влияющих на формирование явления, и т.д.), чем это представляется возможным при формализованном подходе к разработке прогноза. Так или иначе, прогноз, по-видимому, должен быть представлен в такой форме, которая отражает неопределенность в процессе формирования явления, поскольку нет способа однозначного определения того, что будет на самом деле. Вероятностный (стохастический) подход к прогнозированию, по-видимому, является наиболее строгим, но в практике он может быть применен далеко не всегда.
По характеру исследовательской работы прогнозирование нельзя полностью противопоставлять историческому анализу. И тот и другой виды анализа исследуют тенденции и закономерности развития явлений, вскрывают причинно-следственные связи, выявляют механизмы действия изучаемых процессов. Прогнозирование, так же как и исторический анализ, обязательно предполагает систему научных доказательств, использование ряда методов и приемов, характеризующихся известным уровнем формализации, и увязку (приведение к согласованности) отдельных суждений и оценок, хотя последние и относятся к будущему.
Как известно, прогнозы экономических явлений и процессов могут быть разработаны в виде качественных характеристик развития (общее описание тенденции и ожидаемого характера изменений, а в самом простом случае – утверждение о возможности или невозможности наступления каких-либо событий) и количественных (точечных или интервальных) оценок, характеризующих будущие числовые значения прогнозируемых показателей и величины вероятностей достижения этих значений. Разумеется, что каждый научно разрабатываемый прогноз охватывает обе стороны развития перспективно оцениваемых явлений и процессов – количественную и качественную. Соотношение характеристик этих сторон в прогнозе зависит от специфики объекта прогноза и целей прогнозирования, от степени совершенства методики прогностических исследований.
Система обоснования и доказательства качественных и количественных характеристик будущего развития может включить в себя самые различные подходы – применение математических методов вовсе не является обязательным. Структура этой системы зависит от целей прогноза, наличия информации, продолжительности периода упреждения, конкретных особенностей изучаемых процессов, сроков подготовки прогноза и т.д.
Основой системы доказательств является качественный (содержательный) анализ процесса, т.е. вскрытие и обоснование причинно-следственных отношений, формирование общих гипотез и концепций будущего развития, оценка характера влияния основных составляющих этого процесса и т.д. Качественный анализ является отправным и заключительным этапом процесса прогнозирования. Количественный анализ, дающий возможность получить прогностические оценки в числовом выражении не только исходит из результатов изучения процессов по существу, но в свою очередь обогащает и подкрепляет содержательный анализ, делает его более доказательным, сокращает область неопределенности прогноза, в частности, отсекая явно невозможные и противоречивые выводы.
Кардинальное значение при разработке прогнозов в области социально-экономических явлений и процессов имеет, таким образом, теория их развития, которая охватывает характеристику сущности основных причинно-следственных связей и закономерностей и экономических, социальных и политических последствий развития объекта прогноза. Правильность исходных теоретических предпосылок, методологической основы прогноза решающим образом влияет на его результаты и возможность их практического использования. Теория развития, в конечном счете, определяет содержание системы доказательств и концепций развития, закладываемых в прогноз, а, следовательно, в значительной мере влияет на выбор применяемых для прогнозирования методов.
Методами социально-экономического прогнозирования именуется совокупность приемов мышления, позволяющих на основе анализа ретроспективных внешних и внутренних связей, присущих объекту, а также их измерений в рамках рассматриваемого явления или процесса вынести суждения определенной достоверности относительно его будущего развития. Таким образом, если методологической основой прогнозирования служит теория развития объекта, которая раскрывает существо закономерностей, содержание основных причинно-следственных связей рассматриваемого процесса, то методы прогнозирования позволяют найти меру влияния отдельных закономерностей и причин развития, представить объект прогноза как динамическую систему измеренных с определенной степенью достоверности взаимодействий реальных явлений, факторов, сил общественной деятельности и тем самым дать возможность воспроизвести с определенной степенью вероятности поведение этой системы в будущем.
ИНЕРЦИОННОСТЬ И СТАТИСТИЧЕСКИЕ ЗАКОНОМЕРНОСТИ
Процессы развития в экономике носят диалектический характер, который, в частности, проявляется в сочетании черт устойчивости и изменчивости этого развития. Соотношение этих черт, их удельный вес в характеристике развития за определенные хронологические интервалы весьма важны для экономического прогнозирования. Так, если изучаемые и прогнозируемые процессы имеют достаточно длительную историю и накоплен материал, позволяющий вскрыть закономерность и тенденции в их развитии и взаимосвязях с другими явлениями, а сами процессы обладают большой инерционностью, то гипотеза о будущем развитии этих процессов в значительной мере, хотя и не исключительно, может базироваться на анализе прошлого. Инерционность в социально-экономических процессах проявляется двояким образом: во-первых, как инерционность взаимосвязей, т.е. как сохранение в основных чертах механизма формирования явления (иначе говоря, сохранение зависимости, корреляции прогнозируемой переменной от совокупности переменных-аргументов); во-вторых, как инерционность в развитии отдельных сторон процессов, т.е. как некоторая степень сохранения их характера – темпов, направления, колеблемости основных количественных показателей на протяжении сравнительно длительных хронологических отрезков.
Инерционность развития экономики страны связана с длительно воздействующими факторами, например, такими, как структура основных фондов, их возраст и эффективность, размеры инвестиций прошлых лет, степень устойчивости технологических взаимосвязей отраслей производства, исторически сложившаяся структура потребления и т.д. Следует также учесть, что научно-технический прогресс в основном материлизуется путем постепенного накапливания небольших улучшений, усовершенствований, новшеств, относительно медленным вытеснением старого. …новые факторы, пришедшие на смену старым, в свою очередь способны оказывать более или менее длительное инерционное воздействие.
По-видимому, степень инерционности зависит и от такого фактора, как размер или масштаб изучаемой системы или процесса. Если рассматривать производственную систему, то чем ниже ее уровень в иерархии “предприятие – отрасль- народное хозяйство”, тем менее инерционными оказываются соответствующие характеристики. Последнее обстоятельство можно объяснить и тем, что влияние отдельного фактора (например, внедрение новой технологии) на низовом уровне часто оказывается доминирующим. На макроуровне показатели более устойчивы, поскольку на их значение оказывает воздействие уже гораздо большее число факторов. Изменение действия ряда из них (иногда оказывающих противоположное влияние) приводит к меньшей потере инерционности, чем на микроуровне. Инерционную тенденцию можно уподобить равнодействующей системе сил в механике. При большом числе составляющих изменение одной из них не окажет серьезного влияния на положение и размер равнодействующей в рамках всего хозяйства.
Опыт свидетельствует также и о том, что чем “моложе” изучаемая система (экономическое явление, процесс, отрасль) и соответственно чем меньше имелось времени для формирования более или менее устойчивых взаимосвязей и основных тенденций в ее развитии, тем меньшей инерционностью она обладает.
Итак, при значительной инерционности рассматриваемых экономических процессов и взаимосвязей и сохранении в будущем важных внешних причин и условий их развития правомерно с достаточной степенью вероятности ожидать сохранения уже выявившихся черт и характера этого процесса. Причем наличие инерционности нисколько не означает, что явление в своем развитии будет жестко следовать уже наметившейся тенденции. Несомненно, различные факторы будут в большей или меньшей степени воздействовать на явления, приводя к отклонениям от тенденции. В этих условиях становится целесообразным применять разнообразные методы обнаружения и экстраполяции преобладающей тенденции развития анализируемого объекта, использовать для прогнозирования найденные взаимосвязи экономических показателей и закономерности их изменения. При этом естественным является применение статистических подходов к прогнозированию.
СТАТИСТИЧЕСКИЕ МЕТОДЫ ПРОГНОЗИРОВАНИЯ
Статистические методы прогнозирования не являются единственно возможными. Известны и другие. Например, в последнее время в прогнозировании научно-технического прогресса интенсивно используются различные нормативные (т.е. основанные на изучении возможных будущих потребностей в технических новшествах) и статистические методы. Широкое применение получили прогнозы, основанные на экспертных оценках. В ряде случаев прибегают к разработке так называемых сценариев развития, морфологическому анализу, историческим аналогиям и т.д. Новым подходом к прогнозированию научно-технического прогресса является “симптоматическое прогнозирование”, суть которого заключается в выявлении “предвестников” будущих сдвигов в технике и технологии. Большие возможности для прогнозирования кроются в применении имитационных моделей. В практике прогнозирования экономики, однако, преобладающими, по крайней мере, до сего времени, являются статистические методы. Как уже говорилось выше, это связано главным образом с наличием инерционности в развитии экономических явлений и объектов. Немаловажным для практической работы является и то, что статистические методы опираются на аппарат анализа, развитие и практика применения которого, имеют достаточно длительную историю.
Процесс прогнозирования, опирающийся на статистические методы, распадается на два этапа. Первый, индуктивный, заключается в обобщении данных, наблюдаемых за более или менее продолжительный период времени, и в представлении соответствующих статистических закономерностей в виде модели. Статистическую модель получают или в виде аналитически выраженной тенденции развития, или же в виде уравнения зависимости от одного или нескольких факторов-аргументов. В ряде случаев – при изучении сложных комплексов экономических показателей – прибегают к разработке так называемых взаимозависимых систем уравнений, состоящих в основном опять-таки из уровнений, характризующих статистические зависимости. Процесс построения и применения статистической модели для прогнозирования, какой бы вид последняя не имела, обязательно включает выбор формы уравнения, описывающего динамику или взаимосвязь явлений, и оценивание его параметров с помощью того или иного метода. Второй этап, собственно прогноз, является дедуктивным. На этом этапе на основе найденных статистических закономерностей определяют ожидаемое значение прогнозируемого признака.
Следует подчеркнуть, что полученные результаты не могут рассматриваться как нечто окончательное. При их оценке и использовании должны приниматься во внимание факторы, условия или ограничения, которые не были учтены при разработке статистической модели, должна осуществляться корректировка обнаруженных статистических характеристик в соответствии с ожидаемым изменением обстоятельств их формирования. Короче говоря, найденные с помощью статистических методов прогностические оценки являются важным материалом, который, однако, должен быть критически осмыслен. При этом главным является учет возможных изменений в самих тенденциях развития экономических явлений и объектов.
Известная условность в получаемых выводах связана с тем, что целый ряд статистических методов базируется на довольно жестких требованиях к качеству обрабатываемых данных (например, к их однородности) и строгих гипотезах о характере поведения анализируемых величин (их распределениях). На практике же экономист зачастую, особенно если исследуются динамические ряды, имеет дело с информацией, качество которой в отношении выдвинутых требований оставляет желать лучшего или просто неизвестно. Обычно неизвестен и тип распределения переменных. Таким образом, для практика остаются две альтернативы: или вообще отказаться от применения большинства методов и довольствоваться достаточно скудным инструментарием, или применять разнообразные статистические методы обработки данных, не забывая о соответствующих этим методам требованиях. Очевидно, что в последнем случае, если существуют сомнения в “чистоте эксперимента”, не следует придавать получаемым статистическим выводам чрезмерно строгий смысл. В то же время эти выводы, как правило, оказываются полезными для практической деятельности и прогнозирования. Так, например, статистическая проверка гипотез основывается на предположении о существовании нормального распределения соответствующих переменных. На практике же мы в лучшем случае сталкиваемся с асимптотически нормальными распределениями (т.е. с распределениями, стремящимися к нормальным с ростом объема выборки). Вместе с тем проверка гипотез и в этих обстоятельствах дает практически приемлемые результаты, исключая разве такие ситуации, когда значения, скажем, t-статистики Стьюдента близки к критическому (ta). В последнем случае вывод, естественно, нельзя признать надежным.
Далеко не всегда статистические методы прогнозирования применяются самостоятельно, так сказать, в чистом виде. Часто их включают в виде важных элементов в комплексные методики, предусматривающие сочетание статистических методов с другими методами прогнозирования, например с экспертными оценками, различного рода экономико-математическими моделями и т.д. Такой комплексный подход к прогнозированию представляется наиболее плодотворным. Из сказанного выше вытекает, что статистические методы занимают важное место в системе методов прогнозирования, однако они ни в коей мере не должны рассматриваться как некий универсальный метод, как “золотой ключик”, открывающий любую дверь.
В ряде случаев собственно статистическая обработка экономической информации непосредственно не приводит к получению прогноза, однако является важным звеном в общей системе из разработки. Такая обработка данных наблюдения, нацеленная на вскрытие различного рода конкретных статистических закономерностей, представляет собой, по сути дела, первый шаг на пути осмысливания информации и построения более сложных моделей, отображающих взаимодействие множества факторов. В Связи с этим необходимо подчеркнуть важную роль статистической методологии в рамках построения имитационных моделей, которые все больше привлекают внимание экономистов. Потенциальные возможности имитационных моделей в отношении прогнозирования поведения изучаемых (моделируемых) систем еще далеки от полного раскрытия. Но уже сейчас очевидно, что успешность прогнозов, получаемых на основе имитационных моделей, существенно будет зависеть от качества статистического анализа эмпирического материала, от того, насколько такой анализ сможет выявить и обобщить закономерности развития изучаемых объектов во времени.
В настоящее время нельзя серьезно говорить о прогнозировании, исключая разве самые простые методы сбора и обработки экспертных оценок, не предполагая интенсивное использование ЭВМ. Дело, прежде всего в том, что если применение ЭВМ не предусматривается, то тем самым резко ограничивается набор возможных инструментов анализа и сужается круг применяемых для прогноза подходов – исследователь должен будет исключать методики, предполагающие осуществление трудоемких расчетов или расчеты, которые вообще не могут быть выполнены ручным способом или на счетно-вычислительных машинах. Таким образом, быстродействие ЭВМ, возможность с их помощью охватить большой объем информации, выполнить сложные и трудоемкие расчеты и тем самым повысить реалистичность описания исследуемых процессов и явлений представляет собой главную причину, определяющую необходимость применения ЭВМ при прогнозировании.
Очень важное преимущество заключается в расширении возможности проведения с помощью ЭВМ разнообразных расчетных экспериментов. Как инструмент экспериментирования ЭВМ позволяет оценить и повысить адекватность разработанной прогностической модели реальным условиям в прошлом (путем улучшения выбора форм взаимосвязи, выбора независимых переменных модели и т.д.), выявить в ходе испытаний ее прогностические свойства и на основе соответствующих коррективов улучшать эти свойства. Достаточно сказать, что при построении прогностической регрессионной модели приходится разрабатывать, по крайней мере, десятки ее вариантов, прежде чем будет приемлемый результат. Однако главное заключается в том, что с помощью ЭВМ имеется возможность испытать широкий диапазон альтернативных допущений, принимаемых при разработке тех или иных вариантов прогноза, проверить влияние начальных условий (обычно значения исходных данных, относящиеся к моменту разработки прогноза, точно не известны), оценить влияние различных гипотез о возможном характере развития и т.д.
Сущность задачи проверки статистических гипотез
Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки. Примерами статистических гипотез являются предположения: генеральная совокупность распределена по экспоненциальному закону; математические ожидания двух экспоненциально распределенных выборок равны друг другу. В первой из них высказано предположение о виде закона распределения, а во второй – о параметрах двух распределений. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими, в противном случае – параметрическими.
Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Н0. Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н1. И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.
Различают простые и сложные гипотезы. Гипотезу называют простой, если она однозначно характеризует параметр распределения случайной величины. Например, если l является параметром экспоненциального распределения, то гипотеза Н0 о равенстве l =10 – простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н0 о неравенстве l >10 состоит из бесконечного множества простых гипотез Н0 о равенстве l =bi , где bi – любое число, большее 10. Гипотеза Н0 о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной. Сложной гипотезой будет предположение о распределении случайной величины Х по нормальному закону, если не фиксируются конкретные значения математического ожидания и дисперсии.
Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно. Обозначим эту величину через z, ее значение является функцией от элементов выборки z=z(x1, x2, …, xn). Процедура проверки гипотезы предписывает каждому значению критерия одно из двух решений – принять или отвергнуть гипотезу. Тем самым все выборочное пространство и соответственно множество значений критерия делятся на два непересекающихся подмножества S0 и S1. Если значение критерия z попадает в область S0, то гипотеза принимается, а если в область S1, – гипотеза отклоняется. Множество S0 называется областью принятия гипотезы или областью допустимых значений, а множество S1 – областью отклонения гипотезы или критической областью. Выбор одной области однозначно определяет и другую область.
Принятие или отклонение гипотезы Н0 по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает с вероятностью a тогда, когда отвергается верная гипотеза Н0 и принимается конкурирующая гипотеза Н1. Ошибка второго рода возникает с вероятностью b в том случае, когда принимается неверная гипотеза Н0, в то время как справедлива конкурирующая гипотеза Н1. Доверительная вероятность – это вероятность не совершить ошибку первого рода и принять верную гипотезу Н0. Вероятность отвергнуть ложную гипотезу Н0 называется мощностью критерия.
Предположим, что истинное значение оцениваемого параметра равно Т. Если рассматривать гипотезу Н0 о равенстве q =Т, то насколько велико должно быть различие между q и Т, чтобы эту гипотезу отвергнуть. Ответить на данный вопрос можно в статистическом смысле, рассматривая вероятность достижения некоторой заданной разности между q и Т на основе выборочного распределения параметра q .
Целесообразно полагать одинаковыми значения вероятности выхода параметра q за нижний и верхний пределы интервала. Такое допущение во многих случаях позволяет минимизировать доверительный интервал, т.е. повысить мощность критерия проверки. Суммарная вероятность того, что параметр q выйдет за пределы интервала с границами q 1–a /2 и q a /2, составляет величину a . Эту величину следует выбрать настолько малой, чтобы выход за пределы интервала был маловероятен. Если оценка параметра попала в заданный интервал, то в таком случае нет оснований подвергать сомнению проверяемую гипотезу, следовательно, гипотезу равенства q =Т можно принять. Но если после получения выборки окажется, что оценка выходит за установленные пределы, то в этом случае есть серьезные основания отвергнуть гипотезу Н0. Отсюда следует, что вероятность допустить ошибку первого рода равна a (равна уровню значимости критерия).
При заданном объеме выборки вероятность совершения ошибки первого рода можно уменьшить, снижая уровень значимости a . Однако при этом увеличивается вероятность ошибки второго рода b (снижается мощность критерия). Аналогичные рассуждения можно провести для случая, когда истинное значение параметра равно Т – d.
Единственный способ уменьшить обе вероятности состоит в увеличении объема выборки (плотность распределения оценки параметра при этом становится более “узкой”). При выборе критической области руководствуются правилом Неймана – Пирсона: следует так выбирать критическую область, чтобы вероятность a была мала, если гипотеза верна, и велика в противном случае. Однако выбор конкретного значения a относительно произволен. Употребительные значения лежат в пределах от 0,001 до 0,2. В целях упрощения ручных расчетов составлены таблицы интервалов с границами q 1–a /2 и q a /2 для типовых значений a и различных способов построения критерия.
При выборе уровня значимости необходимо учитывать мощность критерия при альтернативной гипотезе. Иногда большая мощность критерия оказывается существеннее малого уровня значимости, и его значение выбирают относительно большим, например 0,2. Такой выбор оправдан, если последствия ошибок второго рода более существенны, чем ошибок первого рода. Например, если отвергнуто правильное решение “продолжить работу пользователей с текущими паролями”, то ошибка первого рода приведет к некоторой задержке в нормальном функционировании системы, связанной со сменой паролей. Если же принято решения не менять пароли, несмотря на опасность несанкционированного доступа посторонних лиц к информации, то эта ошибка повлечет более серьезные последствия.
В зависимости от сущности проверяемой гипотезы и используемых мер расхождения оценки характеристики от ее теоретического значения применяют различные критерии. К числу наиболее часто применяемых критериев для проверки гипотез о законах распределения относят критерии хи-квадрат Пирсона, Колмогорова, Мизеса, Вилкоксона, о значениях параметров – критерии Фишера, Стьюдента.
Типовые распределения
При проверке гипотез широкое применение находит ряд теоретических законов распределения. Наиболее важным из них является нормальное распределение. С ним связаны распределения хи-квадрат, Стьюдента, Фишера, а также интеграл вероятностей. Для указанных законов функции распределения аналитически не представимы. Значения функций определяются по таблицам или с использованием стандартных процедур пакетов прикладных программ. Указанные таблицы обычно построены в целях удобства проверки статистических гипотез в ущерб теории распределений – они содержат не значения функций распределения, а критические значения аргумента z(a ).
Для симметричной функции плотности распределения f(z) критическую область выбирают из условия a 1=a 2=a /2 (обеспечивается наибольшая мощность критерия). В таком случае левая и правая границы будут равны z(a /2) .
Нормальное распределение
Этот вид распределения является наиболее важным в связи с центральной предельной теоремой теории вероятностей: распределение суммы независимых случайных величин стремится к нормальному с увеличением их количества при произвольном законе распределения отдельных слагаемых, если слагаемые обладают конечной дисперсией. Так как реальные физические явления часто представляют собой результат суммарного воздействия многих факторов, то в таких случаях нормальное распределение является хорошим приближением наблюдаемых значений.
Вычисление значений функции распределения Ф(u) для стандартизованного неотрицательного аргумента u (u ³ 0) можно произвести с помощью полинома наилучшего приближения
Ф(u)= 1– 0,5(1 + 0,196854u + 0,115194u2 +
+ 0,000344u3 + 0,019527u4)– 4.
Такая аппроксимация обеспечивает абсолютную ошибку не более 0,00025. Для вычисления Ф(u) в области отрицательных значений стандартизованного аргумента u (u<0) следует воспользоваться свойством симметрии нормального распределения Ф(u) = 1 – Ф(–u).
Иногда в справочниках вместо значений функции Ф(u) приводят значения интеграла вероятностей
Интеграл вероятностей связан с функцией нормального распределения соотношением Ф(u) = 0,5 + F(u).
Распределение хи-квадрат
Распределению хи-квадрат (c 2-распределению) с k степенями свободы соответствует распределение суммы квадратовстандартизованных случайных величин ui, каждая из которых распределена по нормальному закону, причем k из них независимы, ³ k. Функция плотности распределения хи-квадрат с k степенями свободы.
Распределение Стьюдента
Распределение Стьюдента (t-распределение, предложено в 1908 г. английским статистиком В. Госсетом, публиковавшим научные труды под псевдонимом Student) характеризует распределение случайной величины , где u0, u1, …, uk взаимно независимые нормально распределенные случайные величины с нулевым средним и конечной дисперсией. Аргумент t не зависит от дисперсии слагаемых.
Величина k характеризует количество степеней свободы. Плотность распределения – унимодальная и симметричная функция, похожая на нормальное распределение.
Область изменения аргумента t от –¥ до ¥ . Математическое ожидание и дисперсия равны 0 и k/(k–2) соответственно, при k>2. По сравнению с нормальным распределение Стьюдента более пологое, оно имеет меньшую дисперсию. Это отличие заметно при небольших значениях k, что следует учитывать при проверке статистических гипотез (критические значения аргумента распределения Стьюдента превышают аналогичные показатели нормального распределения). Таблицы распределения содержат значения для односторонней или двусторонней критической области.
Распределение Стьюдента применяется для описания ошибок выборки при k £ 30. При k >100 данное распределение практически соответствует нормальному, для 30 < k < 100 различия между распределением Стьюдента и нормальным распределением составляют несколько процентов. Поэтому относительно оценки ошибок малыми считаются выборки объемом не более 30 единиц, большими – объемом более 100 единиц. При аппроксимации распределения Стьюдента нормальным распределением для односторонней критической области вероятность Р{t > t(k; a )} = u1– a (0, k/(k–2)), где u1– a (0, k/(k–2)) – квантиль нормального распределения. Аналогичное соотношение можно составить и для двусторонней критической области.
Распределение Фишера
Распределению Р.А. Фишера (F-распределению Фишера – Снедекора) подчиняется случайная величина х =[(y1/k1)/(y2/k2)], равная отношению двух случайных величин у1 и у2, имеющих хи-квадрат распределение с k1 и k2 степенями свободы. Область изменения аргумента х от 0 до ¥ .
Проверка гипотез о законе распределения
Обычно сущность проверки гипотезы о законе распределения ЭД заключается в следующем. Имеется выборка ЭД фиксированного объема, выбран или известен вид закона распределения генеральной совокупности. Необходимо оценить по этой выборке параметры закона, определить степень согласованности ЭД и выбранного закона распределения, в котором параметры заменены их оценками. Пока не будем касаться способов нахождения оценок параметров распределения, а рассмотрим только вопрос проверки согласованности распределений с использованием наиболее употребительных критериев.
Критерий хи-квадрат К. Пирсона
Использование этого критерия основано на применении такой меры (статистики) расхождения между теоретическим F(x) и эмпирическим распределением Fп(x), которая приближенно подчиняется закону распределения c 2. Гипотеза Н0 о согласованности распределений проверяется путем анализа распределения этой статистики. Применение критерия требует построения статистического ряда.
Критерий А.Н. Колмогорова
Для применения критерия А.Н. Колмогорова ЭД требуется представить в виде вариационного ряда (ЭД недопустимо объединять в разряды). В качестве меры расхождения между теоретической F(x) и эмпирической Fn(x) функциями распределения непрерывной случайной величины Х используется модуль максимальной разности
dn = max F(x) – Fn(x) .
МЕТОДЫ ОЦЕНКИ ПАРАМЕТРОВ РАСПРЕДЕЛЕНИЯ
Точечная оценка параметров распределения
Сущность задачи точечного оценивания параметров
Точечная оценка предполагает нахождение единственной числовой величины, которая и принимается за значение параметра. Такую оценку целесообразно определять в тех случаях, когда объем ЭД достаточно велик. Причем не существует единого понятия о достаточном объеме ЭД, его значение зависит от вида оцениваемого параметра (к этому вопросу предстоит вернуться при изучении методов интервальной оценки параметров, а предварительно будем считать достаточной выборку, содержащую не менее чем 10 значений). При малом объеме ЭД точечные оценки могут значительно отличаться от истинных значений параметров, что делает их непригодными для использования.
Существует несколько методов решения задачи точечной оценки параметров, наиболее употребительными из них являются методы максимального (наибольшего) правдоподобия, моментов и квантилей.
Оценка параметров распределения и проверка гипотез
Общие понятия
Статистические гипотезы – это предположения, которые относятся к виду распределения случайной величины или отдельных его параметров.
Задача испытания статистических гипотез возникает тогда, когда обстоятельства вынуждают нас делать выбор между двумя способами действия.
Для оценки параметров по эмпирическим законам формулируется нулевая гипотеза (Н 0) об «отсутствии разногласий». Нулевая гипотеза примером статистического вывода: если нулевую гипотезу отбросить, то вывод состоит в том, что в совокупности, которая рассматривается есть разногласия, то есть принимается альтернативная гипотеза Н1.
Вероятность с которой может быть отклонена нулевая гипотеза, когда она верна, называется уровнем значимости (для медико-биологических исследований достаточным уровень значимости ). Уровень значимости задается заранее.
Вероятность принятия правильности решения (гипотеза Н 0 верна) называется доверительной вероятностью (для медико-биологических исследований ).
Проверка гипотез обычно сводится к проверке статистических характеристик, оценивающих параметры законов распределения.
Для проверки гипотез используют статистический критерий K – это разрешающее правило, обеспечивает принятие верности гипотезы и отклонение ложной с большой вероятностью.
Совокупность значений, при которых основная гипотеза не принимается называется критической областью. Точки, отделяющие критическую область от области принятия решений называются критическими.
Для определения критической области задается уровень значимости α. Для каждого из критериев есть таблицы, по которым находят значения критических точек.
Задача наилучшего выбора критической области решается обычно так, чтобы критерий проверки имел наибольшую чувствительность, т.е. чтобы мы имели наибольшую вероятность попадания нашего критерия в критическую область, когда верна альтернативная гипотеза. Эта вероятность носит название прочности критерия.
В силу того, что гипотезы не могут быть доказаны, а могут быть проверены при принятии гипотезы возможные ошибки.
Рассмотрим пример .
Процесс производства лекарств является сложным. Любое отклонение (даже незначительное) от технологии вызывает появление высокотоксичного побочного примеси. Токсичность этой примеси может быть настолько большой, что даже такая ее количество которая не может быть определена при химическом анализе опасна для пациента. Поэтому перед тем как выпускать в продажу партию лекарств ее исследуют на токсичность биологическими методами: небольшие дозы вводятся определенном количестве животных и результаты регистрируются. Количество животных, погибших является случайной величиной. Как правило инъецируемой несколько групп животных.
Терапия может привести к одной из двух возможных действий:
– выпустить партию лекарств в продажу;
– вернуть партию поставщику для переработки или уничтожения.
Выбор между двумя действиями может привести к совершению ошибок двух видов:
– признать препарат безопасным для пациентов, когда на самом деле препарат опасен. Эта ошибка может стоить жизни пациента.
– признать препарат опасным для пациентов, когда на самом деле он является безопасным. Последствия этой ошибки могут быть выражены и дополнительных финансовых затратах.
Таким образом последствия ошибок различны по своим значениям, поэтому при испытании гипотез является вважливим избегать одной из возможных ошибок, которая является более важна чем другая.
Следовательно, при проверке гипотез возможные ошибки двух видов:
– Н 0 отвергается, когда она верна – ошибка I-го рода.
– Н 0 принимается, когда правильная Н 1 – ошибка II-го рода.
В табл. 6.3 показаны возможные ситуации при проверке гипотез.
Таблица 20. Вероятность ошибок при различных вариантах ситуаций, возникающих при проверке гипотез
|
|
Признаки |
|
|
|
Н0 правильная |
Н0 неправильная |
Действия проверяющего |
Откинуть гипотезу Н0 |
a |
1 – a |
Принять гипотезу Н0 |
1 – a |
a |
Понижая уровень значимости мы уменьшаем вероятность ошибки первого рода, но при этом увеличивается вероятность ошибки второго рода.
Отметим, что чем больше прочность критерия, тем меньше вероятность ошибки второго рода.
Этапы проверки гипотез
1. 1. Определение статистической модели, которая будет использоваться.
Здесь выдвигают некоторый набор предпосылок относительно закона распределения случайной величины и ее параметров. Например, закон распределения нормальный, величины независимы и т.д.
2. Формулировка Н 0 и Н 1 .
3. Выбирают критерий, который подходит к выдвинутой статистической модели.
4. Выбирают уровень значимости a в зависимости от надежности выводов, требуются.
5. Определение критической области для проверки Н 0 .
Если значение критерия попадает в эту область, то Н 0 отвергается. При условии, что Н 0 верна, вероятность попадания в критическую область равна a . Вид этой области (односторонняя или двусторонняя) зависит от принятой Н 0 .
6. Расчета значение выбранного статистического критерия для существующих данных.
7. Сравнение рассчитанного значения критерия с критическим, а затем решают принять или отвергнуть Н 0 .
Критерии проверки гипотез
Одной из задач математической статистики является установление согласованности последовательности наблюдений случайных величин или событий с гипотезами о распределении случайной величины (или вероятности события).
Гипотезы, которые проверяются формулируются или на основе теоретических соображений, или в процессе статистического исследования.
Проверка гипотез, как правило, сводит к оценке параметров закона распределения. Утверждение, которые формулируются касающиеся значений параметров законов распределения. Из таких утверждений формулируются последствия. Последствия имеют характер вероятностных утверждений о поведении статистических характеристик. Проверка состоит в вычислении этих характеристик по данным наблюдений. Такие характеристики называются критериями проверки (К).
Для критериев проверки заранее фиксируют уровень значимости a , считая что в каждом эксперименте событие с вероятностью менее a практически невозможна.
Чем меньше уровень значимости, тем меньше вероятность отклонить гипотезу когда она верна (т.е. совершить ошибку I-го рода).
Любые гипотезы проверяют, выдвигая сначала комплекс некоторых предпосылок о законе распределения случайной величины. Невыполнение предпосылок делает выводы из соответствующих проверок не соответствующими истине. То есть, вероятность неправильных выводов растет. Степень уменьшения надежности выводов в различных критериев отличается. Стойкими называются такие критерии, для которых малые отклонения от принятых предпосылок (статистической модели) незначительно влияют на надежность выводов, сделанных по ним.
В связи с этим при решении реальной задачи необходимо подобрать критерии, подходящие для условий именно этой задачи. Поскольку существует большое количество различных критериев (особенно непараметрических), это может вызвать определенные трудности у специалистов, для которых статистические методы являются всего лишь инструментом, которым они пользуются редко. Поэтому рассмотрим определенную последовательность действий, придерживаясь которой можно сделать правильный выбор.
Таблица 2. Выбор метода для решения задачи о сравнении параметров распределения выборки
Формулировка задачи в прикладной постановке |
Формулировка задачи в статистической постановке |
Дополнительные условия |
Использованный метод |
|
Сравнение показателей контрольной и экспериментальной выборок |
Проверка гипотезы о равенстве средних (центров распределения) в двух независимых выборках |
Норма-ный закон распределения |
Дисперсии выборок уровне |
t-критерий (Стьюдента) при равных дисперсиях |
Дисперсии выборок не равны |
t-критерий (Стьюдента) при неравных дисперсиях |
|||
Без предположения о дисперсии (но при одинаковом размере выборок) |
t-критерий (Стьюдента) без предположения о дисперсии |
|||
Сравнение показателей выборки до и после эксперимента |
Проверка гипотезы о равенстве средних в двух зависимых выборках |
Нормальный закон распределения |
t-критерий (Стьюдента) для связных выборок |
|
Можно считать, что среднее значение показателя равен определенному номинальному значению? |
Проверка гипотезы о равенстве средней константе |
Нормальный закон распределения |
t-критерий (Стьюдента) |
|
Сравнение рассеяния показателей двух выборок |
Проверка гипотезы о равенстве дисперсий (о принадлежности дисперсий к одной генеральной совокупности) |
Нормальный закон распределения |
F-критерий Фишера |
|
Можно считать, что в нескольких выборках имеет место одно и тоже значение показателя? |
Проверка гипотезы о равенстве средних (о принадлежности средних до одной генеральной совокупности) |
Нормальный закон распределения |
Дисперсионный анализ |
Последовательность операций при выборе критерия
1. Постановка задачи.
2. Определить класс критериев, используемых.
3. Определить дополнительные условия выбора критерия (много критериев требуют дополнительных условий, без которых их использование некорректна).
4. Выбор конкретного критерия (во многих ситуациях существует несколько равнозначных критериев, подходящих для проверки гипотезы).
Рассмотрим подробнее вышеперечисленные операции.
Постановка задачи
– Сравнение показателей контрольной те экспериментальной выборок.
У нас есть две независимые выборки, средние значения некоторых параметров мы сравниваем. Например, две группы больных, лечение которых осуществлялось различными методами.
– Сравнение показателей выборки до и после эксперимента.
В данном случае мы имеем дело с так называемыми связными выборками. Например, значение определенного показателя в одной и той же группе больных до и после лечения.
– Можно считать, что среднее значение показателя равен определенному номинальному значению?
Для определенного показателя (например, артериальное давление, частота пульса) может существовать определенное значение, которое считается нормой. Необходимо проверить, можно ли считать, что среднее значение показателя в этой группе равна норме. После проверки этой гипотезы для среднего доверительный интервал обязательно нужно построить и проследить. Чтобы для выборки выполнялись необходимые условия.
– Сравнение рассеяния показателей двух выборок.
В некоторых биологических экспериментах важно не среднее значение показателя, а его рассеивания. Например, необходимо выбрать препарат (метод лечения), для которого рассеяния контролируемой признаки после применения будет минимальным.
– Можно считать, что в нескольких выборках имеет место одно и тоже значение показателя?
– Задача аналогична предыдущей, но сравниваются не два типа воздействия, а три и более.
– Можно считать, что в нескольких выборках имеет место одно и тоже значение рассеяния показателя?
Например, мы применяем для лечения различных групп больных несколько препаратов. Можем ли мы сказать, что результаты лечения статистически не отличаются?
Определение дополнительных условий выбора критерия
Наиболее распространенными дополнительными условиями для выбора критерия являются следующие условия:
– Равны ли не равны размеры выборок?
– Равны ли не равны дисперсии выборок сравниваются?
– Одинаковые законы распределения выборок сравниваются?
Последнее условие является требованием любого критерия, но никогда реально не проверяется. Она должна быть обеспечена правильным формирования выборок. Первое условие проверяется простым сравнением, а для проверки второй пользуются соответствующими критериями, выбираются аналогично.
Выбор конкретного критерия
Если существует несколько вариантов, критерий выбирается исходя из имеющихся программных средств или возможности проверки ссылок для его использования.
Требования к выборкам
При проведении исследований (особенно клинических) необходимо обеспечить следующие требования выборки.
Однородность. При выборе влияния совокупности факторов, изучаемых признаки, нас интересуют, не должны противоречить друг другу. Например, при исследовании влияния кофе на организм человека, в выборе изучаемых не должно быть людей, которых кофе возбуждает, и тех, которых от него клонит в сон. В ряде случаев причины неоднородности могут быть неизвестны и поэтому перед анализом данных желательна проверка выборки методами кластерного анализа.
При выборе не должно факторов, которые сильно влияют на параметр, кроме тех, что мы изучаем. Если мы предполагаем, что фазы Луны влияют на эффективность действия препарата, то фазу Луны необходимо учитывать как фактор или собирать выборки, в которых фаза Луны одинакова.
Репрезентативность (структурная соответствие). Выборка, изучаемого должна быть репрезентативна генеральной совокупности. Это означает, что когда мы формируем выборку из совокупности, она должна отвечать следующим требованиям:
Вид статистического распределения выборку должен соответствовать распределению генеральной совокупности.
Размер выборки должен быть достаточным для отображения структуры генеральной совокупности.
В связи с этим выборка из больных, которые проходили курс лечения в одной клинике или покупке одной аптеки не являются репрезентативными по своей структуре. Опрос, проведенный по телефону, отражает мнение только владельца телефона, а не всего населения, структура заболевания в различных областях различна. Выводы маркетингового исследования не распространяется на небольшие города.
В том случае когда сравниваем определенные параметры двух выборок, необходимо обеспечить равенство распределения частот факторов, которые влияют (пол, возраст, серьезность заболевания и т.д.) в сравниваемых выборках.
Совпадение условий наблюдений. Условия наблюдения для отдельных элементов выборки или двух выборок сравниваются, должны совпадать. Лучший способ это обеспечить – двойной слепой метод, при котором ни пациент, ни средний медицинский персонал не знает, какие лекарства или плацебо выдается конкретному больному. Это позволяет избавиться от эффекта внушения (воздействие которого возможен на 30-50% пациентов) и эффекта предвзятости.