Введение. Структура медико-биологического
эксперимента. Основные принципы
статистической обработки результатов
клинических испытаний. Пакеты программ
статистического анализа, особенности
использования STATISTICA и OpenOffice.org
Calc.
1.1. ВИДЫ МЕДИКО-БИОЛОГИЧЕСКИХ ДАННЫХ
Все биологически активные процессы, происходящие в че-
ловеческом организме, сопровождаются выработкой различных
сигналов - электромагнитных, звуковых, механических. Сигна-
лами в медицине могут быть также сведения о состоянии челове-
ка - например, его росте, массе тела, составе крови и других био-
логических жидкостей, сигналами являются объективные и субъ-
ективные признаки заболеваний - жалобы больного, лихорадка,
желтуха, результаты физикальных исследований. Применительно
к информационным технологиям в области организации здраво-
охранения сигналами служат различные цифровые показатели,
например, заболеваемости, смертности; сигналами могут являть-
ся также сведения о финансовых, человеческих и материальных
ресурсах, циркулирующих в сфере медицины, здравоохранения
и связанных с ними областях хозяйственной деятельности.
При взаимодействии биологических сигналов, возникающих
в организме человека, с физическими телами (детекторами) в по-
следних могут возникать определенные изменения их свойств,
которые регистрируются специальными приборами. У человека
сигналы поступают в головной мозг для последующего анализа.
И в том, и в другом случае происходит регистрация сигналов. За-
регистрированные сигналы в информатике называются данными.
Медико-биологические данные, касающиеся здоровых людей
и больных, могут быть систематизированы в следующие группы:
1. Количественные данные - параметры; их можно охаракте-
ризовать дискретными величинами: рост пациента, концен-
трация в крови форменных элементов и биологически ак-
тивных веществ, заболеваемость туберкулезом в группе
населения, количество ВИЧ-инфицированных больных и
др.
2. Качественные данные - признаки; они не поддаются точной
оценке, хотя и могут быть ранжированы (т.е. систематизи-
рованы по условным баллам: один балл, два балла и т.д.).
К таким данным относятся, например, цвет кожных покро-
вов, наличие болей, качество жизни человека и др. Каче-
ственные признаки, которые могут быть отнесены только
к двум категориям (их наличию или отсутствию), называ-
ются дихотомическими.
3. Статические картины органов человека или всего его тела;
они отображают картину пациента человека, различных
участков патологически измененных тканей, чаще всего с по-
мощью средств лучевой диагностики - рентгенологической,
радионуклидной, ультразвуковой, магнитно-резонансной;
например, патологические изменения на рентгенограмме
грудной клетки, сонограмме, изображение головного моз-
га на компьютерной томограмме. К статическим картинам
относят фотографии макропрепаратов и гистологических
срезов, эндоскопические изображения.
4. Динамические картины органов человека; они получаются
при непрерывной регистрации (на мониторе или жестком
диске компьютера) движущихся органов, например, сердца,
легких, при изучении быстроменяющихся картин прохож-
дения по организму рентгеноконтрастных или радиону-
клидных веществ (при рентгенологическом исследовании
пищеварительного тракта, радионуклидном исследовании
сердца).
5. Динамические данные физиологических функций: электро-
кардиограмма, электроэнцефалограмма, кривые, зареги-
стрированные при прохождении радиоактивного вещества
по организму и др.
Таким образом, зарегистрированные сигналы, называемые
теперь данными, могут иметь различную форму отображения. Од-
нако приведенная выше группировка в известной степени услов-
на, ибо одна и та же характеристика пациентов в зависимости
от способов регистрации сигнала может выступать в различных
группах. Например, при радионуклидном исследовании почек
полученные данные могут быть представлены в виде
статического их изображения. Они могут быть представлены
также в виде непрерывной динамической картины этих же
изображений. При соответствующей компьютерной их обработке
они могут иметь вид кривых, отражающих функцию почек,
содержать числовые параметры и описательные протоколы. При
исследовании кардиологического больного данные о состоянии
сердца могут иметь вид кривых электрической активности
(ЭКГ), визуального изображения отдельных камер сердца или
сердечной мышцы при соно-графии или магнитно-резонансной
томографии, количественной и качественной характеристики
работающего сердца и протекающей в нем крови.
1.2. ОЦЕНКА МЕДИКО-БИОЛОГИЧЕСКИХ ДАННЫХ
При оценке медико-биологических данных следует четко вы-
делять два различных понятия - признак и параметр, поскольку
каждый из них по-разному обрабатывается средствами информа-
ционных технологий.
Признак - это характеристика пациента (или явления), ко-
торая может иметь только два значения: наличие или его отсут-
ствие. Признаками являются, например, наличие болей, лихорад-
ка, покраснение кожных покровов, припухлости в какой-то части
тела, определение патологического образования на рентгенограм-
ме грудной клетки, деформация зубцов ЭКГ.
Параметр - это величина, характеризующая свойство про-
цесса, явления или системы в абсолютных или относительных
величинах. Параметрами являются, например, показатели темпе-
ратуры тела и артериального давления, концентрации в крови от-
дельных веществ, изменение интервалов между зубцами на ЭКГ,
размер выявленного патологического образования на рентгено-
грамме, распространенность заболевания среди населения.
Деление медико-биологических данных на признак и пара-
метр, также как и в изложенной выше классификации данных,
в какой-то степени условно. Для удобства обработки данных
на компьютере признак можно перевести в разряд параметра, если
характеризовать данное свойство по условной шкале. Например,
выраженность припухлости можно оценить в баллах: один балл,
два балла и т.д., желтуху как проявление заболевания можно
охарактеризовать уровнем концентрации билирубина в крови.
Аналогичным образом параметр может стать признаком, если
оценка его будет проводиться альтернативно (дихотомически):
наличие или отсутствие повышенной температуры тела
пациента (лихорадки), повышенного артериального давления
крови (гипертензии). Все это нужно учитывать при подготовке
данных для последующей информационной компьютерной
обработки.
При подготовке медико-биологических данных для их после-
дующей обработки, в том числе компьютерной, нередко возникает
необходимость применения различных шкал измерения. Суще-
ствует несколько таких шкал.
Шкала наименований - это группировка объектов и их произво-
дных в ряд непересекающихся классов. При этом считается, что все
объекты, принадлежащие к одному классу, являются идентичными,
а к разным классам - различными. К шкале наименований относят-
ся симптомы и синдромы заболеваний. Так, к шкале наименования
относится, например, классификация патологических затемнений
легочных полей на рентгенограмме грудной клетки: они могут быть
округлыми, треугольными, иметь очаговый или тотальный харак-
тер. Цвет кожных покровов может иметь обычную, желтушную,
красную или синюшную окраску. Шкала наименования представ-
ляет собою наиболее простое деление свойств объектов.
Шкала порядка - это упорядоченная шкала наименований,
на которой отражена, в основном, тенденция процесса. На такой
шкале признаки объектов представлены в восходящем либо в нис-
ходящем значении. На такой шкале, например, можно располо-
жить в возрастающем порядке концентрацию гормонов в крови
у больных с тиреотоксикозом, степень желтушности кожных по-
кровов, скорость оседания эритроцитов крови.
Интервальная шкала - это шкала с наличием единицы изме-
рения. Примером такой шкалы является шкала температур термо-
метра, в котором единицей измерения является один градус (или
его доля).
Шкала отношений - это интервальная шкала с нулевой
точкой, т.е. имеющей такую точку, в которой данный параметр
практически отсутствует. Примерами такой шкалы являются
измерительная линейка, ростомер, весы.
1.3. ЭТАПЫ ОПЕРАЦИИ
С МЕДИКО-БИОЛОГИЧЕСКИМИ ДАННЫМИ
В информационной технологии работы с данными, в том чис-
ле медицинского характера, существует несколько основных эта-
пов операции с данными:
1. Сбор и первичная обработка данных - это накопление ре-
зультатов исследований в том объеме, который задан усло-
виями поставленной задачи или необходимостью принять
адекватное решение. Существуют специальные правила,
определяющие объем требуемых данных для каждого клас-
са задач. Собранные данные подлежат первичной обработ-
ке, которая включает в себя отсечение «лишних», некоррек-
тно зарегистрированных сигналов. Первичная группировка
реализуется по типу данных и классам изучаемых явлений.
2. Оценка эффективности измерения данных - это определе-
ние степени точности и величины погрешности зарегистри-
рованных сигналов и полученных данных.
3. Cохранение данных - это регистрация данных в виде твер-
дых копий или на магнитных носителях.
4. Формализация и стандартизация данных - это сведение
всех полученных данных к единой форме, которая долж-
на соответствовать требованиям компьютерной обработки
и обеспечивать сопоставимость всех данных между собою,
а также доступность их для всех заинтересованных пользо-
вателей.
5. Фильтрация и очищение данных - это отсеивание лишних
сигналов, обусловленных неточностью работы регистри-
рующих приборов, некорректно собранной информацией
о состоянии изучаемого явления. Этот способ использует-
ся также при объективно существующей неоднородности
структуры и функционирования отдельных систем
человеческого организма.
6. Кодировка данных - это унификация формы представления
данных на бумажных или магнитных носителях.
7. Сортировка данных - это упорядочение данных по задан-
ному признаку или совокупности их характеристик .
8. Преобразование данных - это изменение формы данных
по заданному алгоритму или между различными типами
носителей.
9. Сжатие и архивация данных - это уплотнение данных
на носителях и организация их хранения, нередко связана
с изменением их формы.
10. Защита данных - это приведение данных по специально-
му алгоритму к форме, которая недоступна для несанкци-
онированного их использования (шифрование, или крип-
тографическая обработка данных).
11. Транспортировка данных - это передача данных на рас-
стояния с помощью механических или телекоммуникаци-
онных каналов связи.
1.3.1. Сбор и первичная обработка
медико-биологических данных
Сбор данных - это накопление их в достаточной степени
для того, чтобы принять адекватное решения или получить стати-
стически значимый результат. Объем данных обычно задается за-
ранее либо определяется анализом промежуточных результатов.
Нередко объем данных ограничен объективно существующими
обстоятельствами, например, ограниченным количеством боль-
ных, поступивших на лечение с конкретным исследуемым забо-
леванием.
Сбор данных - очень важная составляющая часть обработки
первичного материала. Особенно это касается тех случаев, когда
имеют дело с измерением медико-биологических сигналов. Все
эти измерения, как бы точны они не были, обязательно имеют
некоторую степень погрешности. Это может быть связано с огра-
ниченной точностью инструментов, которыми проводятся изме-
рения - линейки, электронного прибора или других технических
средств. Погрешность может быть обусловлена также и вариа-
бельностью самого измеряемого объекта, например, колебания-
ми биологических параметров человека во время исследования
(суточные биоритмы), отсутствием достаточной фиксации тела
человека в момент антропометрических измерений, наводкой
по электросетям во время снятия биопотенциалов (ЭКГ, электро-
энцефалография).
Перечисленные выше погрешности имеют случайный харак-
тер. Их влияние на точность измерения может быть уменьшено,
если увеличить количество измерений объекта исследования
или увеличить продолжительность каждого измерения (это каса-
ется, в основном, электрических величин). Погрешности такого
рода носят название случайных, или рандомизированных, ошибок.
Другой вид погрешностей возникает при неправильной работе
аппаратуры, калибровке лабораторного оборудования (электрон-
ных приборов, весов, тонометров и др.), технологии приготовления
химических растворов в биохимических лабораториях, ошибок, до-
пущенных в расчетах. Конечные результаты подобных измерений
оказываются во всех случаях либо завышенными, либо заниженны-
ми, т.е. всегда однозначно искаженными. Такого рода ошибки носят
название систематических ошибок. Единственная возможность их
избежать - это тщательно контролировать исправность медицин-
ской аппаратуры, проводить регулярную поверку в специальных
лабораториях, следить за правильностью выполнения диагности-
ческих и расчетных процедур, корректно выполнять эти расчеты.
1.3.2. Оценка эффективности измерения данных
Для оценки эффективности методов измерения медико-
биологических данных применяют ряд критериев, главными
из которых являются:
Точность измерений - это соответствие результатов измерения
истинному значению определяемой величины. Высокая точность
измерения достигается при минимальных рандомизированных
и систематических погрешностях.
Правильность измерений. Это качество измерения характери-
зует величину систематических погрешностей. Чем они меньше,
тем более правильным оказываются измерения.
«
»
(
)
Рис.1.1. «Охота за мишенью. Связь между достоверностью
(точностью) и сходимостью результатов, рандомизированными
и систематическими ошибками исследований
Сходимость измерений. Данное качество измерения характери-
зует величину случайных ошибок. Чем они меньше, тем лучше схо-
димость измерения. Этот критерий показывает, насколько близки
друг к другу измерения, выполненные в одинаковых условиях, т.е
в одной и той же лаборатории и на одном и том же приборе.
Воспроизводимость измерений. Этот критерий показывает,
как близки между собою будут результаты измерений, выполнен-
ных в различных условиях, т.е. в различных лабораториях, на раз-
личных аппаратах и различными людьми.
На рис.1.1 представлено взаимоотношение систематических
и рандомизированных ошибок, точности и сходимости измере-
ний, условно обозначенное нами как «охота за мишенью». Как мы
видим, точность измерений включает в себя в качестве обяза-
тельного критерия их сходимость. В то же время сходимые изме-
рения из-за систематической ошибки могут оказаться неточными.
Данное обстоятельство нужно обязательно учитывать при анали-
зе всех медико-биологических данных.
Величину расхождения между измерениями, выполненными
в одних и тех же условиях, обозначают как среднее квадратическое,
или стандартное, отклонение (σ). Оно определяется по формуле:
(
x
−
x
)2
σ
=
,
n
−
1
(
x
−
x
)2
где
1
- сумма квадратов разностей каждого из изме-
рения со средними величинами χ и χˉ, п — количество измерений.
Для обозначения средней величины серии измерений (одного
или нескольких объектов) пользуются показателем x ± σ . В таких
границах («значимых»), то есть от x − σ до x + σ , будут распола-
гаться 68,3% от всех проведенных измерений. Существуют более
широкие границы значений - «зона предостережения» ( x ± 2σ ),
которая включает в себя 95,5% всех измерений, и «контрольные
границы измерений» ( x ± 3σ ), в пределах которых находятся 99,7%
измерений.
Для того чтобы оценить вариабельность измерений внутри
одной серии, то есть оценить сходимость результатов, прибегают
к определению коэффициента вариации (KB) по следующей фор-
муле:
⋅100
%
=σ
,
x
где σ - стандартное отклонение, χ - значение измерения.
Чем меньше коэффициент вариации, тем выше качество
измерений. В медико-биологических исследованиях обычно до-
пустимы измерения, у которых коэффициент вариации не превы-
шает 10%.
Для того чтобы охарактеризовать точность, с которой опреде-
лена какая-либо средняя величина, используют показатель
«стандартная погрешность», или «стандартная ошибка» (т). Он
составляет
m= σ
,
n
где σ - стандартное отклонение, n - количество измерений.
Стандартная погрешность позволяет, кроме того, сопоста-
вить результаты измерений, выполненных в различных лечебных
учреждениях или произведенных различными методами исследо-
вания. Для этого нужно определить достоверность различия двух
средних арифметических
x
и
x
. Выполняют это с помощью
A
B
t
- критерия Стьюдента. Критерий Стьюдента определяется
по формуле
x
A
−
x
B
t
=
,
2
2
mA + m
B
где χ
- среднее значение измерений, m - стандартная ошибка
в сериях измерений А и B. Чем больше критерий Стьюдента, тем
достовернее различие между изучаемыми сериями измерений.
В табл. 1.1 приведены максимально допустимые значения
критерия Стьюдента для пятипроцентного риска ошибочных за-
ключений, что вполне приемлемо в практической медицине.
Таблица 1.1
Значения критерия Стьюдента
для 5% вероятности ошибки (р<0,05)
Число измерений
Значение t-критерия
2
12,71
3
4,30
4
3,18
5
2,78
6
2,57
7
2,45
8
2,37
9
2,31
10
2,26
11
2,23
12
2,20
13
2,18
14
2,16
15
2,15
…
…
30
2,04
100
1,98
1000
1,96
Значимость одного измерения, например, пульсового давле-
ния или радиоактивности пробы, определяют с помощью относи-
тельной стандартной погрешности (z) по формуле
100
⋅
N
z
=
N
где N - количество отсчетов.
Из сказанного ясно, что чем большее количество отсчетов вы-
полняется во время исследования, тем меньше стандартная отно-
сительная погрешность (говорят, что «лучше статистика» счета).
Увеличение количества отсчетов, в частности увеличение числа
зарегистрированных сигналов (квантов, частиц, эхо-сигналов и т.
п.) на единицу изображения на мониторе или в единицу време-
ни сопровождается уменьшением погрешности регистрации, что
приводит к улучшению качества получаемых данных, будь то чис-
ловая характеристика процесса или изображение органа. Поэтому
повысить качество любой диагностической системы можно двумя
путями: либо увеличить интенсивность потока энергии, которая
создает диагностические данные (например, увеличить количе-
ство вводимого в организм пациента с диагностической целью
радиоактивного вещества), либо повысить чувствительность ре-
гистрирующих систем.
Для того чтобы оценить сходимость результатов измерений
одним и тем же методом, но выполненных в двух различных ле-
чебных учреждениях, или воспроизводимость результатов из-
мерений одного и того же показателя, выполненных в одной ла-
боратории, но различными методами исследования, определяют
F-критерий:
2
σ
A
F
=
2
σ
,
B
где σ - стандартное отклонение измерений, выполненных ме-
тодами A и В.
Минимальная величина F-критерия, которая допустима в ме-
дицинской практике, показана в табл. 1.2.
Таблица 1.2
Минимально допустимая (критическая) величина критерия F
Число
Число измерений в серии А
измерений
2
3
4
5
6
в серии В
2
4052
4999
5403
5625
5674
3
98,49
99,01
99,17
99,25
99,30
4
34,12
30,82
29,46
28,71
28,24
5
21,20
18,00
16,69
15,98
15,52
6
16,26
13,27
12,06
11,39
10,97
1.3.3.Сохранение данных
Сохранение данных осуществляется на носителях. Среди но-
сителей самым распространенным пока еще является бумага. Ее
преимущества хорошо известны - простота использования, до-
ступность, низкая стоимость. Недостатком бумажных носителей
являются сложность обработки и накопления данных, выполне-
ние различных операций с данными. В отечественной медицин-
ской практике, несмотря на постоянно растущее влияние компью-
терных технологий, бумажные носители по-прежнему являются
основными. Это - истории болезни, амбулаторные карты пациен-
тов, многочисленные статистические отчеты, журналы записи на-
значений и др. Некоторые из них стандартизованы по специаль-
ным формам, утвержденным Минздравсоцразвития РФ.
На современном этапе развития медицины вся циркулирую-
щая в ней информация постепенно переходит из бумажной в циф-
ровой формат. Это закреплено приказом Минздравсоцразвития
России №1026н от 24 декабря 2009 г. «О порядке формирования,
использования, хранения, приема и передачи документов в элек-
тронной форме…». Помимо документации, современный врач име-
ет в своем распоряжении большое число электронных материалов:
рисунков, фотографий, фильмов, презентаций и т.п. Поэтому важно
ориентироваться в существующих средствах хранения информа-
ции в электронном виде. В общем виде они носят название внешних
съемных устройств памяти. По физическому типу они подразде-
ляются на магнитные и оптические. Все они подсоединяются через
универсальный разъем USB или по технологии Bluetooth к любому
компьютеру. При нижеследующем описании отдельных видов этих
устройств мы укажем объем их памяти, достигнутый к моменту на-
писания учебника - к 2012 году. Естественно, что этот показатель
в дальнейшем будет существенным образом увеличен. И еще одно
замечание: при указании объема памяти любого устройства приво-
дятся лишь физические ее свойства. Реальный же объем дисковой
памяти всегда будет несколько меньше.
Флэш-память (флэш-карта) - одно из наиболее распростра-
ненных и стремительно развивающихся устройств памяти. Физи-
чески они представляет собою это энергонезависимые микросхе-
мы емкостью до 64 Гбайт. Эти носители отличаются дешевизной,
компактностью, механической прочностью, удобством хранения
и пользования. Существует два основных типа применения флэш-
памяти в компьютерных технологиях: в качестве мобильного но-
сителя информации и как хранилище программного обеспечения
для «прошивки» цифровых устройств. Эта необходимость неред-
ко возникает в процессе их эксплуатации. Зачастую эти два при-
менения совмещаются в одном устройстве.
Другим съемным устройством памяти является внешний на-
копитель на жестком магнитном диске, или внешний винчестер
(HMDD - hard (magnetic) disk drive). Он соединяется с компью-
тером с помощью разъема USB или по технологии беспроводной
связи Wi-Fi. Привлекательным свойством внешних накопителей
на жестких дисках является большой объем их памяти. В совре-
менных моделях он может достигать 1 Тбайта. Поэтому основное
его назначение - это резервное копирование больших объемов ин-
формации, в том числе и медицинской.
Несмотря на все преимущества внешних магнитных накопи-
телей, их отличает одно общее свойство - уязвимость при вирус-
ных атаках. Поэтому особо важные информационные материалы
рекомендуется сохранять в виде дополнительных резервных копий
на оптических дисках. Необходимо отметить и другую, не менее
важное их свойство: они сами могут стать разносчиками опасных
вирусов. Поэтому существует другое правило: на компьютере, со-
держащем важные информационные материалы, не рекомендуется
использовать чужие, непроверенные внешние магнитные носители.
Другой тип внешних носителей памяти - оптические диски.
Диски CD-RОM (Compact Disc Read Only Memory - компакт-диск
только для чтения) в зависимости от диаметра (80 мм и 120 мм)
имеют емкость 128 или 700 Мбайт. Это - одно из основных
устройств для хранения и передачи информации. С его помощью
реализуют различные программные продукты: собственно ком-
пьютерные программы, различные издания, галереи изображения,
учебные архивы и пр.
Другой тип дисков позволяет осуществлять запись информа-
ции на них непосредственно с рабочего компьютера:
• CD+R (Compact Disc Recordable - записываемый компакт-
диск) - предназначен для однократной записи информации,
• CD-RW (Compact Disc ReWritable
- перезаписываемый
компакт-диск) - позволяет записывать различные инфор-
мационные материалы многократно.
Оптические диски DVD (Digital Versatile Disc - цифровой мно-
гоцелевой диск). Они обладают большей емкостью хранения ин-
формации - 4,7 Гбайт. Также как и компакт-диски, они могут быть
записываемыми (DVD-R), но емкость дисковой памяти при этом
имеет максимальную емкость 3,9 Гбайт. Аналогичные, но переза-
писываемые диски (DVD-RAM) имеют емкость 2,6 Гбайт.
Существуют диски c повышенным объемом хранения ин-
формации за счет создания двухслойности записи - двухслой-
ные диски (DVD-DL - Double Layer) и двухсторонние диски
(DVD-DS - Double Sides). И двухслойные и двухсторонне DVD-
диски имеют большую емкость памяти - до 7-8 Гбайт. Емкость
двухсторонних и одновременно двухслойных дисков доходит
до 17 Гбайт.
Диски формата Blu-ray ( англ. blue ray — синий луч; напи-
сание blu вместо blue — намеренное, чтобы зарегистрировать тор-
говую марку) пришли на смену дискам HD DVD (High Definition
DVD - диски высокого разрешения). Диски Blu-ray, работают
в сине-фиолетовой части лазерного спектра - 405 нм. Емкость
их памяти огромная. Она варьирует от 25 Гбайт (у однослойных)
до 125 Гбайт (у четырехслойных). В последние годы эта линейка
внешних устройств памяти обогатилась записывающимися дис-
ками - BD-R (для однократной записи) и BD-RE (для многократ-
ной записи). Начат выпуск дисков Blu-ray уменьшенного диаме-
тра (80 мм) с объемом памяти 14,5 Гбайт, которые предназначены
для портативных цифровых устройств.
Существуют специальные компьютерные программы ко-
деки (англ. codec, от coder/decoder
— шифратор/дешифра-
тор ), которые способны выполнять преобразование данных
или сигналов. Кодеки могут как кодировать поток/сигнал
для передачи, хранения или шифрования, так и раскодиро-
вать их. Большинство кодеков используют сжатие с потерями,
чтобы получать приемлемый размер готового (сжатого) фай-
ла. Существуют также кодеки, сжимающие без потерь. Однако
для большинства применений этих программ в медицине вы-
годнее кодеки с потерями информации, так как малозаметное
ухудшение качества оправдывается значительным уменьше-
нием объема данных.
1.3.4. Формализация и стандартизация данных
Формализация данных - это приведение их к единой унифи-
цированной форме. Формализация обеспечивает сопоставимость
результатов различных исследований, повышает степень их до-
ступности для любых заинтересованных специалистов. Наиболее
часто в медицинской практике формализации подлежат отчетные
документы, истории болезни, карты амбулаторного больного, про-
токолы исследования больных, результаты анализов.
В основе формализации данных, как правило, лежит прин-
цип их стандартизации. Это позволяет оптимизировать весь про-
цесс формализации, свести к минимуму возможные погрешности
при последующей работе с данными.
В Законе РФ «О стандартизации» приводится следующее
определение стандартизации: «Стандартизация - это деятель-
ность по выработке и утверждению норм, правил и характеристик
в целях обеспечения:
• безопасности продукции, работ и услуг для окружающей
среды, жизни, здоровья и имущества;
• технической и информационной совместимости, а также
взаимозаменяемости продукции;
• качества продукции, работ и услуг в соответствие с уровнем
развития науки, техники и технологии;
• единства измерений;
• экономии всех видов ресурсов;
• безопасности хозяйственных объектов с учетом риска воз-
никновения природных и техногенных катастроф и других
чрезвычайных ситуаций;
• обороноспособности и мобилизационной готовности страны».
Все положения, изложенные в Законе РФ о стандартиза-
ции, абсолютно обязательны при работе в сфере информаци-
онных технологий в медицине и здравоохранении. В настоящее
время общеупотребительной практикой является формализа-
ция параметрических данных о пациенте на основе междуна-
родного стандарта СИ. Для обмена цифровыми ЭКГ внутри
лечебного учреждения и за его пределами служит стандарт
SCP-ECG (Standard communications protocol for computerized
electrocardiography). Основным медицинским
коммуникационным стандартом для передачи медицинских
изображений (рентгенограмма, компьютерных
рентгеновских, ультразвуковых и магнитно-резонансных
томограмм) является международный стандарт DICOM 3.0
(Digital Imaging and Communications in Medicine, версия 3.0). В
данном стандарте работает большинство современных
аппаратов для лучевой диагностики - рентгеновской,
ультразвуковой, радионуклидной, магнитно-резонансной, а
также другие методы цифровой визуализации - эндоскопия,
микроскопия и др.
Для обмена различными медицинскими данными по ло-
кальным, корпоративным и общемировым компьютерным сетям
применяется стандарт HL7 (Health Level Seven). Им кодируются
истории болезни, амбулаторные карты, протоколы исследований
и другие медицинские документы. Существует целый ряд других
отраслевых стандартов. Большинство из них являются между-
народными и относятся к так называемым «открытым систе-
мам» - OSI (Open System Interconnection), т. е. имеют свободный
к ним доступ. Контролирует всю стандартизацию, в том числе
и медицинскую, Международный комитет по стандартизации -
International Standards (ISO). Последняя аббревиатура является
признаком того, что данный стандарт является международным
и рекомендуется к применению во всем мире. Действующие в на-
стоящее время международные стандарты OSI-ISO приведены
ниже:
• DICOM 3.0- стандарт обмена медицинскими изображениями.
• IHE - стандарт интеграции информационных систем.
• HL7 (FAQ, News) - стандарт обмена медицинскими данными.
• ASCI X12 - стандарт обмена электронными документами.
• IEEE P1157 («MEDIX») - стандарт обмена медицинскими
данными.
• CDA - стандарт архитектуры клинических документов.
• ASTM E3.11 - стандарт обмена данными лабораторных тестов.
• CCOW - стандарт клинического контекста.
Фильтрация и очищение данных
Фильтрация и очищение данных являются существенными
составляющими медицинской практики. Суть этого этапа
работы с информацией состоит в отсеивании лишних данных,
которые не нужны в решении конкретной задачи. Следует
учитывать и то обстоятельство, что медицинские данные в
отличие от других имеют характерные особенности.
Во-первых, одно и то же заболевание может иметь различные
проявления в зависимости от стадии течения болезни и
индивидуальных особенностей пациента.
Во-вторых, одинаковые симптомы могут сопутствовать
различным заболеваниям, порою значительно отличающихся по
прогнозу.
В-третьих, в медицинской практике всегда имеется
вероятность пропуска необходимых для принятия решения данных
(отсутствие аппаратуры, финансов, неотлаженный алгоритм
обследования пациентов).
В-четвертых, при регистрации биологических сигналов
от такого сложного объекта, каким является человек, неизбежно
возникает большое количество помех, которые не могут быть
полностью исключены даже при самой совершенной фильтрации
поступающих сигналов.
В-пятых, что самое существенное, окончательное решение
медицинской проблемы всегда имеет социально окрашенный
характер и, следовательно, последнее слово, вслед за компьютером
любой сложности, остается за медицинским работником.
Иногда фильтрацию и сортировку медицинских данных осу-
ществляют вручную, суммируя и последовательно анализируя
накапливаемые исследования. В некоторых типах медицинских
аппаратов предусмотрены встроенные системы группировки
параметров по заданным критериям и устройства автоматического
обнаружения ошибок в исследованиях, а также первичная
фильтрация зашумленных и деформированных сигналов.