Определение вероятностей случайных событий. Способы задания закона распределения случайной величины. Характеристики распределения случайных величин.
Предмет теории вероятности.
Математическая наука, изучающая общие закономерности случайных массовых явлений независимо от их конкретной природы и дающая методы количественной оценки влияния различных случайных факторов на рассматриваемые явления называется теорией вероятностей.
На основе наблюдений и опыта наука приходит к формулировке закономерностей, которым подчиняется течение изучаемых ею явлений. Простейшая и наиболее распространенная схема устанавливаемых закономерностей такова:
Предложение 1. При каждом осуществлении определенного комплекса условий происходит событие А.
Так, например, если вода при атмосферном давлении в 760 мм нагревается выше 100° по Цельсию (комплекс условий), то она превращается в пар (событие А). Или другой пример: при любых химических реакциях каких угодно веществ, без обмена с окружающей средой (комплекс условий) общее количество вещества (материи) остается неизменным (событие А). Последнее утверждение носит название закона сохранения материи. Читатель легко может самостоятельно указать примеры других подобных закономерностей, заимствованных из физики, химии, биологии и других наук.
Определение 1.Событие, которое неизбежно происходит при каждой реализации комплекса условий, называется достоверным.
Определение 2.Если событие A заведомо не может произойти при осуществлении комплекса условий, то оно называется невозможным.
Определение 3. Событие А, которое при реализации комплекса условий может произойти, а может и не произойти, называется случайным.
Из этих определений ясно, что, говоря о достоверности, невозможности, случайности какого-либо события, мы всегда будем иметь в виду его достоверность, невозможность или случайность по отношению к какому-либо определенному комплексу условий.
Простое утверждение о случайности события имеет очень ограниченный познавательный интерес: оно сводится лишь к указанию на то, что комплекс условий не отражает всей совокупности причин, необходимых и достаточных для появления события А. Такое указание нельзя считать совершенно бессодержательным, так как оно может послужить стимулом к дальнейшему изучению условий появления события А, но само по себе оно еще не дает нам положительного знания.
Имеется, однако, широкий круг явлений, когда при многократном осуществлении комплекса условий доля той части случаев, когда событие А происходит, лишь изредка уклоняется сколько-нибудь значительно от некоторой средней цифры, которая, таким образом, может служить характерным показателем массовой операции, (многократного повторения комплекса) по отношению к событию A.
Для указанных явлений возможно не только простое констатирование случайности события А, но и количественная оценка возможности его появления. Эта оценка выражается предложением вида:
Предложение 2. Вероятность того, что при осуществлении комплекса условий произойдет событие А, равна р.
Закономерности этого второго рода называются вероятностными или стохастическими закономерностями. Вероятностные закономерности играют большую роль в самых различных областях науки.
Несомненно, что понятие математической вероятности заслуживает углубленного философского изучения. И основная специфическая философская проблема, выдвигаемая самим существованием теории вероятностей и успешным ее применением к реальным явлениям, состоит в следующем: при каких условиях имеет объективный смысл количественная оценка вероятности случайного события А при помощи определенного числа Р(A), называемого математической вероятностью события А, и каков объективный смысл этой оценки. Ясное понимание взаимоотношения между философскими категориями случайного и необходимого является неизбежным предварительным условием успешного анализа понятия математической вероятности, но этот анализ не может быть полным без ответа на поставленный нами вопрос о том, при каких условиях случайность допускает количественную оценку в виде числа вероятности.
Число различных определений математической вероятности, предложенное теми или иными авторами, очень велико. Мы не станем сейчас разбираться во всех логических тонкостях этих многочисленных определений. Всякое научное определение такого рода основных понятий, как понятие вероятности, является лишь утонченной логической обработкой некоторого запаса очень простых наблюдений и оправдавших себя долгим успешным применением практических приемов. Интерес к логически безупречному «обоснованию» теории вероятностей возник исторически позднее, чем умение определять вероятности различных событий, производить вычисления с этими вероятностями, а также использовать результаты произведенных вычислений в практической деятельности и в научных исследованиях. Поэтому в основе большинства попыток научного определения общего понятия вероятности легко рассмотреть те или иные стороны конкретного познавательного процесса, приводящего в каждом отдельном случае к фактическому определению вероятности того или иного события, будь то вероятность выпадения хотя бы одной шестерки при четырех бросаниях игральной кости, или вероятность радиоактивного распада, или вероятность попадания в цель.
С очерченной сейчас точки зрения большинство определений математической вероятности может быть разделено на три группы:
1. Определения математической вероятности как количественной меры «степени уверенности» познающего субъекта – субъективная вероятность.
2. Определения, сводящие понятие вероятности к понятию «равновозможности» как к более примитивному понятию (так называемое «классическое» определение вероятности).
3. Определения, отправляющиеся от «частоты» появления события в большом количестве испытаний («статистическое» определение).
Указанные группы по отдельности обладают существенными недостатками и полное понимание природы вероятности требует их разумного синтеза.
Алгебра событий. Пространство элементарных событий.
Прежде чем перейти к классическому определению понятия вероятности, мы сделаем несколько предварительных замечаний. Будем считать фиксированным комплекс условий и станем рассматривать некоторую систему F событий А,В,С,… каждое из которых может произойти или не произойти при каждом осуществлении комплекса условий. Между событиями системы F могут существовать известные соотношения, с которыми мы постоянно будем иметь дело и которые поэтому прежде всего изучим.
1) Если при каждом осуществлении комплекса условий, при котором происходит событие А, происходит и событие В, то будем говорить, что А влечет за собой В, и обозначать это обстоятельство символом .
2) Если А влечет за собой В и в то же время В влечет за собой А, т. е. если при каждой реализации комплекса условий события А и В оба наступают или оба не наступают, то будем говорить, что события А и В равносильны, и будем обозначать это обстоятельство символом А=В.
Заметим, что во всех исследованиях теории вероятностей равносильные между собой события могут заменять друг друга. Поэтому условимся в дальнейшем любые два равносильных события считать просто тождественными друг другу.
3) Событие, состоящее в наступлении обоих событий А и В, называется произведением событий A и В и обозначается символом АВ (или А∩В).
4) Событие, состоящее в наступлении хотя бы одного из событий А и В, будем называть суммой событий А и В и обозначать символом A+B (или AВ).
5) Событие, состоящее в том, что событие А происходит, а событие В не происходит, называется разностью событий А и В и обозначается символом А—В.
6) Два события А и называются противоположными, если для них одновременно выполняются два соотношения:
|
|
Например, если при бросании одной игральной кости С обозначает выпадение четного числа очков, то
|
|
есть событие, состоящее в выпадении нечетного числа очков.
Проиллюстрируем введенные понятия на простейших примерах. Первый из них представляет собой так называемую диаграмму Вьенна.
Пусть комплекс условий состоит в том, что внутри квадрата, изображенного на рис. 1 выбирается наудачу точка. Обозначим через А событие «выбранная точка лежит внутри левой окружности» и через В событие «выбранная точка лежит внутри правой окружности». Тогда события А,,В,,, состоят в попадании выбранной точки внутрь областей, заштрихованных на соответствующих фигурах рис. 1.
Рассмотрим другой пример. Допустим, что комплекс условий состоит в том, что на стол бросается (один раз) игральная кость.
Рис. 1.
Обозначим через А выпадение на верхней грани кости шести очков, через В—выпадение трех очков, через С—выпадение какого-либо четного числа очков, через D—выпадение какого-либо числа очков, кратного трем. Тогда события А,В,С и D связаны следующими соотношениями:
|
|
Определение суммы и произведения двух событий обобщается на любое число событий и обозначает событие, заключающееся в наступлении хотя бы одного из событий и обозначает событие, заключающееся в наступлении всех событий А,В,..,D.
Очевидно, что все достоверные события равносильны между собой. Поэтому законно обозначать все достоверные события одной буквой. Мы будем употреблять для этого букву U. Все невозможные события тоже равносильны между собой. Мы будем обозначать любое невозможное событие буквой V.
7) Два события А и В называются несовместимыми, если их совместное появление невозможно, т. е. если
|
|
Если и события попарно несовместимы, т. е. , то говорят, что событие А подразделяется на частные случаи . Например, при бросании игральной кости событие С, состоящее в выпадении четного числа очков, подразделяется на частные случаи , состоящие соответственно в выпадении 2, 4 и 6 очков.
События образуют полную группу событий, если хотя бы одно из них непременно должно произойти (при каждом осуществлении комплекса), т. е. .
Особенно существенны для нас в дальнейшем будут полные группы попарно несовместимых событий. Такова, например, при однократном бросании игральной кости система событий состоящая соответственно в появлении 1, 2, 3, 4, 5 и 6 очков.
8) В каждой задаче теории вероятностей приходится иметь дело с каким-либо определенным комплексом условий и с какой-либо определенной системой F событий. Относительно этой системы целесообразно сделать следующие допущения:
а) если системе F принадлежат события А и В, то ей принадлежат также события и т.д.
б) система F содержит достоверное и невозможное события.
Система событий, удовлетворяющая этим допущениям, называется полем событий.
В рассмотренных нами иллюстративных примерах всегда было можно выделить такие события, которые не могли быть разложены на более простые: выпадение определенной грани при бросании игральной точки; попадание в определенную точку квадрата при рассмотрении диаграммы Вьенна. Условимся называть такие неразложимые события элементарными событиями.
При построении математической теории вероятностей наши интуитивные представления требуют большей формализации, чем та с которой мы имели дело до сих пор. В современном изложении теории вероятностей исходят из множества элементарных событий или, как теперь принято говорить, пространства элементарных событий. Природа элементов этого пространства заранее не оговаривается, поскольку важно иметь достаточно широкий выбор для охвата всех возможных случаев. В частности, элементами пространства могут быть точки евклидова пространства, функции одного или нескольких переменных и т. д. Множества точек пространства элементарных событий образуют случайные события. Событие, состоящее из всех точек пространства элементарных событий, называется достоверным событием. Все, что мы говорили о соотношениях между случайными событиями в настоящем параграфе, сохраняет силу и для формального построения теории. Сейчас мы ограничимся указанием на то что для случайных событий имеют место следующие законы:
коммутативный
ассоциативный
дистрибутивный
тождества
Доказательство этих законов мы предоставим читателю. Для лиц, знакомых с элементами теории множеств, его проведение не составит труда.
Классическое определение вероятности.
Классическое определение вероятности сводит понятие вероятности к понятию равновероятности (равновозможности) событий, которое считается основным и не подлежит формальному определению. Для примера: при бросании кубика, который имеет точную форму куба и изготовлен из вполне однородного материала, равновероятными событиями будут выпадения какого-нибудь определенного числа очков (1,2,3,4,5,6), обозначенного на гранях этого куба, поскольку в силу наличия симметрии ни одна из граней не имеет объективного преимущества перед другими.
В общем случае рассмотрим какую-либо группу G, состоящую из n попарно несовместимых равновозможных событий (назовем их элементарными событиями): .
Образуем теперь систему F, состоящую из невозможного события V, всех событий Ek группы G и всех событий А,B,С… которые могут быть подразделены на частные случаи, входящие в состав группы G.
Например, если группа G состоит из трех событий , то в систему F входят события V, E1,E2,E3,E1+E2, E2+E3, E1+E3,U=E1+E2+E3. и т.д.
Легко установить, что система F есть поле событий, в самом деле, очевидно, что сумма, разность и произведение событий из F входят в F; невозможное событие V входит в F по определению, а достоверное событие U входит в F, так как оно представляется в виде
|
|
Классическое определение вероятности дается для событий системы F и может быть сформулировано так:
фНапример, при однократном бросании игральной кости полная группа попарно несовместимых и равновероятных событий состоит из событий , которые состоят соответственно в выпадении 1,2,3,4,5,6 очков. Событие , состоящее в выпадении четного числа очков, подразделяется на три частных случая, входящих в состав полной группы несовместимых и равновероятных событий. Поэтому вероятность события С равна .
Очевидно также, что в силу принятого определения
и т. д.
В теории вероятностей широко используется следующая терминология, к которой мы часто впоследствии будем обращаться. Представим себе, что для выяснения вопроса, произойдет или не произойдет событие А (например, выпадение числа очков, кратного трем), необходимо произвести некоторое испытание (т. е. осуществить комплекс условий), которое дало бы ответ на поставленный вопрос (в нашем примере требуется бросить игральную кость). Полная группа попарно несовместимых и равновероятных событий, которые могут произойти при таком испытании, называется полной группой возможных результатов испытания. Те из возможных результатов испытания, на которые подразделяется событие А, называются результатами испытания благоприятствующими А. Пользуясь этой терминологией, можно сказать, что вероятность Р(A) события А равняется отношению числа возможных результатов испытания, благоприятствующих событию А, к числу всех возможных результатов испытания.
В соответствии с приведенным определением каждому событию A, принадлежащему построенному сейчас полю событий F, приписывается вполне определенная вероятность
|
|
где m есть число тех событий Ei исходной группы G, которые являются частными случаями события A. Таким образом, вероятность Р(A) можно рассматривать как функцию от события А, определенную на поле событий F.
Вероятность P(A) обладает следующими свойствами:
1. Для каждого события А поля F
|
(2) |
2. Для достоверного события U
|
(3) |
3. Если событие А подразделяется на частные случаи В и С и все три, события. А, В и С принадлежат полю F, то
|
(4) |
Это свойство называется теоремой сложения вероятностей. Свойство 1 очевидно, так как дробь — не может быть отрицательной. Свойство 2 не менее очевидно, так как достоверному событию U благоприятствуют все п возможных результатов испытания, и поэтому .
Докажем свойство 3. Пусть событию В благоприятствуют m‘, а событию С соответственно m“ событий Еi группы G. Так как события В и С по допущению несовместимы, то события Еi, благоприятствующие одному из них, отличны от событий Еi, благоприятствующих другому. Всего, таким образом, имеется m‘+m“ событий Еi, благоприятствующих появлению одного из событий В или С, т. е. благоприятствующих событию В+С=А. Следовательно,
|
|
что и требовалось доказать.
Ограничимся здесь указанием еще нескольких свойств вероятности.
4. Вероятность события, противоположного событию A, равна
|
|
Действительно, так как А + = U, то согласно уже доказанному свойству 2
|
|
а так как события А и несовместимы, то по свойству 3
|
|
Два последних равенства доказывают наше предложение.
5. Вероятность невозможного события равна нулю.
В самом деле, события U и V несовместимы, поэтому
|
|
откуда следует, что.
6. Если событие А влечет за собой событие В, то
|
|
Действительно, событие В может быть представлено как сумма двух событий A и . Отсюда в силу свойств 3 и 1 получаем:
|
|
7. Вероятность любого события заключена между нулем и единицей.
Из того, что для любого события A имеют место соотношения
|
|
следует в силу предыдущего свойства, что имеют место неравенства
|
|
что и требовалось доказать.
Рассмотрим несколько примеров вычисления вероятностей событий, пользуясь классическим определением вероятности. Приводимые примеры носят исключительно иллюстративный характер и не претендуют на то, чтобы сообщить читателю все основные методы расчета вероятностей.
Пример 1. Из колоды карт (36 карт) наудачу вынимаются три карты. Найти вероятность того, что среди них окажется точно один туз.
Решение. Полная группа равновероятных и несовместимых событий в нашей задаче состоит из всевозможных комбинаций по три карты, их число равно . Число благоприятствующих событий можно подсчитать следующим способом. Один туз мы можем выбрать различными способами, а две другие карты (не тузы) можно выбрать различными способами. Так как для каждого определенного туза две остальные карты могут быть выбраны способами, то всего благоприятствующих случаев будет . Искомая вероятность, таким образом, равна
|
|
т. е. немного больше 0,25.
Пример 2. Из колоды карт (36 карт) наудачу вынимаются три карты. Найти вероятность того, что среди них окажется хотя бы один туз.
Решение. Обозначим интересующее нас событие буквой А:
оно может быть представлено в виде суммы трех следующих несовместимых событий: А1 — появление одного туза, А2 — появление двух тузов, A3—появление трех тузов.
Рассуждениями, аналогичными тем, которые мы привели при решении предыдущей задачи, легко установить, что число случаев, благоприятствующих
событию равно ,
событию равно ,
событию равно .
Так как число всевозможных случаев равно , то
|
|
|
|
|
|
В силу теоремы сложения
|
|
Этот пример можно решить и иным методом. Событие , противоположное А, состоит в том, что среди вынутых карт не окажется ни одного туза. Очевидно, что три не туза можно вынуть из колоды карт различными способами и, следовательно,
|
|
Искомая вероятность равна
|
|
Примечание. В обоих примерах выражение «наудачу» означало, что всевозможные комбинации по три карты равновероятны.
Геометрические вероятности.
Еще в самом начале развития теории вероятностей была замечена недостаточность «классического» определения вероятности, основанного на рассмотрении конечной группы равновероятных событий. Уже тогда частные примеры привели к некоторому видоизменению этого определения и построению понятия вероятности также для случаев, когда мыслимо бесконечное множество исходов. При этом по-прежнему основную роль играло понятие «равновероятности» некоторых событий.
Общая задача, которая ставилась и привела к расширению понятия вероятности, может быть сформулирована следующим способом.
Пусть, например, на плоскости имеется некоторая область G и в ней содержится другая область g с квадрируемой границей. В область G наудачу бросается точка и спрашивается, чему равна вероятность того, что точка попадет в область g. При этом выражению «точка бросается наудачу в область G» придается следующий смысл: брошенная точка может попасть в любую точку области G, вероятность попасть в какую-либо часть области G пропорциональна мере этой части (длине, площади и т. д.) и не зависит от ее расположения и формы.
Таким образом, по определению, вероятность попадания в область g при бросании наудачу точки в область G равна
|
|
Рассмотрим несколько примеров.
Пример 1. Задача о встрече. Два лица А и В условились Встретиться в определенном месте между 12 часами и часом. Пришедший первым ждет другого в течение 20 минут, после чего уходит. Чему равна вероятность встречи лиц А и В, если приход каждого из них в течение указанного часа может произойти наудачу и моменты прихода независимы.
Решение. Обозначим моменты прихода лица А через х и лица В через у. Для того чтобы встреча произошла, необходимо и достаточно, чтобы .
Будем изображать хOу как декартовы координаты на плоскости; в качестве единицы масштаба выберем минуту. Всевозможные исходы изобразятся точками квадрата со сторонами 60; благоприятствующие
встрече — расположатся в заштрихованной области (рис. 1.4.1).
Искомая вероятность равна отношению площади заштрихованной фигуры к площади всего квадрата: .
Пример 3. Задача Бюффона. Плоскость разграфлена параллельными прямыми, отстоящими друг от друга на расстоянии 2а. На плоскость наудачу бросается игла длины 2l(l≤a). Найти вероятность того, что игла пересечет какую-нибудь прямую.
Решение. Обозначим через х расстояние от центра до ближайшей параллели и через —угол, составленный иглой с этой параллелью. Величины х и полностью определяют положение иглы. Всевозможные положения иглы определяются точками прямоугольника со сторонами a и . Из рис. 1.4.2. видно, что для пересечения иглы с параллелью необходимо и достаточно, чтобы .
Искомая вероятность в силу сделанных предположений равна отношению площади заштрихованной на рис. 1.4.3. области к площади прямоугольника
|
|
Заметим, что задача Бюффона являлась исходным пунктом для решения некоторых проблем теории стрельбы, учитывающих размеры снаряда.
Полученная формула была использована для опытного определения приближенного значения числа . Таких опытов с бросанием иглы было проведено довольно много. Мы приведем результаты лишь некоторых из них(см. Табл. 1.4.1).
Экспериментатор |
Год |
Число бросков иглы |
Экспериментальное значение |
Вольф |
1850 |
5000 |
3,1596 |
Смит |
1855 |
3204 |
3,1553 |
Фокс |
1894 |
1120 |
3,1419 |
Так как из полученной нами формулы следует равенство , то при большом числе бросаний п приближенно , где т — число происшедших при этом пересечений.
Частота и вероятность.
Классическое определение вероятности при переходе от простейших примеров к рассмотрению сложных задач, в особенности же задач естественнонаучного или технического характера, наталкивается на непреодолимые трудности принципиального порядка. Прежде всего в большинстве случаев возникает вопрос о возможности нахождения разумного способа выделения «равновозможных случаев».
Так, например, из соображений симметрии, на которых основаны наши суждения о равновероятности событий, вывести вероятность распада атома радиоактивного вещества за определенный промежуток времени или же определить вероятность того, что ребенок, который должен родиться, окажется мальчиком, представляется в настоящее время по меньшей мере затруднительным.
Длительные наблюдения над появлением или не появлением события А при большом числе повторных испытаний, происходящих при неизменном комплексе условий, показывают, что для широкого круга явлений число появлений или не появлений события А подчиняется устойчивым закономерностям.
Если мы через (обозначим число появлений события А при п независимых испытаниях, то оказывается, что отношение при достаточно больших п для большинства таких серий наблюдений сохраняет почти постоянную величину, причем большие отклонения наблюдаются тем реже, чем многочисленнее произведенные испытания.
Отношение называют частотой события или статистической вероятностью и обозначают символом P*, таким образом
|
|
Оказывается, что для тех случаев, к которым применимо классическое определение вероятности, это колебание частоты происходит около вероятности события р.
Имеется огромный опытный материал по проверке этого факта. Так, производились бросания монеты, игральных костей, иглы для эмпирического определения числа . Мы приведем здесь некоторые из полученных результатов, ограничившись рассмотрением экспериментов с бросанием монеты(см. Табл. 2).
Табл. 2
Экспериментатор |
Число бросков |
Число выпадений герба |
Частота |
Бюффон |
4040 |
2048 |
0,5080 |
К Пирсон |
12000 |
6019 |
0,5016 |
К. Пирсон |
24000 |
12012 |
0,5005 |
То же обстоятельство, что для событий, к которым применимо классическое определение вероятности, частота события при большом числе испытаний, как правило, близка к вероятности, заставляет нас считать и в общем случае, что существует некоторая постоянная, около которой колеблется частота. Эту постоянную, являющуюся объективной числовой характеристикой явления, естественно назвать вероятностью изучаемого случайного события А.
Таким образом, мы будем говорить, что событие А имеет вероятность, если это событие обладает следующими особенностями:
а) можно, по крайней мере принципиально, провести в неизменных условиях неограниченное число независимых друг от друга испытаний, в каждом из которых может появиться или не появиться событие А;
б) в результате достаточно многочисленных испытаний замечено, что частота события А почти для каждой большой группы испытаний лишь незначительно отклоняется от некоторой (вообще говоря, неизвестной) постоянной.
За численное значение этой постоянной может быть приближенно при большом числе испытаний принята или частота события А или же число, близкое к частоте. Таким образом определенная вероятность случайного события носит наименование статистической вероятности.
Аксиоматическое построение теории вероятностей.
Развитие естествознания в начале текущего столетия предъявило к теории вероятностей повышенные требования. Возникла необходимость в систематическом изучении основных понятий теории вероятностей и выяснении тех условий, при которых возможно использование ее результатов. Вот почему особенно важное значение приобрело формально-логическое обоснование теории вероятностей, ее аксиоматическое построение. При этом в основу теории вероятностей как математической науки должны быть положены некоторые предпосылки, являющиеся обобщением многовекового человеческого опыта. Теория вероятностей должна строиться из аксиом так же, как любая сформировавшаяся математическая наука—алгебра, геометрия, абстрактная теория групп и т.д.
В современной математике принято аксиомами называть те предложения, которые принимаются за истинные и в пределах данной теории не доказываются. Все остальные положения этой теории должны выводиться чисто логическим путем из принятых аксиом. Формулировка аксиом, т. е. тех фундаментальных положений, на базе которых строится обширная теория, представляет собой не начальную стадию развития математической науки, а является результатом длительного накопления фактов и логического анализа полученных результатов с целью выявления действительно основных первичных фактов. Впервые задача аксиоматического построения теории вероятностей как логически совершенной науки была поставлена и решена в 1917 г. известным математиком С. Н. Бернштейном. При этом С. Н. Бернштейн исходил из качественного сравнения случайных событий по их большей или меньшей вероятности.
Имеется иной подход, предложенный А. Н. Колмогоровым, который тесно связывает теорию вероятностей с современной метрической теорией функций, теорией множеств.
Аксиоматическое построение основ теории вероятностей отправляется от основных свойств вероятности, подмеченных на примерах классического и статистического определений.
В аксиоматике теории вероятностей Колмогорова понятие случайного события не является первичным, а строится из более элементарных понятий. С таким подходом мы уже встречались при рассмотрении некоторых примеров. Так, в задачах на геометрическое определение вероятности рассматривается область G пространства (прямой, плоскости и т.д.), в которую «наудачу» бросается точка. Случайными событиями при этом являются попадания в те или иные подобласти области G. Каждое случайное событие является при этом некоторым подмножеством множества точек G. Эта мысль положена в основу общей концепции случайного события в аксиоматике А. Н. Колмогорова.
Колмогоров исходит из множества (пространства) U элементарных событий. Что представляют собой элементы этого множества для логического развития теории вероятностей — безразлично.
Далее рассматривается некоторая система F подмножеств множества U’, элементы системы F называются случайными событиями.
Относительно структуры системы F предполагаются выполненными три следующих требования:
1) F в качестве элемента содержит множество U.
2) Если А и В—подмножества множества U—входят в F в качестве элементов, то в качестве элементов F содержит также множества А+В, АВ, А–В и т.д.
Второе требование влечет за собой принадлежность к множеству F сумм, произведений и дополнений конечного числа событий, принадлежащих F. Таким образом, элементарные операции над случайными событиями не могут вывести нас за пределы множества случайных событий. Назовем систему событий F полем событий.
Во многих важнейших задачах нам понадобится от поля событий требовать большего, а именно
3) Если подмножества множества U являются элементами множества F, то их сумма и произведение также являются элементами F.
Множество F, образованное описанным способом, носит название борелевского поля событий.
Только что изложенный способ определения случайного события вполне согласуется с тем представлением, которое мы получили при рассмотрении конкретных примеров. Для большей ясности рассмотрим пример.
Пример 1. Бросается игральная кость. Множество U элементарных событий состоит из шести элементов: . Здесь означает выпадение i очков. Множество F случайных событий состоит из следующих 26 = 64 элементов:
Здесь каждая скобка показывает, из каких элементов множества U составлено подмножество, входящее в качестве элемента в состав F символом (V) мы обозначили пустое множество.
Определение 1. Если два случайных события А и В не имеют в своем составе одних и тех же элементов множества U, то мы будем называть их несовместимыми.
Событие U будем называть достоверным событием, а событие V (пустое множество) — невозможным событием. События и называются противоположными.
Теперь мы можем перейти к формулировке аксиом, определяющих вероятность.
Аксиома 1. Каждому случайному событию из поля событий F поставлено в соответствие неотрицательное число Р(A), называемое его вероятностью.
Аксиома 2. Р (U)=1.
Аксиома 3(аксиома сложения). Если события попарно несовместимы, то
|
|
Для классического определения вероятности свойства, выраженные аксиомами 2 и 3, не нужно было постулировать, так как эти свойства вероятности были нами доказаны. Утверждение же аксиомы 1 содержится в самом классическом определении вероятности.
Из сформулированных аксиом мы выведем несколько важных элементарных следствий.
1. Вероятность невозможного события равна нулю.
Из равенства и аксиомы 3 мы заключаем, что .
2. Для любого события A: .
Так как , тогда откуда .
3. Каково бы ни было случайное событие A, .
4. Если событие A влечет за собой событие В, то .
5. Пусть A и В — два произвольных события. Поскольку в суммах и слагаемые являются несовместимыми событиями, то в соответствии с аксиомой 3
Отсюда вытекает теорема сложения для произвольных событий A и B . В силу не отрицательности отсюда заключаем, что .
По индукции теперь выводим, что если – произвольные события, то имеет место неравенство
|
|
Система аксиом Колмогорова непротиворечива, так как существуют реальные объекты, которые всем этим аксиомам удовлетворяют. Например, если за U принять произвольное множество с конечным числом элементов , за F —совокупность всех подмножеств , , то, положив
|
|
где — произвольные неотрицательные числа, удовлетворяющие равенству .
Система аксиом Колмогорова неполна: даже для одного и того же множества U вероятности в множестве F мы можем выбирать различными способами.
Так, в рассмотренном нами примере с игральной костью мы можем положить или
|
|
или
|
|
Неполнота системы аксиом теории вероятностей не является свидетельством их неудачного выбора или недостаточной работы мысли при их создании.
Дальнейшее развитие теории нуждается в дополнительном предположении, которое носит название расширенной аксиомы сложения. Необходимость введения новой аксиомы объясняется тем, что в теории вероятностей постоянно приходится рассматривать события, подразделяющиеся на бесконечное число частных случаев.
Расширенная аксиома сложения. Если событие А равносильно наступлению хотя бы одного из попарно несовместимых событий , то
|
|
Заметим, что расширенная аксиома сложения может быть заменена равносильной ей аксиомой непрерывности.
Аксиома непрерывности. Если последовательность событий такова, что каждое последующее влечет за собой предыдущее и произведение всех событий есть невозможное событие, то
|
|
Докажем эквивалентность только что сформулированных предложений.
1. Из расширенной аксиомы сложения следует аксиома непрерывности. Действительно, пусть события таковы, что и при любом
|
|
Очевидно, что
|
|
Так как события, стоящие в этой сумме, попарно несовместимы, то согласно расширенной аксиоме сложения
|
|
Но в силу условия
|
|
поэтому
|
|
т. е. есть остаток сходящегося ряда
|
|
Поэтому .
2. Из аксиомы непрерывности следует расширенная аксиома сложения. Пусть события … попарно несовместимы и
Положим
|
|
Ясно, что . Если событие наступило, то наступило какое-нибудь из событий и, значит, в силу по парной несовместимости событий события уже не наступили. Таким образом, события невозможны и, следовательно, невозможно событие . По аксиоме непрерывности .
Так как , то по обычной аксиоме сложения
|
|
В заключение мы можем сказать, что с точки зрения теории множеств данное нами аксиоматическое определение вероятности есть не что иное, как введение в множестве U нормированной, счетно-аддитивной, неотрицательной меры P, определенной для всех элементов множества F.
При определении понятия вероятности мы должны указывать не только исходное множество элементарных событий U (в современных работах его часто обозначают также буквой Q), но также множество случайных событий F и определенную на нем функцию Р. Совокупность [U,F,Р] называется вероятностным пространством.
Условная вероятность и простейшие основные формулы.
Мы уже говорили, что в основе определения вероятности события лежит некоторая совокупность условий. Если никаких ограничений, кроме условий, при вычислении вероятности не налагается, то такие вероятности называются безусловными.
Однако в ряде случаев приходится находить вероятности событий при дополнительном условии, что произошло некоторое событие В, имеющее не нулевую вероятность, т.е . Данные вероятности мы будем называть условными и обозначать символом ; это означает вероятность события А при условии, что событие В произошло.
Пример 1. Брошены две игральные кости. Чему равна вероятность того, что сумма выпавших на них очков равна 8 (событие A), если известно, что эта сумма есть четное число (событие В)?
Все возможные случаи, которые могут представиться при бросании двух костей, мы запишем в таблице 1.7.1, каждая клетка которой содержит запись возможного события: на первом месте в скобках указывается число очков, выпавших на первой кости, на втором месте — число очков, выпавших на второй кости.
Табл. 3
(1,1) |
(2,1) |
(3,1) |
(4,1) |
(5,1) |
(6,1) |
(1,2) |
(2,2) |
(3,2) |
(4,2) |
(5,2) |
(6.2) |
(1,3) |
(2,3) |
(3,3) |
(43) |
(5,3) |
(63) |
(1,4) |
(2,4) |
(3,4) |
(4,4) |
(5,4) |
(6,4) |
(1,5) |
(2,5) |
(3,5) |
(4,5) |
(5,5) |
(6,5) |
(1,6) |
(2,6) |
(3,6) |
(4,6) |
(5,6) |
(6,6) |
Общее число возможных случаев — 36, благоприятствующих событию A — 5. Таким образом, безусловная вероятность .
Если событие В произошло, то осуществилась одна из 18 (а не 36) возможностей и, следовательно, условная вероятность равна .
Пример 2. Из колоды карт последовательно вынуты две карты. Найти: а) безусловную вероятность того, что вторая карта окажется тузом (неизвестно, какая карта была вынута вначале), и б) условную вероятность, что вторая карта будет тузом, если первоначально был вынут туз.
Обозначим через A событие, состоящее в появлении туза на втором месте, а через В—событие, состоящее в появлении туза на первом месте. Ясно, что имеет место равенство .
В силу несовместимости событий АВ и АВ имеем: .
При вынимании двух карт из колоды в 36 карт могут произойти 36•35 (учитывая порядок!) случаев. Из них благоприятствующих событию АВ — 4•3 случаев, а событию — 32 • 4 случаев. Таким образом,
Если первая карта есть туз, то в колоде осталось 35 карт и среди них только три туза. Следовательно, .
Общее решение задачи нахождения условной вероятности для классического определения вероятности не представляет труда. В самом деле, пусть из n единственно возможных, несовместимых и равновероятных событий событию А благоприятствует m событий. Если событие В произошло, то это означает, что наступило одно из событий , благоприятствующих В. При этом условии событию А благоприятствуют r и только r событий Aj , благоприятствующих АВ. Таким образом,
|
|
Точно так же можно вывести, что
|
|
Понятно, что
|
|
т. е. вероятность произведения двух событий равна произведению вероятности одного из этих событий на условную вероятность другого при условии, что первое произошло.
Теорема умножения применима и в том случае, когда одно из событий А или В есть невозможное событие, так как в этом случае вместе с имеют место равенства и .
Условная вероятность обладает всеми свойствами вероятности. В этом легко убедиться, проверив, что она удовлетворяет всем свойствам, сформулированных в предыдущих параграфах. Действительно, первое свойство выполняется очевидным образом, поскольку для каждого события А определена неотрицательная функция . Если , то .
Проверка третьего свойства также не составляет труда и мы предоставляем читателю ее осуществление.
Заметим, что вероятностное пространство для условных вероятностей задается следующей тройкой .
Определение 1. Говорят, что событие А независимо от события В, если имеет место равенство т. е. если наступление события В не изменяет вероятности появления события А.
Если событие А независимо от В, то имеет место равенство . Отсюда находим: т. е. событие В также независимо от А. Таким образом, свойство независимости событий взаимно.
Если события А и В независимы, то независимы также события А и . Действительно, так как и по предположению , то .
Отсюда мы делаем важное заключение: если события А и В независимы, то независимы также каждые два события.
Понятие независимости событий играет значительную роль в теории вероятностей и в ее приложениях. В частности, большая часть результатов, изложенных в настоящем пособии, получена в предположении независимости тех или иных рассматриваемых событий.
Так, например, ясно, что выпадение герба на одной монете не изменяет вероятности появления герба (решки) на другой монете, если только эти монеты во время бросания не связаны между собой (например, жестко не скреплены). Точно так же рождение мальчика у одной матери не изменяет вероятности появления мальчика (девочки) у другой матери. Это — события независимые.
Для независимых событий теорема умножения принимает особенно простой вид, а именно, если события A и В независимы, то .
Мы обобщим теперь понятие независимости двух событий на совокупность нескольких событий.
Определение 2. События называются независимыми в совокупности, если для любого события из их числа и произвольных из их же числа события и взаимно независимы. В силу предыдущего это определение эквивалентно: при любых и .
Заметим, что для независимости в совокупности нескольких событий недостаточно их по парной независимости. В этом можно убедиться на следующем простом примере.
Пример С.Н. Бернштейна. Представим себе, что грани тетраэдра окрашены: 1-я — в красный цвет (A), 2-я — в зеленый (В), третья — в синий (С) и 4-я — во все эти три цвета (AВС). Легко видеть, что вероятность выпадения грани, на которую упадет тетраэдр при бросании, и своей окраске иметь красный цвет равна 1/2: граней четыре и две из них имеют в окраске красный цвет.
Таким образом, . Точно так же можно подсчитать, что события A,В,С, таким образом, попарно независимы.
Однако, если нам известно, что осуществились события В и С, то заведомо осуществилось и событие A, т. е. .
Таким образом, события A,В,С в совокупности зависимы. Таким образом, в общем случае при по определению .
(В случае условная вероятность остается неопределенной.) Это позволяет нам перенести автоматически на общее понятие вероятности все определения и результаты настоящего параграфа.
Формула полной вероятности.
Предположим теперь, что событие В может осуществиться с одним и только с одним из несовместимых событий . Иными словами, положим , где события BAi и BAj с разными индексами i и j несовместимы. По теореме сложения вероятностей имеем: .
Применяя теорему умножения, находим:
|
|
Это равенство носит название формулы полной вероятности и играет важную роль во всей дальнейшей теории.
В качестве иллюстрации рассмотрим два примера.
Пример 1. Имеется пять урн:
2 урны состава A1 — по два белых шара и одному черному,
1 урна состава A2—по 10 черных шаров,
2 урны состава A3 — по три белых шара и одному черному.
Наудачу выбирается урна и из нее наудачу вынимается шар. Чему равна вероятность, что вынутый шар белый (событие В)?
Так как вынутый шар может быть только из урны 1-го, 2-го или 3-го состава, то .
По формуле полной вероятности
|
|
Но
|
|
Таким образом, .
Пример 2. Известно, что вероятность поступления k вызовов на телефонную станцию за промежуток времени t равна .
Считая, что появление какого-либо числа вызовов за два соседних промежутка времени являются событиями независимыми, найти вероятность поступления s вызовов за промежуток времени длительности 2t.
Решение. Обозначим через событие, состоящее в поступлении k вызовов за время . Очевидно, что мы имеем следующее равенство: , которое означает, что событие можно рассматривать как сумму s+1 несовместимых событий, состоящих в том, что за первый промежуток времени длительности t поступает i вызовов, а за следующий промежуток той же продолжительности — поступает s — i вызовов .
По теореме сложения вероятностей
|
|
По теореме умножения вероятностей для независимых событий
|
|
Таким образом, если положить , то .
Впоследствии мы увидим, что при некоторых весьма общих условиях . , где а — некоторая константа.
находим:
|
|
Но
|
|
Поэтому
|
|
Для промежутков времени, в два раза больших, и, как легко убедиться, для любых кратных t промежутков времени характер формулы для вероятности сохраняется.
Формула Бейеса.
Получим важные формулы Бейеса или, как иногда говорят, формулы вероятности гипотез. Требуется найти вероятность события Ai, если известно, что В произошло. Согласно теореме умножения имеем:
|
|
Из соотношения (1.9.1) получаем
|
|
используя формулу полной вероятности (1.8.1), находим:
|
|
Полученные формулы (1.9.3) носят название формул Бейеса. Общая схема применения этих формул к решению практических задач такова. Пусть событие В может протекать в различных условиях, относительно характера которых может быть сделано n гипотез: . По тем или иным причинам нам известны вероятности этих гипотез до испытания(априорные вероятности гипотез). Известно также, что гипотеза сообщает событию В вероятность . Произведен опыт, в котором событие В наступило. Это должно вызвать переоценку вероятностей гипотез ; формулы Бейеса количественно решают этот вопрос.
Вероятности называются апостериорными вероятностями события . В артиллерийской практике производится так называемая пристрелка, имеющая своей целью уточнить наши знания относительно условий стрельбы (например, правильность прицела). В теории пристрелки широко используется формула Бейеса. Мы ограничимся приведением чисто схематического примера исключительно ради иллюстрации характера задач, решаемых этой формулой.
Пример 1. Имеется пять урн следующего состава:
2 урны (состава ) по 2 белых и 3 черных шара,
2 урны (состава ) по 1 белому и 4 черных шара,
1 урна (состава ) по 4 белых и 1 черный шар.
Из одной наудачу выбранной урны взят шар. Он оказался белым (событие В). Чему равна после опыта вероятность (апостериорная вероятность) того, что шар вынут из урны третьего состава? Согласно предположению
|
|
Согласно формуле Бейеса имеем:
|
|
Точно так же находим:
|
|
Независимые испытания. Формулы Бернулли.
В настоящем разделе мы изучим основные закономерности, относящиеся к одной из важнейших схем теории вероятностей — схеме последовательных независимых испытаний. В это понятие мы вкладываем следующий смысл.
Под испытанием(опытом) мы станем понимать осуществление определенного комплекса условий, в результате которого может произойти то или иное элементарное событие пространства U элементарных событий. Математической моделью последовательности п испытаний является новое пространство элементарных событий, состоящее из точек , где – произвольная точка пространства U, отвечающая испытанию с номером i.
Пусть испытание состоит в подбрасывании игральной кости. Пространство элементарных состояний состоит из 6 точек. Пространство ,соответствующее трем испытаниям, состоит из 216 точек(n=63).
Пусть под испытанием понимается проверка длительности безотказной работы полупроводникового прибора под определенным напряжением. Пространство элементарных событий состоит из множества точек полупрямой . Пространство состоит из множества точек , координаты которых принимают неотрицательные значения, равные длительностям безотказной работы соответственно приборов с номерами 1,2,…,n.
Предположим, что для s-го испытания пространство U разбито на k несовместимых случайных событий , т. е. предположим, что
|
|
Событие назовем i-м исходом при s-м испытании. Обозначим вероятность i-го исхода при s-м испытании через = Р ().
Bernylli Обозначим через событие, состоящее из всех тех точек пространства , для которых . Если в пространстве Un имеет место равенство при любых – то испытания называются независимыми.
В дальнейшем мы ограничимся случаем, когда вероятности событий не зависят от номера испытания s; обозначим в этом случае ; в силу несовместимости и единственной возможности исходов очевидно, имеем . Эта схема впервые была рассмотрена Я. Бернулли в важнейшем частном случае ; по этой причине указанный случай носит название схемы Бернулли. В схеме Бернулли обычно полагают .
Из определения независимых испытаний вытекает следующий результат:
Теорема 1. Если данные п испытаний независимы, то любые т из них также независимы.
Для простоты ограничимся случаем , поскольку переход к общему случаю не встречает затруднений. Действительно, имеет место очевидное равенство
|
|
из которого следует, что
|
|
По определению это означает, что первые п—1 испытаний независимы. Простейшая задача, относящаяся к схеме независимых испытаний, состоит в определении вероятности того, что при п испытаниях событие А наступит т раз, а остальные п—т раз наступит противоположное событие , обозначим это событие В. Тогда
|
|
Здесь Аi – событие состоящее в том, что событие А произойдет в i– ом испытании. Событие В представляет собой сумму несовместных событий, тогда согласно теореме сложения вероятностей получаем
|
|
Вероятность каждого слагаемого в данной сумме по теореме умножения для независимых событий равна . По теореме сложения вероятностей искомая вероятность равна сумме только что вычисленных вероятностей для всех различных способов т появлений события А и n—т не появлений среди п испытаний. Число таких способов, как известно из теории сочетаний, равно ; следовательно, искомая вероятность равна
|
|
Так как все возможные несовместимые между собой исходы п испытаний состоят в появлении события 0 раз, 1 раз, 2 раза, …, n раз, то ясно, что
|
|
Легко заметить, что вероятность равна коэффициенту при в разложении бинома по степеням x.
Исследуем далее как ведет себя вероятность при различных значениях m. Найдем m, при котором вероятность является наибольшей. Для этого определим отношение
|
|
Из полученного соотношения следует:
Пусть – в данном случае вероятность возрастет с ростом m.
Пусть – тогда предыдущая и последующая вероятности выравниваются.
Пусть – в данном случае вероятность уменьшается с ростом m.
Таким образом, с увеличением m сначала возрастает, затем достигает максимума и при дальнейшем росте m убывает. При этом, если является целым числом, то максимальное значение вероятность принимает для двух значений m, а именно и . Если же не является целым числом, то максимальное значение вероятности достигается при , равном максимальному целому числу, большему из и . Число называют наивероятнейшим значением и обозначают через .
Пример. Вероятность попадания при одном броске в кольцо равна 0,4. Баскетболист совершил 10 бросков. Каково наивероятнейшее значение числа попаданий в кольцо?
|
|
Обобщенная теорема о повторении опытов.
Поставим теперь более общую задачу.
Рассмотрим последовательностьнезависимых испытаний в каждом из которых может произойти или не произойти некоторое событие А. При этом вероятность появления события в каждом испытании различна.
Обозначим через . Аi – событие состоящее том что А произойдет в i-ом испытании – событие состоящее том что А не произойдет в i-ом испытании соответственно.
Следует определить вероятность того что событие А произойдет m раз в серии из испытаний.
Обозначим через Вm – событие состоящее в том что, событие А произойдет m раз в серии из испытаний.
|
(2.2.1) |
Здесь Аi – событие состоящее в том, что событие А произойдет в i- ом испытании. Событие Вm представляет собой сумму несовместных событий, поэтому
Число слагаемых в выражении равно , но они все различные. Для вычисления используют производящую функцию
ProizFunc
|
|
Зададимся целью найти в этом произведении коэффициент при . Для этого перемножим биномы и произведем приведение подобных членов. Каждый член содержащий будет иметь в качестве коэффициента произведение m букв p с какими-то индексами и n–m букв q с другими оставшимися индексами, а после приведения подобных членов коэффициент при будет представлять собой сумму всех возможных произведений такого типа.
Таким образом, вероятность того, что событие А произойдет m раз в серии из n испытаний равна коэффициенту при в выражении производящей функции, то есть
|
|
|
|
Пример 1. Производится стрельба по бегущей мишени. Вероятность попадания при первом выстреле p1 =0,1; при втором p2 =0,2; при третьем p3 =0,3 и при четвертом p4 =0,4. Определить вероятность одного, двух, трех, четырех и ни одного попадания при четырех выстрелах.
Решение:
Составляем производящую функцию для данной задачи
Выполняя, элементарные преобразования и приведение подобных членов получаем
Откуда следует, что
– вероятность ни одного попадания в мишень.
– вероятность одного попадания в мишень.
– вероятность двух попаданий в мишень.
– вероятность трех попаданий в мишень.
– вероятность четырех попаданий в мишень.
При решении многих практических задач, кроме определения вероятности , приходится вычислять вероятность появлений события А не менее m раз в n независимых испытаниях.
Обозначим через событие состоящее в том, что А появляется не менее m раз в n независимых испытаниях, а вероятность обозначим , тогда
|
|
Согласно теоремы сложения вероятностей событий имеем
|
|
В тех случаях когда удобно пользоваться следующей формулой
|
|
Понятие случайной величины и функции распределения.
Одним из основных понятий теории вероятностей является понятие случайной величины. Прежде чем переходить к формальному его определению, мы остановимся на рассмотрении примеров.
Пример 1. Число космических частиц, попадающих на определенный участок земной поверхности в течение промежутка времени определенной длины, подвержено значительным колебаниям в зависимости от многих случайных обстоятельств.
Пример 2. Размер уклонения точки падения снаряда от центра цели определяется большим количеством разнообразных причин, носящих случайный характер. В результате в теории стрельбы вынуждены считаться с явлением рассеивания снарядов около центра цели как со случайным явлением и рассматривать указанные уклонения как случайные величины.
Пример 3.Скорость молекулы газа не остается неизменной, а меняется в зависимости от столкновений с другими молекулами. Этих столкновений очень много даже в течение короткого промежутка времени. Зная скорость молекулы в данный момент, нельзя с полной определенностью указать ее значение, скажем, через 0,01 или 0,001 секунды. Изменение скорости молекулы носит случайный характер.
Приведенные примеры показывают с достаточной определенностью, что со случайными величинами приходится иметь дело в самых разнообразных областях науки и техники.
Несмотря на всю разнородность конкретного содержания приведенных нами примеров, все они с точки зрения математики представляют одну и ту же картину. А именно, в каждом примере мы имеем дело с величиной, так или иначе характеризующей исследуемое явление. Каждая из этих величин под влиянием случайных обстоятельств способна принимать различные значения. Заранее указать, какое значение примет эта величина, нельзя, так как оно меняется случайным образом от испытания к испытанию.
Разнообразие случайных величин весьма велико. Число принимаемых ими значений может быть конечным, счетным и несчетным; значения могут быть расположены дискретно или заполнять интервалы сплошь, или же не заполнять интервалы, но располагаться всюду плотно. Для того чтобы задавать вероятности значений случайных величин, столь различных по своей природе, и притом задавать их одним и тем же способом, в теории вероятностей вводят понятие функции распределения случайной величины.
Рассмотрим пример с подбрасыванием игральной кости:
Выпадению одного и двух очков сопоставим число –1 и будем считать, что это проигрыш;
Выпадению трех и четырех очков сопоставим число 0 и будем считать, что это ничья;
Выпадению пяти и шести очков сопоставим число +1 и будем считать, что это выигрыш;
Множество элементарных исходов в данном случае будет . В соответствии с принятыми правилами на множестве элементарных исходов определена функция
|
|
Аргументом это функции является случайное событие. При определении случайной величины будем исходить в соответствии с общими понятиями случайного события из множества элементарных событий U, поля событий F определенной на нем вероятности P(A). Пусть задано вероятностное пространство {U,F,P}.
Определение 1. Случайной величиной называется вещественная функция X(u), определенная на элементах пространства элементарных событий U, так что – числовой оси, множество U1 на которых функция X(u) строго меньше x является элементом поля событий F, то есть
|
|
Иначе можно считать, что X(u) есть случайная величина, если для любого события определена вероятность . Часто аргумент функции X(u) можно опускать, то есть .
Пусть X — случайная величина и х — произвольное действительное число. Вероятность того, что X, примет значение, меньшее чем х будет зависеть от значений x. Таким образом вероятность события есть некоторая функция аргумента x, которая называется функцией распределения вероятностей случайной величины X:
|
|
Условимся в дальнейшем, как правило, случайные величины обозначать прописными латинскими буквами, а принимаемые ими значения — строчными.
Резюмируем сказанное, случайной величиной называется переменная величина, значения которой зависят от случая и для которой определена функция распределения вероятностей.
Пример 1. Мы скажем, что случайная величина нормально распределена, если ее функция распределения имеет вид
|
|
где С > 0, > 0, m — постоянные. Впоследствии мы установим связь между постоянными и С и выясним теоретико-вероятностный смысл параметров m и . Нормально распределенные случайные величины играют особо важную роль в теории вероятностей и ее приложениях; в дальнейшем у нас будет много поводов убедиться в этом.
Свойства функции распределения.
Свойство 1. Функция распределения любой случайной величины, есть неубывающая функция.
Зная функцию распределения случайной величины X, можно определить вероятность неравенства x1X<x2 при любых . В самом деле, если через A обозначить событие, состоящее в том, что X, примет значение, меньшее чем x2, через В—событие, состоящее в том, что X < x1, наконец, через С — событие x1X<x2 ,то, очевидно, имеет место следующее равенство:
|
|
Так как события В и С несовместимы, то Р(А)=P(B)+Р(C).
Но
|
|
поэтому
|
|
Так как, по определению, вероятность есть неотрицательное число, то из равенства (3.2.3) следует, что при любых x1 и (x2>x1) имеет место неравенство
|
|
что и требовалось доказать.
Свойство 2. . Так как, функция распределения , то согласно свойств вероятности при любом х удовлетворяет неравенству
|
|
Свойство 3. Функция распределения может иметь не более чем счетное множество скачков.
Мы скажем, что функция распределения F(х) имеет при х=x0 скачок, если
|
|
В самом деле, скачков размера , функция распределения может иметь не более одного, скачков размера от одной четвертой до половины – не более трех. Вообще скачков размера от до может быть не более чем . Совершенно ясно, что мы можем пронумеровать все скачки, расположив их по величине, начиная с больших значений и повторяя равные значения столько раз, сколько скачков этой величины имеет функция F(х).
Свойство 4. . Определим и равенствами
|
|
и докажем, что .
Действительно, так как неравенство X< + достоверно, то
|
|
Обозначим через событие, состоящее в том, что . Так как событие , эквивалентно сумме событий , то на основании расширенной аксиомы сложения . Следовательно, при
|
|
Отсюда, принимая во внимание неравенства (3.2.5), заключаем, что при .
Свойство 5. Функция распределения непрерывна слева.
Выберем какую-нибудь возрастающую последовательность , сходящуюся к x.
Обозначим через An, событие . Тогда ясно, что , при i>j, и произведение всех событий An, есть невозможное событие. По аксиоме непрерывности должно быть
|
|
что и требовалось доказать.
Дискретные и непрерывные случайные величины.
Определение 1. Случайная величина X называется дискретной, если множество значений, которое она может принимать не более чем счетно, то есть либо конечно либо счетно. (Множество называется счетным, если каждому элементу можно поставить в соответствие число натурального ряда).
Пусть X – дискретная случайная величина принимает значение при этом будем предполагать, что все попарно различны.
Определение 2. Рядом распределения дискретной случайной величины X называется совокупность пар чисел , где – возможные значения случайной величины, а pi – вероятности, с которыми она принимает эти значения. События образуют полную группу попарно не совместных событий. Ряд распределения можно представить в виде таблицы(Табл.) или многоугольника распределения(Рис.3.3.1).
Табл.
xi |
X1 |
x2 |
… |
xn |
pi |
P1 |
p2 |
… |
pn |
Зная ряд распределения, либо многоугольник распределения можно построить функцию распределения случайной величины(Рис. 3.3.2), которая является исчерпывающей характеристикой случайной величины X.
|
|
|
|
Отметим, что величина скачка в точке, являющейся возможным значением случайной величины, равна вероятности pi того, что случайная величина Х примет значение xi.
Пример. Производится три выстрела по мишени. Вероятность попадания при одном выстреле равна 0,4. Построить ряд распределения для числа попаданий в мишень(см. Табл.3.3.2).
Х – число попаданий в мишень при трех выстрелах.
Табл.3.3.2
xi |
0 |
1 |
2 |
3 |
pi |
0,216 |
0,432 |
0,288 |
0,064 |
|
|
В качестве другого важного класса случайных величин можно выделить непрерывные случайные величины.
Определение 3. Распределение случайной величины X называется непрерывным, если существует такая, интегрируемая функция , что выполняется условие
|
|
Функция f(x) называется плотностью вероятности(плотностью распределения вероятности) или дифференциальным законом распределения.
Свойства плотности распределения.
1) – не отрицательная функция.
2)Если F(x) – дифференцируемая функция, то
3)Вероятность того, что случайная величина будет находится в пределах определяется соотношением
|
|
4)
|
|
Плотность распределения, так же как и функция распределения есть одна из форм закона распределения. Однако она не является универсальной характеристикой случайной величины, так как существует только для непрерывных случайных величин.
Рассмотрим непрерывную случайную величину Х с плотностью распределения f(x)( Рис.3.3.3).
Выделим элементарный участок dx. Вероятность попадания величины Х на этот участок f(x)dx называют элементом вероятности.
Числовые характеристики случайных величин.
Наиболее полная вероятностная характеристика поведения случайной величины определяется функцией распределения. Однако в ряде случаев не требуется столь полная ее вероятностная характеристика, а необходимо знать лишь некоторые фрагменты ее вероятностного поведения. В теории вероятностей и ее приложениях для характеристики поведения случайных величин используют некоторые постоянные величины, получаемые по определенным правилам. Среди них особенно важны математическое ожидание, дисперсия и моменты различных порядков. С их помощью допускается решение многих вероятностных задач.
1. Математическое ожидание. Среди характеристик случайных величин прежде всего отметим характеристику положения случайной величины на числовой прямой, то есть укажем некоторое число(значение) вокруг которого группируются все возможные значения случайной величины.
Рассмотрим следующий пример. Пусть при стрельбе из некоторого орудия для поражения цели требуется один снаряд с вероятностью , два снаряда – с вероятностью p2 , три снаряда – с вероятностью p3 …,снарядов – с вероятностью pn. Известно что при стрельбе цель будет поражена. Спрашивается сколько снарядов в среднем потребуется для поражения цели.
Итак, известно, что
Тогда
Пусть – возможные значения случайной величины Х, а – соответствующие им вероятности.
Определение 1. Если ряд (или ) сходится абсолютно, то есть (или ), то его сумма называется математическим ожиданием случайной величины Х и обозначается М[X] или Е[X].
Для непрерывных случайных величин естественным будет следующее обобщение:
Определение 2. Пусть Х – непрерывная случайная величина и f(x) – ее плотность распределения, то математическим ожиданием случайной величины Х называется интеграл , если он сходится абсолютно, то есть когда существует интеграл .
Часто математическое ожидание обозначают символом .
Математическое ожидание существует не для любой случайной величины. Пусть Х дискретная случайная величина, имеющая ряд распределения представленный в табл.
Табл.
|
2 |
22 |
… |
2k |
|
|
|
… |
|
|
|
то есть данный ряд есть ряд распределения случайной величины Х. Определим математическое ожидание случайной величины Х, , так как ряд расходится, то математическое ожидание не существует.
Кроме математического ожидания на практике применяются и другие характеристики положения, в частности мода и медиана.
2.Мода. Определение 3. Модой случайной величины Х называется наиболее вероятное ее значение. Термин «наиболее вероятное значение», строго говоря, применим только к дискретной случайной величине, для непрерывных случайных величин модой является то значение, при котором плотность вероятности достигает наибольшего значения. Условимся обозначать моду символом М0 .
Если кривая распределения(многоугольник) имеет более одного максимума, то распределение называется полимодальным, если распределение имеет минимум, то оно называется «антимодальным».
3.Медиана. Определение 4. Медианой случайной величины Х называется такое число Ме на числовой прямой, для которого справедливо следующее равенство: , то есть одинаково вероятны, события состоящие в том, что случайная величина Х окажется меньше или больше чем число Ме.
Медиана это абсцисса точки, в которой площадь, ограниченная кривой распределения делится пополам. В случае симметричного модального распределения медиана совпадает с математическим ожиданием и модой.
4. Моменты, дисперсия, среднеквадратическое отклонение. В теории вероятностей употребляется ряд характеристик, которые описывают различные свойства распределения случайных величин. Наиболее важными понятиями являются понятия начальных и центральных моментов.
Определение 5. Начальным моментом k-го порядка случайной величины Х называется математическое ожидание k-той степени данной случайной величины, то есть
|
|
Для дискретной случайной величины начальный момент k-го порядка определяется формулой , а для непрерывной случайной величины с плотностью распределения f(x) соответственно .
Не трудно заметить, что первый начальный момент есть математическое ожидание случайной величины.
Определение 6. Центрированной случайной величиной , соответствующей случайной величине Х будем называть величину, определяемую равенством =Х–mx. Заметим, что
|
|
Определение 7. Центральным моментом k-го порядка случайной величины Х называется математическое ожидание k-той степени центрированной случайной величины :
|
|
Формулы для вычисления центральных моментов имеют вид:
для дискретной случайной величины Х:
|
|
для непрерывной случайной величины Х:
|
|
Полезно отметить, что для дискретной случайной величины Х может быть вычислен по следующей формуле:
|
|
Аналогичную формулу можно получить для непрерывной случайной величины Х.
Ввиду крайней важности второй центральный момент называют дисперсией случайной величины. Дисперсия случайной величины есть характеристика рассеяния(разбросанности) значений случайной величины относительно mx . Для дисперсии вводят специальное обозначение:
|
|
Определение 8. Дисперсией случайной величины Х называется математическое ожидание квадрата соответствующей центрированной случайной величины.
Дисперсия имеет размерность квадрата случайной величины Х. Поэтому часто для наглядности решения задачи пользуются величиной размерность, которой совпадает с Х. Ее называют среднеквадратическим отклонением и определяют по следующей формуле
|
|
5. Коэффициент асимметрии (скошенности). Характеризует смещение распределения случайной величины Х относительно математического ожидания
|
|
– mx смещено вправо или распределение смещено влево относительно математического ожидания m1.
– mx смещено влево или распределение смещено вправо относительно математического ожидания m2.
Для симметричных законов .
6. Эксцес. Характеризует островершинность или туповершинность кривой распределения. Определяется соотношением
|
|
Для гаусовского(I) распределения Ех=0.
Ех>0–островершинность(II)
Ех<0–туповершинность(III)
Простейшие свойства основных числовых характеристик.
1) Доказательство .
2) Доказательство приведем для непрерывной случайной величины .
3), так как .
7. Квантили.
Определение 9. Квантилью xp уровня случайной величины Х называется решение уравнения .
Это определение абсолютно корректно для случайных величин со строго монотонной функцией (рис. 3.4.6.а) и требует уточнений для случая, когда решением уравнения является целый промежуток (рис. 3.4.6.б). В последнем случае введение квантили вопрос договорённости. Мы будем считать, что .
Для случая непрерывной случайной величины можно дать другое геометрическое толкование квантили : это такая точка на оси абсцисс, левее которой график плотности распределения ограничивает площадь, численно равную (рис 3.4.7)
Рис 3.4.7. Геометрическая интерпретация для функции
Рис 3.4.8. Медиана, верхняя и нижняя квартили распределения для функций и
Наиболее часто встречаются квантили уровней (медиана распределения), (нижняя квартиль) и (верхняя квартиль). Эти квантили делят числовую прямую на 4 части, вероятность попадания в которые равна (см. рис. 3.4.8).
Использование квантилей распределений широко применяется в задачах математической статистики.
Биномиальное распределение.
Рассмотрим дискретную случайную величину Х , которая принимает значения 0,1,2,…n с вероятностями
|
|
В схеме Бернулли: Х – число наступлений m раз события А в серии из n – независимых испытаний. Введем в рассмотрение производящую функцию, которая в данном случае имеет вид
|
|
Нетрудно заметить, что .
Придавая значение Z=1, получим
|
|
Подсчитаем числовые характеристики биномиального распределения:
1) математическое ожидание в соответствии с определением выражается формулой:
|
|
Найдем производную производящей функции:
|
|
Придавая значение Z=1, получим
|
|
Из соотношения (4.1.6) следует
|
|
Далее подсчитаем дисперсию по формуле . Второй начальный момент определяется формулой
|
|
Умножим производную производящей функции на z:
|
|
Дифференцируя полученное выражение, получим
|
|
и вычисляя при Z=1, получим
|
|
Из (4.1.6) нетрудно заметить, что , тогда:
|
|
|
|
Если р–мало, а п–достаточно большое число, то формулой биномиального распределения пользоваться не удобно.
Теорема Пуассона
Теорема Пуассона. Если при , а , то
|
|
где
Доказательство. Очевидно, что
Сомножители начиная со второго до m-го и знаменатель последней дроби при , очевидно сходятся к единице. Выражение от n не зависит. Числитель дроби при сходится . Таким образом, предел:
|
|
Что и требовалось доказать.
Закон Пуассона.
Во многих задачах практики приходится иметь дело со случайными величинами, распределенными по закону, который называется законом Пуассона.
Рассмотрим дискретную случайную величину X, которая может принимать только целые, неотрицательные значения 0,1,2,….m,… причем последовательность этих значений теоретически не ограничена. Случайная величина Х распределена по закону Пуассона, если вероятность того, что она примет определенное значение т, выражается формулой
|
|
где а – некоторая положительная величина, называемая параметром закона Пуассона.
Ряд распределения случайной величины X имеет вид:
xm |
0 |
1 |
2 |
… |
m |
… |
Pm |
e-a |
|
|
… |
|
… |
Убедимся прежде всего, что последовательность вероятностей, задаваемая формулой представляет собой ряд распределения. Имеем:
|
|
На рис. 4.3.1 показаны многоугольники распределения случайной величины X, распределенной по закону Пуассона, соответствующие различным значениям параметра а.
Определим основные характеристики — математическое ожидание и дисперсию — случайной величины Х. По определению математического ожидания
|
|
Первый член суммы (соответствующий m=0) равен нулю, следовательно, суммирование можно начинать с m=1:
|
|
Обозначим m-1=k; тогда
|
|
Таким образом, параметр а представляет собой не что иное, как математическое ожидание случайной величины X.
Для определения дисперсии найдем сначала второй начальный момент:
|
|
По ранее доказанному
|
|
кроме того,
|
|
следовательно, .
Далее находим дисперсию случайной величины X: .
Таким образом, дисперсия случайной величины, распределенной по закону Пуассона, равна ее математическому ожиданию а..
Это свойство распределения Пуассона часто применяется на практике для решения вопроса, правдоподобна ли гипотеза о том, что случайная величина Х распределена по закону Пуассона.
Равномерное распределение.
Рассмотрим непрерывную случайную величину X, подчиненную закону равномерной плотности на участке от до (рис. 4.4.2), и напишем для нее выражение плотности распределения f(х). Плотность f(х) постоянна и равна с на отрезке (;); вне этого отрезка она равна нулю:
|
|
Определим постоянную с из условия, получим
|
|
Тогда
|
|
Выражение для функции распределения F(х) равномерно распределенной случайной величины имеет вид:
|
|
График функции F(х) приведен на рис. 4.4.1. Определим основные числовые характеристики случайной величины X, подчиненной закону равномерной плотности на участке от до.
Математическое ожидание величины Х равно:
|
|
В силу симметричности равномерного распределения медиана величины Х также равна .
Моды закон равномерной плотности не имеет. Находим дисперсию величины X:
|
|
откуда среднеквадратическое отклонение . В силу симметричности распределения его асимметрия равна нулю:
|
|
Найдем вероятность попадания случайной величины X, распределенной по закону равномерной плотности, на участок (a,b), представляющий собой часть участка ()(рис. 4.4.3).
Геометрически эта вероятность представляет собой площадь, заштрихованную на рис. 4.4.3. Очевидно, она равна:
|
|
т. е. отношению длины отрезка ко всей длине участка , на котором задано равномерное распределение.
Показательное распределение.
Непрерывна случайная величина Х имеет показательный закон распределения, если ее функция распределения имеет вид
|
|
где – параметр распределения.
Плотность распределения определится соотношением:
|
|
Плотность распределения иллюстрируются следующим графиком:
Экспоненциальное распределение
Определим числовые характеристики случайной величины распределенной по показательному закону.
|
|
|
|
|
|
; |
|
Нормальный закон распределения.
Нормальный закон распределения (закон Гаусса) играет исключительно важную роль в теории вероятностей и занимает среди других законов распределения особое положение. Это — наиболее часто встречающийся на практике закон распределения. Главная особенность, выделяющая нормальный закон среди других, состоит в том, что он является предельным, к которому приближаются другие законы распределения при весьма часто встречающихся условиях.
Можно доказать, что сумма достаточно большого числа независимых случайных величин, подчиненных каким угодно законам распределения (при соблюдении некоторых весьма нежестких ограничений), приближенно подчиняется нормальному закону, и это выполняется тем точнее, чем большее количество случайных величин суммируется. Большинство встречающихся на практике случайных величин, таких, например, как ошибки измерений, ошибки стрельбы и т. д., могут быть представлены как суммы весьма большого числа сравнительно малых слагаемых — элементарных ошибок, каждая из которых вызвана действием отдельной причины, не зависящей от остальных. Каким бы законам распределения ни были подчинены отдельные элементарные ошибки, особенности этих распределений в сумме большого числа слагаемых нивелируются, и сумма оказывается подчиненной закону, близкому к нормальному.
Нормальный закон распределения характеризуется плотностью вероятности вида:
|
|
Кривая распределения по нормальному закону имеет симметричный холмообразный вид (рис. 4.6.1). Максимальная ордината кривой, равная , соответствует точке X=т; по мере удаления от точки т плотность распределения уменьшается, и при кривая асимптотически приближается к оси абсцисс.
Выясним смысл параметров m и , входящих в выражение нормального закона; докажем, что величина т есть не что иное, как математическое ожидание, а величина — среднеквадратическое отклонение величины X. Для этого вычислим основные числовые характеристики случайной величины Х.
|
|
Применяя замену переменной, имеем:
|
|
Нетрудно убедиться, что первый из двух интервалов равен нулю; второй представляет собой известный интеграл Эйлера — Пуассона:
|
|
Следовательно,
|
|
Вычислим дисперсию величины X.
|
|
Применив снова замену переменной, имеем:
|
|
Интегрируя по частям, получим:
|
|
Первое слагаемое в фигурных скобках равно нулю (так как при убывает быстрее, чем возрастает любая степень t), второе слагаемое равно , откуда .
Следовательно, параметр есть не что иное, как среднеквадратическое отклонение величины X.
Из соотношения (4.6.1) следует, что центром симметрии распределения является центр рассеивания т. Это ясно из того, что при изменении знака разности (x – т) на обратный выражение (4.6.1) не меняется. Если изменять центр рассеивания т кривая распределения будет смещаться вдоль оси абсцисс, не изменяя своей формы (рис. 4.6.2).
Параметр характеризует не положение, а самую форму кривой распределения. Это есть характеристика рассеивания. Наибольшая ордината кривой распределения обратно пропорциональна ; при увеличении максимальная ордината уменьшается.
На рис. 4.6.3 показаны три нормальные кривые (I, II, III) при m = 0; из них кривая I соответствует
самому большому, а кривая III — самому малому значению .
Размерность параметра , естественно, совпадает с размерностью случайной величины X.
Алгебра событий. Пространство элементарных событий.
Прежде чем перейти к классическому определению понятия вероятности, мы сделаем несколько предварительных замечаний. Будем считать фиксированным комплекс условий и станем рассматривать некоторую систему F событий А,В,С,… каждое из которых может произойти или не произойти при каждом осуществлении комплекса условий. Между событиями системы F могут существовать известные соотношения, с которыми мы постоянно будем иметь дело и которые поэтому прежде всего изучим.
1) Если при каждом осуществлении комплекса условий, при котором происходит событие А, происходит и событие В, то будем говорить, что А влечет за собой В, и обозначать это обстоятельство символом .
2) Если А влечет за собой В и в то же время В влечет за собой А, т. е. если при каждой реализации комплекса условий события А и В оба наступают или оба не наступают, то будем говорить, что события А и В равносильны, и будем обозначать это обстоятельство символом А=В.
Заметим, что во всех исследованиях теории вероятностей равносильные между собой события могут заменять друг друга. Поэтому условимся в дальнейшем любые два равносильных события считать просто тождественными друг другу.
3) Событие, состоящее в наступлении обоих событий А и В, называется произведением событий A и В и обозначается символом АВ (или А∩В).
4) Событие, состоящее в наступлении хотя бы одного из событий А и В, будем называть суммой событий А и В и обозначать символом A+B (или AВ).
5) Событие, состоящее в том, что событие А происходит, а событие В не происходит, называется разностью событий А и В и обозначается символом А—В.
6) Два события А и называются противоположными, если для них одновременно выполняются два соотношения:
|
|
Например, если при бросании одной игральной кости С обозначает выпадение четного числа очков, то
|
|
есть событие, состоящее в выпадении нечетного числа очков.
Проиллюстрируем введенные понятия на простейших примерах. Первый из них представляет собой так называемую диаграмму Вьенна.
Пусть комплекс условий состоит в том, что внутри квадрата, изображенного на рис. 1 выбирается наудачу точка. Обозначим через А событие «выбранная точка лежит внутри левой окружности» и через В событие «выбранная точка лежит внутри правой окружности». Тогда события А,,В,,, состоят в попадании выбранной точки внутрь областей, заштрихованных на соответствующих фигурах .
Рассмотрим другой пример. Допустим, что комплекс условий состоит в том, что на стол бросается (один раз) игральная кость.
Обозначим через А выпадение на верхней грани кости шести очков, через В—выпадение трех очков, через С—выпадение какого-либо четного числа очков, через D—выпадение какого-либо числа очков, кратного трем. Тогда события А,В,С и D связаны следующими соотношениями:
|
|
Определение суммы и произведения двух событий обобщается на любое число событий и обозначает событие, заключающееся в наступлении хотя бы одного из событий и обозначает событие, заключающееся в наступлении всех событий А,В,..,D.
Очевидно, что все достоверные события равносильны между собой. Поэтому законно обозначать все достоверные события одной буквой. Мы будем употреблять для этого букву U. Все невозможные события тоже равносильны между собой. Мы будем обозначать любое невозможное событие буквой V.
Два события А и В называются несовместимыми, если их совместное появление невозможно, т. е. если
|
|
Если и события попарно несовместимы, т. е. , то говорят, что событие А подразделяется на частные случаи . Например, при бросании игральной кости событие С, состоящее в выпадении четного числа очков, подразделяется на частные случаи , состоящие соответственно в выпадении 2, 4 и 6 очков.
События образуют полную группу событий, если хотя бы одно из них непременно должно произойти (при каждом осуществлении комплекса), т. е. .
Особенно существенны для нас в дальнейшем будут полные группы попарно несовместимых событий. Такова, например, при однократном бросании игральной кости система событий состоящая соответственно в появлении 1, 2, 3, 4, 5 и 6 очков.
8) В каждой задаче теории вероятностей приходится иметь дело с каким-либо определенным комплексом условий и с какой-либо определенной системой F событий. Относительно этой системы целесообразно сделать следующие допущения:
а) если системе F принадлежат события А и В, то ей принадлежат также события и т.д.
б) система F содержит достоверное и невозможное события.
Система событий, удовлетворяющая этим допущениям, называется полем событий.
В рассмотренных нами иллюстративных примерах всегда было можно выделить такие события, которые не могли быть разложены на более простые: выпадение определенной грани при бросании игральной точки; попадание в определенную точку квадрата при рассмотрении диаграммы Вьенна. Условимся называть такие неразложимые события элементарными событиями.
При построении математической теории вероятностей наши интуитивные представления требуют большей формализации, чем та с которой мы имели дело до сих пор. В современном изложении теории вероятностей исходят из множества элементарных событий или, как теперь принято говорить, пространства элементарных событий. Природа элементов этого пространства заранее не оговаривается, поскольку важно иметь достаточно широкий выбор для охвата всех возможных случаев. В частности, элементами пространства могут быть точки евклидова пространства, функции одного или нескольких переменных и т. д. Множества точек пространства элементарных событий образуют случайные события. Событие, состоящее из всех точек пространства элементарных событий, называется достоверным событием. Все, что мы говорили о соотношениях между случайными событиями в настоящем параграфе, сохраняет силу и для формального построения теории. Сейчас мы ограничимся указанием на то что для случайных событий имеют место следующие законы:
коммутативный
ассоциативный
дистрибутивный
тождества
Доказательство этих законов мы предоставим читателю. Для лиц, знакомых с элементами теории множеств, его проведение не составит труда.