Определение бернулли. Испытания по схеме бернулли

1. Боголюбов А.Н. Математики. Механики: биографический справочник. – Киев: Наукова думка, 1983.

2. Гулай Т.А., Долгополова А.Ф., Литвин Д.Б. Анализ и оценка приоритетности разделов математических дисциплин, изучаемых студентами экономических специальностей аграрных вузов // Вестник АПК Ставрополья. – 2013. – № 1 (9). – С. 6-10.

3. Долгополова А.Ф., Гулай Т.А., Литвин Д.Б. Перспективы применения математических методов в экономических исследованиях // Аграрная наука, творчество, рост. – 2013. – С. 255-257.

В математике довольно часто встречаются задачи, в которых присутствует большое количество повторений одного и того же условия, испытания или эксперимента. Результатом каждого испытания будет считаться совершенно другой результат от наступившего предыдущего. Зависимости в результатах так же наблюдаться не будет. В качестве результата испытания можно различить несколько возможностей элементарных последствий: возникновение события (А) или же возникновение события, которое дополняет А.

Тогда попробуем предположить, что вероятность возникновения события Р(А) регулярна и равна р (0<р<1).

Примерами такого испытания может быть большое количество задач, таких как подбрасывание монетки, извлечение из темного мешка черно-белых шаров или же рождение черно-белых кроликов.

Такой эксперимент называют конфигурацией повторных независимых испытаний или схемой Бернулли.

Якоб Бернулли родился в семье фармацевта. Отец пытался наставить сына на медицинский путь, но Я. Бернулли увлекся математикой самостоятельно, а позже это стало его профессией. Ему принадлежат различные трофеи в работах на темы по теории вероятностей и чисел, рядов и дифференциальном исчислении. Изучив теорию вероятности по одной изработ Гюйгенса «О расчетах в азартной игре», Якоб увлекся этим. В данной книге не было даже четкого определения концепции «вероятность». Именно Я. Бернулли ввел в математику большую часть современных понятий теории вероятностей. Так же Бернулли первымвыразил свой вариант закона больших чисел. Имя Якоба носят различные работы, теоремы и схемы: «Числа Бернулли», «Многочлен Бернулли», «Дифференциальное уравнение Бернулли», «Распределение Бернулли» и «Уравнение Бернулли».

Вернемся к повторениям. Как уже было указано выше, то в итоге различных испытаний возможны два исхода: либо появится событие А, либо противоположность этому событию. Сама схема Бернулли обозначает производство n-го количества типовых вольных опытов, и в каждом из этих опытов может появится нужное нам событие А (вероятность этого события известна: Р(А)=р), вероятность противоположного события событию А обозначена за q=P(A)=1-p. Требуется определение вероятности, что при проведении испытаний неизвестного количества событие А появится ровно k раз.

Важно помнить о главном условии при решении задач при помощи схемы Бернулли-это постоянство. Без него схема теряет всякий смысл.

Этой схемой можно пользоваться для решения задач различного уровня сложности: от простых (та же монетка) до сложных (проценты). Однако чаще схема Бернулли применяется в решении таких задач, которые связаны с контролем свойств различной продукции и уверенности в самых разных механизмах. Только для решения задачи до начала работы должны быть известны заранее все условия и значения.

Не все задачи в теории вероятностей сводятся к постоянству в условиях. Даже если взять в пример черные и белые шары в темном мешке: при вытягивании одного шара соотношение количества и цветов шариков в мешке изменилось, а значит изменилась и сама вероятность.

Однако если же условия у нас постоянны, то мы можем точно определить требуемую от нас вероятность того, что событие А произойдет ровно kраз из n возможных.

Этот факт Якоб Бернулли скомпоновал в теорему, которую впоследствии стали называть его именем. «Теорема Бернулли» является одной из главных теорем в теории вероятности. Впервые ее опубликовали в труде Я.Бернулли «Искусство предположений». Что же представляет из себя эта теорема? «Если вероятность р наступления события А в каждом испытании постоянна, то вероятность Рk,n того, что событие наступит k раз в n испытаниях, не зависящих друг от друга равна: , где q=1-p».

В доказательство действенности формулы можно привести задачи.

Задача № 1:

Из n стеклянных банок за месяц хранения k разбиваются. Наугад взяли m банок. Найти вероятность, что среди этих банок l не разобьются. n=250, k=10, m=8,l=4.

Решение: Имеем схему Бернулли со значениями:

p=10/250=0,04 (вероятность того, что банки разобьются);

n=8 (число испытаний);

k=8-4=4 (количество разбитых банок).

Используем формулу Бернулли

Получили:

Ответ: 0,0141

Задача № 2:

Вероятность изготовления неисправного изделия на производстве равна 0,2. Найти вероятность того, что из 10 изготовленных на этом производстве изделий ровно k должны быть исправны. Выполнить решение для k = 0, 1, 10.

Нам интересно событие A - изготовление исправных деталей, случающееся раз в час с вероятностью p=1-0,2=0,8. Надо найти вероятность того, что данное событие совершится k раз. Событию A противоположно событие «не A», т.е. изготовление неисправного изделия.

Следовательно, мы имеем: n=10; p=0,8; q=0,2.

В итоге найдем вероятность того, что из 10 изготовленных изделий все изделия неисправны (k=0), что одно изделие исправно (k=1), что неисправных нет вообще (k=10):

В заключении хотелось бы отметить, что в современности многие ученые пытаются доказать, что «формула Бернулли» не соответствует законам природы и можно решить задачи, не применяя ее к использованию. Конечно это возможно, большинство задач по теории вероятности возможно выполнить без формулы Бернулли, главное не запутаться в больших объемах цифр.

Библиографическая ссылка

Хомутова Е.А., Калиниченко В.А. ФОРМУЛА БЕРНУЛЛИ В ТЕОРИИ ВЕРОЯТНОСТИ // Международный студенческий научный вестник. – 2015. – № 3-4.;
URL: http://eduherald.ru/ru/article/view?id=14141 (дата обращения: 12.03.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»

Производится n опытов по схеме Бернулли с вероятностью успеха p . Пусть X - число успехов. Случайная величина X имеет область значений {0,1,2,...,n}. Вероятности этих значений можно найти по формуле: , где C m n - число сочетаний из n по m .
Ряд распределения имеет вид:

x	0	1	...	m	n
p	(1-p) n	np(1-p) n-1	...	C m n p m (1-p) n-m	p n

Этот закон распределения называется биноминальным .

Назначение сервиса . Онлайн-калькулятор используется для построения биноминальным ряда распределения и вычисления всех характеристик ряда: математического ожидания, дисперсии и среднеквадратического отклонения. Отчет с решением оформляется в формате Word (пример).

Видеоинструкция

Схема испытаний Бернулли

Числовые характеристики случайной величины, распределенной по биноминальному закону

Математическое ожидание случайной величины Х, распределенной по биноминальному закону.
M[X]=np

Дисперсия случайной величины Х, распределенной по биноминальному закону.
D[X]=npq

Пример №1 . Изделие может оказаться дефектным с вероятностью р = 0.3 каждое. Из партии выбирают три изделия. Х – число дефектных деталей среди отобранных. Найти (все ответы вводить в виде десятичных дробей): а) ряд распределения Х; б) функцию распределения F(x) .
Решение . Случайная величина X имеет область значений {0,1,2,3}.
Найдем ряд распределения X.
P 3 (0) = (1-p) n = (1-0.3) 3 = 0.34
P 3 (1) = np(1-p) n-1 = 3(1-0.3) 3-1 = 0.44

P 3 (3) = p n = 0.3 3 = 0.027

x i	0	1	2	3
p i	0.34	0.44	0.19	0.027

Математическое ожидание находим по формуле M[X]= np = 3*0.3 = 0.9
Проверка: m = ∑x i p i .
Математическое ожидание M[X] .
M[x] = 0*0.34 + 1*0.44 + 2*0.19 + 3*0.027 = 0.9
Дисперсию находим по формуле D[X]=npq = 3*0.3*(1-0.3) = 0.63
Проверка: d = ∑x 2 i p i - M[x] 2 .
Дисперсия D[X] .
D[X] = 0 2 *0.34 + 1 2 *0.44 + 2 2 *0.19 + 3 2 *0.027 - 0.9 2 = 0.63
Среднее квадратическое отклонение σ(x) .

Функция распределения F(X) .
F(xF(0F(1F(2F(x>3) = 1

Вероятность появления события в одном испытании равна 0.6 . Производится 5 испытаний. Составить закон распределения случайной величины Х – числа появлений события.
Составить закон распределения случайной величины Х числа попаданий при четырех выстрелах, если вероятность попадания в цель при одном выстреле равна 0.8 .
Монету подбрасывают 7 раз. Найти математическое ожидание и дисперсию числа появлений герба. Примечание: здесь вероятность появление герба равна p = 1/2 (т.к. у монеты две стороны).

Пример №2 . Вероятность появления события в отдельном испытании равна 0.6 . Применяя теорему Бернулли, определите число независимых испытаний, начиная с которого вероятность отклонения частоты события от его вероятности по абсолютной величине меньше 0.1 , больше 0.97 . (Ответ: 801)

Пример №3 . Студенты выполняют контрольную работу в классе информатики. Работа состоит из трех задач. Для получения хорошей оценки нужно найти правильные ответы не меньше чем на две задачи. К каждой задаче дается 5 ответов из которых только одна правильная. Студент выбирает ответ наугад. Какая вероятность того, что он получит хорошую оценку?
Решение . Вероятность правильно ответить на вопрос: p=1/5=0.2; n=3.
Эти данные необходимо ввести в калькулятор. В ответ см. для P(2)+P(3).

Пример №4 . Вероятность попадания стрелка в мишень при одном выстреле равна (m+n)/(m+n+2) . Производится n+4 выстрела. Найти вероятность того, что он промахнется не более двух раз.

Примечание . Вероятность того, что он промахнется не более двух раз включает в себя следующие события: ни разу не промахнется P(4), промахнется один раз P(3), промахнется два раза P(2).

Пример №5 . Определите распределение вероятностей числа отказавших самолётов, если влетает 4 машины. Вероятность безотказной работы самолета Р=0.99 . Число отказавших в каждом вылете самолётов распределено по биноминальному закону.

На этом уроке будем находить вероятность наступления события в независимых испытаниях при повторении испытаний. Испытания называются независимыми, если вероятность того или иного исхода каждого испытания не зависит от того, какие исходы имели другие испытания . Независимые испытания могут проводиться как в одинаковых условиях, так и в различных. В первом случае вероятность появления некоторого события во всех испытаниях одна и та же, во втором случае она меняется от испытания к испытанию.

Примеры независимых повторных испытаний :

выйдет из строя один из узлов прибора или два, три узла, причём выход из строя каждого узла не зависит от другого узла, а вероятность выхода из строя одного узла постоянна во всех испытаниях;
произведённая в некоторых постоянных технологических условиях деталь, или три, четыре, пять деталей, окажутся нестандартными, причём одна деталь может оказаться нестандартной независимо от любой другой детали и вероятность того, что деталь окажется нестандатной, постоянна во всех испытаниях;
из нескольких выстрелов по мишени один, три или четыре выстрела попадают в цель независимо от исходов других выстрелов и вероятность попадания в цель постоянна во всех испытаниях;
при опускании монеты автомат сработает правильно один, два или другое число раз независимо от того, какой результат имели другие опускания монеты, и вероятность того, что автомат сработает правильно, постоянна во всех испытаниях.

Эти события можно описать одной схемой. Каждое событие наступает в каждом испытании с одной и той же вероятностью, которая не изменяется, если становятся известными результаты предыдущих испытаний. Такие испытания называются независимыми, а схема называется схемой Бернулли . Предполагается, что такие испытания могут быть повторены как угодно большое количество раз.

Если вероятность p наступления события A в каждом испытании постоянна, то вероятность того, что в n независимых испытаниях событие A наступит m раз, находится по формуле Бернулли :

(где q = 1 – p - вероятность того, что событие не наступит)

Поставим задачу – найти вероятность того, что событие такого типа в n независимых испытаниях наступит m раз.

Формула Бернулли: примеры решения задач

Пример 1. Найти вероятность того, что среди взятых случайно пяти деталей две стандартные, если вероятность того, что каждая деталь окажется стандартной, равна 0,9.

Решение. Вероятность события А , состоящего в том, что взятая случайно деталь стандартна, есть p =0,9 , а вероятность того, что она нестандартна, есть q =1–p =0,1 . Обозначенное в условии задачи событие (обозначим его через В ) наступит, если, например, первые две детали окажутся стандартными, а следующие три – нестандартными. Но событие В также наступит, если первая и третья детали окажутся стандартными, а остальные – нестандартными, или если вторая и пятая детали будут стандартными, а остальные – нестандартными. Имеются и другие возможности наступления события В . Любая из них характеризуется тем, что из пяти взятых деталей две, занимающие любые места из пяти, окажутся стандартными. Следовательно, общее число различных возможностей наступления события В равно числу возможностей размещения на пяти местах двух стандартных деталей, т.е. равно числу сочетаний из пяти элементов по два, а .

Вероятность каждой возможности по теореме умножения вероятностей равна произведению пяти множителей, из которых два, соответствующие появлению стандартных деталей, равны 0,9, а остальные три, соответствующие появлению нестандартных деталей, равны 0,1, т.е. эта вероятность составляет . Так как указанные десять возможностей являются несовместимыми событиями, по теореме сложения вероятность события В , которую обозначим

Пример 2. Вероятность того, что станок в течение часа потребует внимания рабочего, равна 0,6. Предполагая, что неполадки на станках независимы, найти вероятность того, что в течение часа внимания рабочего потребует какой-либо один станок из четырёх обслуживаемых им.

Решение. Используя формулу Бернулли при n =4 , m =1 , p =0,6 и q =1–p =0,4 , получим

Пример 3. Для нормальной работы автобазы на линии должно быть не менее восьми автомашин, а их имеется десять. Вероятность невыхода каждой автомашины на линию равна 0,1. Найти вероятность нормальной работы автобазы в ближайший день.

Решение. Автобаза будет работать нормально (событие F ), если на линию выйдут или восемь (событие А ), или девять (событие В ), или все десять автомашин событие (событие C ). По теореме сложения вероятностей,

Каждое слагаемое находим по формуле Бернулли . Здесь n =10 , m =8; 9; 10 , а p =1-0,1=0,9 , так как p должно означать вероятность выхода автомашины на линию; тогда q =0,1 . В результате получим

Пример 4. Пусть вероятность того, что покупателю необходима мужская обувь 41-го размера, равна 0,25. Найти вероятность того, что из шести покупателей по крайней мере двум необходима обувь 41-го размера.

Статистика приходит к нам на помощь при решении многих задач, например: когда нет возможности построить детерминированную модель, когда слишком много факторов или когда нам необходимо оценить правдоподобие построенной модели с учётом имеющихся данных. Отношение к статистике неоднозначное. Есть мнение, что существует три вида лжи: ложь, наглая ложь и статистика. С другой стороны, многие «пользователи» статистики слишком ей верят, не понимая до конца, как она работает: применяя, например, тест к любым данным без проверки их нормальности. Такая небрежность способна порождать серьёзные ошибки и превращать «поклонников» теста в ненавистников статистики. Попробуем поставить токи над i и разобраться, какие модели случайных величин должны использоваться для описания тех или иных явлений и какая между ними существует генетическая связь.

В первую очередь, данный материал будет интересен студентам, изучающим теорию вероятностей и статистику, хотя и «зрелые» специалисты смогут его использовать в качестве справочника. В одной из следующих работ я покажу пример использования статистики для построения теста оценки значимости показателей биржевых торговых стратегий.

В работе будут рассмотрены :

В конце статьи будет задан для размышлений. Свои размышления по этому поводу я изложу в следующей статье.

Некоторые из приведённых непрерывных распределений являются частными случаями .

Дискретные распределения

Дискретные распределения используются для описания событий с недифференцируемыми характеристиками, определёнными в изолированных точках. Проще говоря, для событий, исход которых может быть отнесён к некоторой дискретной категории: успех или неудача, целое число (например, игра в рулетку, в кости), орёл или решка и т.д.

Описывается дискретное распределение вероятностью наступления каждого из возможных исходов события. Как и для любого распределения (в том числе непрерывного) для дискретных событий определены понятия матожидания и дисперсии. Однако, следует понимать, что матожидание для дискретного случайного события - величина в общем случае нереализуемая как исход одиночного случайного события, а скорее как величина, к которой будет стремиться среднее арифметическое исходов событий при увеличении их количества.

В моделировании дискретных случайных событий важную роль играет комбинаторика, так как вероятность исхода события можно определить как отношение количества комбинаций, дающих требуемый исход к общему количеству комбинаций. Например: в корзине лежат 3 белых мяча и 7 чёрных. Когда мы выбираем из корзины 1 мяч, мы можем сделать это 10-ю разными способами (общее количество комбинаций), но только 3 варианта, при которых будет выбран белый мяч (3 комбинации, дающие требуемый исход). Таким образом, вероятность выбрать белый мяч: ().

Следует также отличать выборки с возвращением и без возвращения. Например, для описания вероятности выбора двух белых мячей важно определить, будет ли первый мяч возвращён в корзину. Если нет, то мы имеем дело с выборкой без возвращения () и вероятность будет такова: - вероятность выбрать белый мяч из начальной выборки умноженная на вероятность снова выбрать белый мяч из оставшихся в корзине. Если же первый мяч возвращается в корзину, то это выборка с возвращением (). В этом случае вероятность выбора двух белых мячей составит .

Если несколько формализовать пример с корзиной следующим образом: пусть исход события может принимать одно из двух значений 0 или 1 с вероятностями и соответственно, тогда распределение вероятности получения каждого из предложенных исходов будет называться распределение Бернулли:

По сложившейся традиции, исход со значением 1 называется «успех», а исход со значением 0 - «неудача». Очевидно, что получение исхода «успех или неудача» наступает с вероятностью .

Матожидание и дисперсия распределения Бернулли:

Количество успехов в испытаниях, исход которых распределен по с вероятностью успеха (пример с возвращением мячей в корзину), описывается биномиальным распределением:

По другому можно сказать, что биномиальное распределение описывает сумму из независимых случайных величин, умеющих распределение с вероятностью успеха .
Матожидание и дисперсия:

Биномиальное распределение справедливо только для выборки с возвращением, то есть, когда вероятность успеха остаётся постоянной для всей серии испытаний.

Если величины и имеют биномиальные распределения с параметрами и соответственно, то их сумма также будет распределена биномиально с параметрами .

Представим ситуацию, что мы вытягиваем мячи из корзины и возвращаем обратно до тех пор, пока не будет вытянут белый шар. Количество таких операций описывается геометрическим распределением. Иными словами: геометрическое распределение описывает количество испытаний до первого успеха при вероятности наступления успеха в каждом испытании . Если подразумевается номер испытания, в котором наступил успех, то геометрическое распределение будет описываться следующей формулой:

Матожидание и дисперсия геометрического распределения:

Геометрическое распределение генетически связано с распределением, которое описывает непрерывную случайную величину: время до наступления события, при постоянной интенсивности событий. Геометрическое распределение также является частным случаем .

Распределение Паскаля является обобщением распределения: описывает распределение количества неудач в независимых испытаниях, исход которых распределен по с вероятностью успеха до наступления успехов в сумме. При , мы получим распределение для величины .

где - число сочетаний из по .

Матожидание и дисперсия отрицательного биномиального распределения:

Сумма независимых случайных величин, распределённых по Паскалю, также распределена по Паскалю: пусть имеет распределение , а - . Пусть также и независимы, тогда их сумма будет иметь распределение

До сих пор мы рассматривали примеры выборок с возвращением, то есть, вероятность исхода не менялась от испытания к испытанию.

Теперь рассмотрим ситуацию без возвращения и опишем вероятность количества успешных выборок из совокупности с заранее известным количеством успехов и и неудач (заранее известное количество белых и чёрных мячей в корзине, козырных карт в колоде, бракованных деталей в партии и т.д.).

Пусть общая совокупность содержит объектов, из них помечены как «1», а как «0». Будем считать выбор объекта с меткой «1», как успех, а с меткой «0» как неудачу. Проведём n испытаний, причём выбранные объектв больше не будут участвовать в дальнейших испытаниях. Вероятность наступления успехов будет подчиняться гипергеометрическому распределению:

где - число сочетаний из по .

Матожидание и дисперсия:

Распределение Пуассона

(взято отсюда)

Распределение Пуассона значительно отличается от рассмотренных выше распределений своей «предметной» областью: теперь рассматривается не вероятность наступления того или иного исхода испытания, а интенсивность событий, то есть среднее количество событий в единицу времени.

Распределение Пуассона описывает вероятность наступления независимых событий за время при средней интенсивности событий :

Матожидание и дисперсия распределения Пуассона:

Дисперсия и матожидание распределения Пуассона тождественно равны.

Распределение Пуассона в сочетании с , описывающим интервалы времени между наступлениями независимых событий, составляют математическую основу теории надёжности.

Плотность вероятности произведения случайных величин x и y () с распределениями и может быть вычислена следующим образом:

Некоторые из приведённых ниже распределений являются частными случаями распределения Пирсона, которое, в свою очередь, является решением уравнения:

где и - параметры распределения. Известны 12 типов распределения Пирсона, в зависимости от значений параметров.

Распределения, которые будут рассмотрены в этом разделе, имеют тесные взаимосвязи друг с другом. Эти связи выражаются в том, что некоторые распределения являются частными случаями других распределений, либо описывают преобразования случайных величин, имеющих другие распределения.

На приведённой ниже схеме отражены взаимосвязи между некоторыми из непрерывных распределений, которые будут рассмотрены в настоящей работе. На схеме сплошными стрелками показано преобразование случайных величин (начало стрелки указывает на изначальное распределение, конец стрелки - на результирующее), а пунктирными - отношение обобщения (начало стрелки указывает на распределение, являющееся частным случаем того, на которое указывает конец стрелки). Для частных случаев распределения Пирсона над пунктирными стрелками указан соответствующий тип распределения Пирсона.

Предложенный ниже обзор распределений охватывает многие случаи, которые встречаются в анализе данных и моделировании процессов, хотя, конечно, и не содержит абсолютно все известные науке распределения.

Нормальное распределение (распределение Гаусса)

(взято отсюда)

Плотность вероятности нормального распределения с параметрами и описывается функцией Гаусса:

Если и , то такое распределение называется стандартным.

Матожидание и дисперсия нормального распределения:

Область определения нормального распределения - множество дествительных чисел.

Нормальное распределение является распределение типа VI.

Сумма квадратов независимых нормальных величин имеет , а отношение независимых Гауссовых величин распределено по .

Нормальное распределение является бесконечно делимым: сумма нормально распределенных величин и с параметрами и соответственно также имеет нормальное распределение с параметрами , где и .

Нормальное распределение хорошо моделирует величины, описывающие природные явления, шумы термодинамической природы и погрешности измерений.

Кроме того, согласно центральной предельной теореме, сумма большого количества независимых слагаемых одного порядка сходится к нормальному распределению, независимо от распределений слагаемых. Благодаря этому свойству, нормальное распределение популярно в статистическом анализе, многие статистические тесты рассчитаны на нормально распределенные данные.

На бесконечной делимости нормального распределении основан z-тест. Этот тест используется для проверки равенства матожидания выборки нормально распределённых величин некоторому значению. Значение дисперсии должно быть известно . Если значение дисперсии неизвестно и рассчитывается на основании анализируемой выборки, то применяется t-тест, основанный на .

Пусть у нас имеется выборка объёмом n независимых нормально распределенных величин из генеральной совокупности со стандартным отклонением выдвинем гипотезу, что . Тогда величина будет иметь стандартное нормальное распределение. Сравнивая полученное значение z с квантилями стандартного распределения можно принимать или отклонять гипотезу с требуемым уровнем значимости.

Благодаря широкой распространённости распределения Гаусса, многие, не очень хорошо знающие статистику исследователи забывают проверять данные на нормальность, либо оценивают график плотности распределения «на глазок», слепо полагая, что имеют дело с Гауссовыми данными. Соответственно, смело применяя тесты, предназначенные для нормального распределения и получая совершенно некорректные результаты. Наверное, отсюда и пошла молва про статистику как самый страшный вид лжи.

Рассмотрим пример: нам надо измерить сопротивления набора резистров некоторого номинала. Сопротивление имеет физическую природу, логично предположить, что распределение отклонений сопротивления от номинала будет нормальным. Меряем, получаем колоколообразную функцию плотности вероятности для измеренных значений с модой в окрестности номинала резистров. Это нормальное распределение? Если да, то будем искать бракованные резистры используя , либо z-тест, если нам заранее известна дисперсия распределения. Думаю, что многие именно так и поступят.

Но давайте внимательнее посмотрим на технологию измерения сопротивления: сопротивление определяется как отношение приложенного напряжения к протекающему току. Ток и напряжение мы измеряли приборами, которые, в свою очередь, имеют нормально распределенные погрешности. То есть, измеренные значения тока и напряжения - это нормально распределенные случайные величины с матожиданиями, соответствующими истинным значениям измеряемых величин. А это значит, что полученные значения сопротивления распределены по , а не по Гауссу.

Распределение описывает сумму квадратов случайных величин , каждая из которых распределена по стандартному нормальному закону :

Где - число степеней свободы, .

Матожидание и дисперсия распределения :

Область определения - множество неотрицательных натуральных чисел. является бесконечно делимым распределением. Если и - распределены по и имеют и степеней свободы соответственно, то их сумма также будет распределена по и иметь степеней свободы.

Является частным случаем (а следовательно, распределением типа III) и обобщением . Отношение величин, распределенных по распределено по .

На распределении основан критерий согласия Пирсона. с помощью этого критерия можно проверять достоверность принадлежности выборки случайной величины некоторому теоретическому распределению.

Предположим, что у нас имеется выборка некоторой случайной величины . На основании этой выборки рассчитаем вероятности попадания значений в интервалов (). Пусть также есть предположение об аналитическом выражении распределения, в соответствие с которым, вероятности попадания в выбранные интервалы должны составлять . Тогда величины будут распределены по нормальному закону.

Приведем к стандартному нормальному распределению: ,
где и .

Полученные величины имеют нормальное распределение с параметрами (0, 1), а следовательно, сумма их квадратов распределена по с степенью свободы. Снижение степени свободы связано с дополнительным ограничением на сумму вероятностей попадания значений в интервалы: она должна быть равна 1.

Сравнивая значение с квантилями распределения можно принять или отклонить гипотезу о теоретическом распределении данных с требуемым уровнем значимости.

Распределение Стьюдента используется для проведения t-теста: теста на равенство матожидания выборки распределённых случайных величин некоторому значению, либо равенства матожиданий двух выборок с одинаковой дисперсией (равенство дисперсий необходимо проверять ). Распределение Стьюдента описывает отношение распределённой случайной величины к величине, распределённой по .

Пусть и независимые случайные величины, имеющие со степенями свободы и соответственно. Тогда величина будет иметь распределение Фишера со степенями свободы , а величина - распределение Фишера со степенями свободы .
Распределение Фишера определено для действительных неотрицательных аргументов и имеет плотность вероятности:

Матожидание и дисперсия распределения Фишера:

Матожидание определено для , а диспересия - для .

На распределении Фишера основан ряд статистических тестов, таких как оценка значимости параметров регрессии, тест на гетероскедастичность и тест на равенство дисперсий выборок (f-тест, следует отличать от точного теста Фишера).

F-тест: пусть имеются две независимые выборки и распределенных данных объёмами и соответственно. Выдвинем гипотезу о равенстве дисперсий выборок и проверим её статистически.

Рассчитаем величину . Она будет иметь распределение Фишера со степенями свободы .

Сравнивая значение с квантилями соответствующего распределения Фишера, мы можем принять или отклонить гипотезу о равенстве дисперсий выборок с требуемым уровнем значимости.

Экспоненциальное (показательное) распределение и распределение Лапласа (двойное экспоненциальное, двойное показательное)

(взято отсюда)

Экспоненциальное распределение описывает интервалы времени между независимыми событиями, происходящими со средней интенсивностью . Количество наступлений такого события за некоторый отрезок времени описывается дискретным . Экспоненциальное распределение вместе с составляют математическую основу теории надёжности.

Кроме теории надёжности, экспоненциальное распределение применяется в описании социальных явлений, в экономике, в теории массового обслуживания, в транспортной логистике - везде, где необходимо моделировать поток событий.

Экспоненциальное распределение является частным случаем (для n=2), а следовательно, и . Так-как экспоненциально распределённая величина является величиной хи-квадрат с 2-мя степенями свободы, то она может быть интерпретирована как сумма квадратов двух независимых нормально распределенных величин.

Кроме того, экспоненциальное распределение является честным случаем

Рассмотрим Биномиальное распределение, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL БИНОМ.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения p, математического ожидания распределения и стандартного отклонения. Также рассмотрим распределение Бернулли.

Определение . Пусть проводятся n испытаний, в каждом из которых может произойти только 2 события: событие «успех» с вероятностью p или событие «неудача» с вероятностью q =1-p (так называемая Схема Бернулли, Bernoulli trials ).

Вероятность получения ровно x успехов в этих n испытаниях равна:

Количество успехов в выборке x является случайной величиной, которая имеет Биномиальное распределение (англ. Binomial distribution ) p и n – являются параметрами этого распределения.

Напомним, что для применения схемы Бернулли и соответственно Биномиального распределения, должны быть выполнены следующие условия:

каждое испытание должно иметь ровно два исхода, условно называемых «успехом» и «неудачей».
результат каждого испытания не должен зависеть от результатов предыдущих испытаний (независимость испытаний).
вероятность успеха p должна быть постоянной для всех испытаний.

Биномиальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Биномиального распределения имеется функция БИНОМ.РАСП() , английское название - BINOM.DIST(), которая позволяет вычислить вероятность того, что в выборке будет ровно х «успехов» (т.е. функцию плотности вероятности p(x), см. формулу выше), и интегральную функцию распределения (вероятность того, что в выборке будет x или меньше «успехов», включая 0).

До MS EXCEL 2010 в EXCEL была функция БИНОМРАСП() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). БИНОМРАСП() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и .

Биномиальное распределения имеет обозначение B (n ; p ) .

Примечание : Для построения интегральной функции распределения идеально подходит диаграмма типа График , для плотности распределения – Гистограмма с группировкой . Подробнее о построении диаграмм читайте статью Основные типы диаграмм.

Примечание : Для удобства написания формул в файле примера созданы Имена для параметров Биномиального распределения : n и p.

В файле примера приведены различные расчеты вероятности с помощью функций MS EXCEL:

Как видно на картинке выше, предполагается, что:

В бесконечной совокупности, из которой делается выборка, содержится 10% (или 0,1) годных элементов (параметр p , третий аргумент функции =БИНОМ.РАСП() )
Чтобы вычислить вероятность, того что в выборке из 10 элементов (параметр n , второй аргумент функции) будет ровно 5 годных элементов (первый аргумент), нужно записать формулу: =БИНОМ.РАСП(5; 10; 0,1; ЛОЖЬ)
Последний, четвертый элемент, установлен =ЛОЖЬ, т.е. возвращается значение функции плотности распределения .

Если значение четвертого аргумента =ИСТИНА, то функция БИНОМ.РАСП() возвращает значение интегральной функции распределения или просто Функцию распределения . В этом случае можно рассчитать вероятность того, что в выборке количество годных элементов будет из определенного диапазона, например, 2 или меньше (включая 0).

Для этого нужно записать формулу:
= БИНОМ.РАСП(2; 10; 0,1; ИСТИНА)

Примечание : При нецелом значении х, . Например, следующие формулы вернут одно и тоже значение:
=БИНОМ.РАСП(2 ; 10; 0,1; ИСТИНА)
=БИНОМ.РАСП(2,9 ; 10; 0,1; ИСТИНА)

Примечание : В файле примера плотность вероятности и функция распределения также вычислены с использованием определения и функции ЧИСЛКОМБ() .

Показатели распределения

В файле примера на листе Пример имеются формулы для расчета некоторых показателей распределения:

=n*p;
(квадрата стандартного отклонения) = n*p*(1-p);
= (n+1)*p;
=(1-2*p)*КОРЕНЬ(n*p*(1-p)).

Выведем формулу математического ожидания Биномиального распределения , используя Схему Бернулли .

По определению случайная величина Х в схеме Бернулли (Bernoulli random variable) имеет функцию распределения :

Это распределение называется распределение Бернулли .

Примечание : распределение Бернулли – частный случай Биномиального распределения с параметром n=1.

Сгенерируем 3 массива по 100 чисел с различными вероятностями успеха: 0,1; 0,5 и 0,9. Для этого в окне Генерация случайных чисел установим следующие параметры для каждой вероятности p:

Примечание : Если установить опцию Случайное рассеивание (Random Seed ), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию =25 можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами .

В итоге будем иметь 3 столбца по 100 чисел, на основании которых можно, например, оценить вероятность успеха p по формуле: Число успехов/100 (см. файл примера лист ГенерацияБернулли ).

Примечание : Для распределения Бернулли с p=0,5 можно использовать формулу =СЛУЧМЕЖДУ(0;1) , которая соответствует .

Генерация случайных чисел. Биномиальное распределение

Предположим, что в выборке обнаружилось 7 дефектных изделий. Это означает, что «очень вероятна» ситуация, что изменилась доля дефектных изделий p , которая является характеристикой нашего производственного процесса. Хотя такая ситуация «очень вероятна», но существует вероятность (альфа-риск, ошибка 1-го рода, «ложная тревога»), что все же p осталась без изменений, а увеличенное количество дефектных изделий обусловлено случайностью выборки.

Как видно на рисунке ниже, 7 – количество дефектных изделий, которое допустимо для процесса с p=0,21 при том же значении Альфа . Это служит иллюстрацией, что при превышении порогового значения дефектных изделий в выборке, p «скорее всего» увеличилось. Фраза «скорее всего» означает, что существует всего лишь 10% вероятность (100%-90%) того, что отклонение доли дефектных изделий выше порогового вызвано только сучайными причинами.

Таким образом, превышение порогового количества дефектных изделий в выборке, может служить сигналом, что процесс расстроился и стал выпускать бо льший процент бракованных изделий.

Примечание : До MS EXCEL 2010 в EXCEL была функция КРИТБИНОМ() , которая эквивалентна БИНОМ.ОБР() . КРИТБИНОМ() оставлена в MS EXCEL 2010 и выше для совместимости.

Связь Биномиального распределения с другими распределениями

Если параметр n Биномиального распределения стремится к бесконечности, а p стремится к 0, то в этом случае Биномиальное распределение может быть аппроксимировано .
Можно сформулировать условия, когда приближение распределением Пуассона работает хорошо:

p <0,1 (чем меньше p и больше n , тем приближение точнее);
p >0,9 (учитывая, что q =1- p , вычисления в этом случае необходимо производить через q (а х нужно заменить на n - x ). Следовательно, чем меньше q и больше n , тем приближение точнее).

При 0,1<=p<=0,9 и n*p>10 Биномиальное распределение можно аппроксимировать .

В свою очередь, Биномиальное распределение может служить хорошим приближением , когда размер совокупности N Гипергеометрического распределения гораздо больше размера выборки n (т.е., N>>n или n/N<<1).

Подробнее о связи вышеуказанных распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .