Это видео
про дискретные случайные величины.
Мы разберемся,
что это такое и рассмотрим 3 самых популярных дискретных распределения.
Чтобы лучше понимать дискретную случайную величину,
давайте вернемся к примеру с подбрасыванием кубика.
Это испытание, у которого может быть только 6 исходов.
Перенумеруем эти исходы согласно тому, что выпадает на кубике,
и поставим этому множеству исходов в соответствие вектор вероятностей длины 6.
Все эти вероятности неотрицательны, и в сумме они дают единицу.
Именно так устроена дискретная случайная величина.
Она принимает значение из счетного множества A (множество называется счетным,
если его элементы можно перенумеровать), и вероятность того,
что X будет равно aᵢ равна pᵢ.
Все pᵢ неотрицательны и в сумме дают единицу.
Прекрасно.
Одна из наиболее популярных дискретных случайных величин
— это дискретная случайная величина с двумя исходами.
Представьте, что вы подбрасываете монетку.
Будем называть выпадение решки успехом и обозначать за единицу,
выпадение орла, соответственно, неуспехом и обозначать за 0.
Пусть вероятность успеха равна p.
Поскольку исходов всего два, то вероятность неудачи равна 1 − p.
Именно так устроена бернуллиевская случайная величина.
Она имеет единственный параметр p, который принимает значение от 0 до 1.
Следующий пример — это случайная величина,
являющаяся суммой независимых бинарных случайных величин.
Представьте, что вы бросаете мяч в баскетбольное кольцо.
И пусть вероятность попадания равна p.
Если вы это делаете так же плохо, как я, то возможно p = 0,2.
Пусть у вас есть n попыток, и X — это число попаданий.
Поскольку все попытки независимы, вероятность, например, того,
что вы попадете в кольцо ровно n раз, равна p в степени n.
Вероятность того, что за n попыток вы ровно k раз попадете в кольцо,
равна произведению Cnpk (1 − p) в степени n − k.
Cnpk, напомню, это биномиальный коэффициент,
равный отношению факториалов n, k и n − k.
Такая случайная величина x называется биномиальной.
Биномиальное распределение имеет два параметра: n целочисленный и p от 0 до 1.
Наконец, следующий класс дискретных случайных величин — это счетчики.
Возьмем произвольный текст на русском языке.
Например, текст романа Набокова «Приглашение на казнь».
Составим словарь из всех произведений Набокова и пройдемся с этим
словарем по тексту романа,
посчитаем, сколько раз каждое слово из словаря встречается в романе.
Некоторые слова не встречаются ни разу, например, «шахматист» или «родина».
Есть слова, которые встречаются редко.
Например, слово «аляповатость» встречается в романе 1 раз.
Есть слова, которые встречаются очень часто.
Например, слово «год» и все его словоформы встречается 21 раз.
Неудивительно, «год» — это самое популярное существительное в
русском языке.
Пусть X — это число использований слова в тексте.
Каким распределением можно описать эту случайную величину?
Чему равна вероятность того, что X равно k?
Оказывается, что эту вероятность можно неплохо описывать распределением Пуассона.
Это распределение с единственным параметром лямбда,
это параметр неотрицательный.
И меняя значение параметра, можно описывать огромный класс событий,
связанных с подсчетом чего-либо.
Например, распределением Пуассона очень хорошо описывается число автобусов,
которые проходят за час мимо автобусной остановки.
Или число изюма в булочках с изюмом.
Или число радиоактивных распадов, которые улавливает счетчик Гейгера.
Итак, в этом видео мы поговорили про дискретные случайные величины,
дали определение дискретной случайной величины и рассмотрели 3 наиболее
часто встречающихся распределения — это бернуллиевское, Пуассона и биномиальное.
В следующем видео мы поговорим про непрерывные случайные величины.