Обновлено:
Дисперсию случайной величины X: формулы и примеры
Если в условии задачи требуется «найти дисперсию случайной величины X», это почти всегда значит одно и то же: вычислить средний квадрат отклонений значений от их математического ожидания. Ниже – формулы, пошаговый алгоритм и наглядный пример.
Как найти дисперсию случайной величины X
Формально дисперсией случайной величины X с математическим ожиданием μ = E[X] называют величину
D[X] = E[(X − μ)²]
или, что эквивалентно,D[X] = E[X²] − (E[X])².wikipedia.org
Практический алгоритм расчёта:
- Найти математическое ожидание X.
- Для каждого возможного значения xᵢ вычислить отклонение (xᵢ − μ) и его квадрат (xᵢ − μ)².
- Усреднить квадраты отклонений:
- для дискретной X – с весами pᵢ (вероятностями);
- для непрерывной X – через интеграл с плотностью f(x);
- для выборки – как среднее по наблюдениям.
Для дискретной случайной величины X, принимающей значения x₁,…,xₙ с вероятностями p₁,…,pₙ:
- математическое ожидание:
E[X] = Σ pᵢ xᵢ; - дисперсия:
D[X] = Σ pᵢ (xᵢ − E[X])².
Для выборки из n наблюдений x₁,…,xₙ:
- выборочное среднее:
x̄ = (1 / n) Σ xᵢ; - смещённая выборочная дисперсия:
s² = (1 / n) Σ (xᵢ − x̄)²; - исправленная (несмещённая) выборочная дисперсия:
s²ₙ₋₁ = (1 / (n − 1)) Σ (xᵢ − x̄)².wikipedia.org, hexlet.io
Калькулятор выше автоматизирует эти шаги: по набору значений X и вероятностей (или по выборке) он сначала находит среднее, затем квадраты отклонений и их среднее значение – теоретическую или выборочную дисперсию.
Что такое дисперсия случайной величины X простыми словами
Интуитивно дисперсия показывает «разброс» значений случайной величины X вокруг её среднего.
Если рассматривать, например, рост людей или результаты экзамена:
- небольшая дисперсия – почти все значения близки к среднему, группа однородная;
- большая дисперсия – данные сильно различаются, встречаются как очень малые, так и очень большие значения.
Два набора чисел могут иметь одинаковое среднее, но совершенно разную дисперсию. Поэтому одного среднего значения часто недостаточно, и к нему добавляют меру разброса – дисперсию или стандартное отклонение.hexlet.io
Формулы дисперсии: дискретная, непрерывная и выборочная
Общее определение через математическое ожидание
Пусть X – числовая случайная величина на некотором вероятностном пространстве. Тогда
- определение:
D[X] = E[(X − E[X])²]; - вычислительная формула (удобна в задачах):
D[X] = E[X²] − (E[X])².wikipedia.org
Дисперсия – это второй центральный момент распределения (первый центральный момент равен нулю).
Дисперсия дискретной случайной величины X
Если X принимает значения x₁,…,xₙ с вероятностями p₁,…,pₙ, причём Σ pᵢ = 1, то
- математическое ожидание:
E[X] = Σ pᵢ xᵢ; - дисперсия:
D[X] = Σ pᵢ (xᵢ − E[X])².
Эквивалентная форма:
D[X] = Σ pᵢ xᵢ² − (E[X])².
Существует также симметричная формула через попарные разности значений:
D[X] = (1 / 2) Σᵢ Σⱼ pᵢ pⱼ (xᵢ − xⱼ)².wikipedia.org
Она полезна, когда удобнее оперировать попарными различиями между возможными значениями X.
Дисперсия непрерывной случайной величины
Если X – непрерывная случайная величина с плотностью вероятности f(x), то
- математическое ожидание:
E[X] = ∫_{−∞}^{+∞} x f(x) dx; - дисперсия:
D[X] = ∫_{−∞}^{+∞} (x − E[X])² f(x) dx.
Используя вычислительную форму:
D[X] = ∫ x² f(x) dx − (E[X])².
Дисперсия может быть бесконечной: если интеграл от x² f(x) не сходится, дисперсия не существует.wikipedia.org
Пример: для равномерного распределения X ~ U(0,1) можно показать, что E[X] = 1/2, E[X²] = 1/3, и поэтому D[X] = 1/3 − (1/2)² = 1/12.wikipedia.org
Выборочная и исправленная дисперсия
В реальных задачах известен не закон распределения, а лишь выборка X₁,…,Xₙ. Тогда используют выборочную дисперсию:
смещённая оценка дисперсии:
s² = (1 / n) Σ (Xᵢ − X̄)²,
гдеX̄ = (1 / n) Σ Xᵢ– выборочное среднее;несмещённая (исправленная) оценка:
s²ₙ₋₁ = (1 / (n − 1)) Σ (Xᵢ − X̄)².wikipedia.org, hexlet.io
Деление на n − 1 связано с степенями свободы: одно ограничение накладывается выборочным средним, поэтому для оценки разброса остаётся только n − 1 независимых отклонений.
Свойства дисперсии случайной величины X
Основные свойства дисперсии:wikipedia.org, hexlet.io
- Неотрицательность:
D[X] ≥ 0. Дисперсия равна нулю только если X почти наверняка равна константе. - Сдвиг:
D[C + X] = D[X]для любой константы C. Добавление константы не меняет разброс. - Масштабирование:
D[C·X] = C² D[X]. Умножение X на 2 увеличивает дисперсию в 4 раза и т.д. - Ковариация: дисперсия – частный случай ковариации:
D[X] = cov(X, X).
Для суммы двух случайных величин:
D[X + Y] = D[X] + D[Y] + 2 cov(X, Y).
Для линейной комбинации X₁,…,Xₙ:
D[Σ cᵢ Xᵢ] = Σᵢ Σⱼ cᵢ cⱼ cov(Xᵢ, Xⱼ).
Если Xᵢ – попарно независимы (или некоррелированы), ковариации равны нулю, и
D[X₁ + … + Xₙ] = D[X₁] + … + D[Xₙ],D[X₁ − … − Xₙ] = D[X₁] + … + D[Xₙ].
Связь с условной дисперсией
В теории случайных процессов используют условную дисперсию D[X | Y]:
D[X | Y] = E[(X − E[X | Y])² | Y].
Справедливо разложение
D[X] = E[D[X | Y]] + D(E[X | Y]).
Из него следует, что дисперсия условного математического ожидания E[X | Y] не превышает дисперсию самой X.wikipedia.org
Неравенство Чебышёва и связь с вероятностями
Из неравенства Чебышёва следует оценка вероятности больших отклонений:wikipedia.org
P(|X − E[X]| ≥ kσ) ≤ 1 / k², где σ = √D[X].
Для нормального распределения оценки можно усилить: не менее 95 % значений лежат в пределах двух стандартных отклонений от среднего, около 99,7 % – в пределах трёх.
Пример расчёта дисперсии случайной величины X
Теоретический пример для дискретной X
Пусть X принимает значения 1, 2 и 3 с вероятностями 0,2; 0,5 и 0,3 соответственно. Требуется найти D[X].
Математическое ожидание:
E[X] = 1·0,2 + 2·0,5 + 3·0,3 = 0,2 + 1 + 0,9 = 2,1.Квадраты отклонений:
- для 1: (1 − 2,1)² = 1,21;
- для 2: (2 − 2,1)² = 0,01;
- для 3: (3 − 2,1)² = 0,81.
Дисперсия:
D[X] = 0,2·1,21 + 0,5·0,01 + 0,3·0,81 = 0,242 + 0,005 + 0,243 = 0,49.
Проверим по вычислительной формуле:
E[X²] = 1²·0,2 + 2²·0,5 + 3²·0,3 = 0,2 + 2 + 2,7 = 4,9;D[X] = E[X²] − (E[X])² = 4,9 − 2,1² = 4,9 − 4,41 = 0,49.
Стандартное отклонение σ = √0,49 = 0,7.
Как считать по выборке
Если у нас есть только выборка X₁,…,Xₙ, а не вероятности, шаги аналогичны:
- Найти выборочное среднее X̄.
- Для каждого наблюдения посчитать (Xᵢ − X̄)².
- Сложить квадраты отклонений.
- Разделить сумму на n (смещённая дисперсия) или на n − 1 (несмещённая).
Фактически здесь pᵢ заменяются частотами 1/n.
Интерпретация дисперсии, стандартное отклонение и другие меры разброса
Квадратный корень из дисперсии σ = √D[X] называют стандартным отклонением (или стандартным разбросом).wikipedia.org
- Дисперсия измеряется в квадрате единиц X (например, м², руб²).
- Стандартное отклонение – в тех же единицах, что и X (метры, рубли), поэтому его проще интерпретировать.
При анализе данных часто используют и другие показатели разброса:hexlet.io
- Межквартильный размах (IQR) – разность между 75‑м и 25‑м процентилями; показывает ширину «средней» половины данных и устойчив к выбросам.
- Среднее абсолютное отклонение (MAD):
MAD = (1 / n) Σ |xᵢ − x̄|– менее чувствительно к экстремальным значениям, чем дисперсия.
Визуализация разброса
Для наглядного понимания величины дисперсии используют:
- гистограммы – широкий разброс столбцов соответствует большой дисперсии;
- box‑plot («ящик с усами») – чем длиннее коробка и «усы», тем выше вариативность;
- диаграммы рассеяния – плотное облако точек означает малую дисперсию, широкое – большую.
Где применяется дисперсия случайной величины X
Дисперсия – базовый инструмент статистики и анализа данных.hexlet.io
Ключевые области применения:
- Статистика: оценка надёжности измерений, построение доверительных интервалов, проверка гипотез (t‑тесты, F‑тесты, дисперсионный анализ).
- Машинное обучение: анализ ошибки моделей, критерии разбиения в деревьях регрессии, регуляризация и выбор моделей.
- Финансы: оценка риска по дисперсии (или стандартному отклонению) доходностей активов; чем выше дисперсия, тем менее предсказуемы результаты.
- Инженерия и качество: контроль стабильности технологических процессов, оценка разброса параметров продукции.
Термин «дисперсия» (dispersion – рассеяние) был введён Рональдом Фишером в 1918 году и с тех пор стал одной из центральных характеристик случайных величин в теории вероятностей и статистике.wikipedia.org, hexlet.io
Часто задаваемые вопросы
Как по формуле вычислить дисперсию случайной величины X?
Сначала находят математическое ожидание X, затем для каждого возможного значения вычисляют отклонение от среднего, возводят его в квадрат и берут среднее этих квадратов. Для дискретной величины используют сумму pᵢ(xᵢ − μ)², для непрерывной – интеграл (x − μ)²f(x)dx. Для выборки вместо pᵢ берут относительные частоты.
Чем отличается теоретическая дисперсия от выборочной?
Теоретическая дисперсия описывает весь закон распределения случайной величины X и задаётся через математическое ожидание квадрата отклонения. Выборочная дисперсия считается по конечному набору наблюдений и является оценкой теоретической; её вычисляют по формулам с делением на n или n − 1, чтобы приблизиться к истинному значению.
Почему в исправленной выборочной дисперсии делят на n − 1, а не на n?
При вычислении выборочной дисперсии среднее уже подобрано по этим же данным, и разброс относительно него получается систематически заниженным. Деление на n даёт смещённую оценку. Деление на n − 1 компенсирует это смещение: такая дисперсия в среднем совпадает с истинной генеральной дисперсией при повторных выборках.
Что показывает дисперсия случайной величины X в задачах по теории вероятностей?
Дисперсия характеризует, насколько сильно возможные значения X в среднем отклоняются от своего математического ожидания. Небольшая дисперсия означает, что значения плотно сосредоточены вокруг среднего; большая – что распределение «растянуто», и вероятность значительных отклонений выше. В задачах это помогает сравнивать устойчивость разных случайных величин.
Можно ли по дисперсии судить о нормальности распределения?
Одна только дисперсия не позволяет сделать вывод о нормальности распределения. Две разные модели могут иметь одинаковые среднее и дисперсию, но совершенно разную форму плотности. Для проверки нормальности используют дополнительные инструменты: графики (Q–Q‑плот, гистограммы), критерии согласия и анализ асимметрии с эксцессом.
Когда достаточно знать стандартное отклонение вместо дисперсии?
Стандартное отклонение – корень из дисперсии – измеряется в тех же единицах, что и сама случайная величина, поэтому его легче интерпретировать. В прикладных задачах (оценка точности измерений, волатильности, разброса результатов экспериментов) обычно оперируют именно стандартным отклонением, а дисперсию используют как удобную математическую форму в формулах и выводах.
Похожие калькуляторы и статьи
- Дисперсия случайной величины – формула и расчёт
- Таблица распределения случайной величины: что это и как составить
- Калькулятор статистики – онлайн расчёт
- Калькулятор отклонений онлайн – стандартное, среднее, относительное
- Калькулятор вариации онлайн – расчет коэффициента CV
- Калькулятор отклонения онлайн: расчёт стандартного