Обновлено: 25 апреля 2026 г.

Дисперсию случайной величины X: формулы и примеры

Если в условии задачи требуется «найти дисперсию случайной величины X», это почти всегда значит одно и то же: вычислить средний квадрат отклонений значений от их математического ожидания. Ниже – формулы, пошаговый алгоритм и наглядный пример.

Как найти дисперсию случайной величины X

Формально дисперсией случайной величины X с математическим ожиданием μ = E[X] называют величину

D[X] = E[(X − μ)²]
или, что эквивалентно,
D[X] = E[X²] − (E[X])².wikipedia.org

Практический алгоритм расчёта:

Найти математическое ожидание X.
Для каждого возможного значения xᵢ вычислить отклонение (xᵢ − μ) и его квадрат (xᵢ − μ)².
Усреднить квадраты отклонений:
- для дискретной X – с весами pᵢ (вероятностями);
- для непрерывной X – через интеграл с плотностью f(x);
- для выборки – как среднее по наблюдениям.

Для дискретной случайной величины X, принимающей значения x₁,…,xₙ с вероятностями p₁,…,pₙ:

математическое ожидание:
E[X] = Σ pᵢ xᵢ;
дисперсия:
D[X] = Σ pᵢ (xᵢ − E[X])².

Для выборки из n наблюдений x₁,…,xₙ:

выборочное среднее:
x̄ = (1 / n) Σ xᵢ;
смещённая выборочная дисперсия:
s² = (1 / n) Σ (xᵢ − x̄)²;
исправленная (несмещённая) выборочная дисперсия:
s²ₙ₋₁ = (1 / (n − 1)) Σ (xᵢ − x̄)².wikipedia.org, hexlet.io

Тип данных Дискретная случайная величина (Значения и вероятности) Выборка данных (Набор чисел)

Дискретная распределенность: Введите возможные значения $x_i$ и их вероятности $p_i$. Сумма вероятностей должна равняться 1.

Результаты расчета

Дисперсия ($D[X]$)

Стандартное отклонение ($\sigma$)

Мат. ожидание ($E[X]$)

Детальный расчет

Значение ($x_i$)	Вер. / Частота ($p_i$)	Отклонение ($x_i - \mu$)	Квадрат откл. ($(x_i - \mu)^2$)	Взвешенный вклад

Формулы, использованные в расчете

Дисперсия: $D[X] = \sum p_i \cdot (x_i - E[X])^2$

Калькулятор выше автоматизирует эти шаги: по набору значений X и вероятностей (или по выборке) он сначала находит среднее, затем квадраты отклонений и их среднее значение – теоретическую или выборочную дисперсию.

Что такое дисперсия случайной величины X простыми словами

Интуитивно дисперсия показывает «разброс» значений случайной величины X вокруг её среднего.

Если рассматривать, например, рост людей или результаты экзамена:

небольшая дисперсия – почти все значения близки к среднему, группа однородная;
большая дисперсия – данные сильно различаются, встречаются как очень малые, так и очень большие значения.

Два набора чисел могут иметь одинаковое среднее, но совершенно разную дисперсию. Поэтому одного среднего значения часто недостаточно, и к нему добавляют меру разброса – дисперсию или стандартное отклонение.hexlet.io

Формулы дисперсии: дискретная, непрерывная и выборочная

Общее определение через математическое ожидание

Пусть X – числовая случайная величина на некотором вероятностном пространстве. Тогда

определение:
D[X] = E[(X − E[X])²];
вычислительная формула (удобна в задачах):
D[X] = E[X²] − (E[X])².wikipedia.org

Дисперсия – это второй центральный момент распределения (первый центральный момент равен нулю).

Дисперсия дискретной случайной величины X

Если X принимает значения x₁,…,xₙ с вероятностями p₁,…,pₙ, причём Σ pᵢ = 1, то

математическое ожидание:
E[X] = Σ pᵢ xᵢ;
дисперсия:
D[X] = Σ pᵢ (xᵢ − E[X])².

Эквивалентная форма:

D[X] = Σ pᵢ xᵢ² − (E[X])².

Существует также симметричная формула через попарные разности значений:

D[X] = (1 / 2) Σᵢ Σⱼ pᵢ pⱼ (xᵢ − xⱼ)².wikipedia.org

Она полезна, когда удобнее оперировать попарными различиями между возможными значениями X.

Дисперсия непрерывной случайной величины

Если X – непрерывная случайная величина с плотностью вероятности f(x), то

математическое ожидание:
E[X] = ∫_{−∞}^{+∞} x f(x) dx;
дисперсия:
D[X] = ∫_{−∞}^{+∞} (x − E[X])² f(x) dx.

Используя вычислительную форму:

D[X] = ∫ x² f(x) dx − (E[X])².

Дисперсия может быть бесконечной: если интеграл от x² f(x) не сходится, дисперсия не существует.wikipedia.org

Пример: для равномерного распределения X ~ U(0,1) можно показать, что E[X] = 1/2, E[X²] = 1/3, и поэтому D[X] = 1/3 − (1/2)² = 1/12.wikipedia.org

Выборочная и исправленная дисперсия

В реальных задачах известен не закон распределения, а лишь выборка X₁,…,Xₙ. Тогда используют выборочную дисперсию:

смещённая оценка дисперсии:
s² = (1 / n) Σ (Xᵢ − X̄)²,
где X̄ = (1 / n) Σ Xᵢ – выборочное среднее;
несмещённая (исправленная) оценка:
s²ₙ₋₁ = (1 / (n − 1)) Σ (Xᵢ − X̄)².wikipedia.org, hexlet.io

Деление на n − 1 связано с степенями свободы: одно ограничение накладывается выборочным средним, поэтому для оценки разброса остаётся только n − 1 независимых отклонений.

Свойства дисперсии случайной величины X

Основные свойства дисперсии:wikipedia.org, hexlet.io

Неотрицательность: D[X] ≥ 0. Дисперсия равна нулю только если X почти наверняка равна константе.
Сдвиг: D[C + X] = D[X] для любой константы C. Добавление константы не меняет разброс.
Масштабирование: D[C·X] = C² D[X]. Умножение X на 2 увеличивает дисперсию в 4 раза и т.д.
Ковариация: дисперсия – частный случай ковариации: D[X] = cov(X, X).

Для суммы двух случайных величин:

D[X + Y] = D[X] + D[Y] + 2 cov(X, Y).

Для линейной комбинации X₁,…,Xₙ:

D[Σ cᵢ Xᵢ] = Σᵢ Σⱼ cᵢ cⱼ cov(Xᵢ, Xⱼ).

Если Xᵢ – попарно независимы (или некоррелированы), ковариации равны нулю, и

D[X₁ + … + Xₙ] = D[X₁] + … + D[Xₙ],
D[X₁ − … − Xₙ] = D[X₁] + … + D[Xₙ].

Связь с условной дисперсией

В теории случайных процессов используют условную дисперсию D[X | Y]:

D[X | Y] = E[(X − E[X | Y])² | Y].

Справедливо разложение

D[X] = E[D[X | Y]] + D(E[X | Y]).

Из него следует, что дисперсия условного математического ожидания E[X | Y] не превышает дисперсию самой X.wikipedia.org

Неравенство Чебышёва и связь с вероятностями

Из неравенства Чебышёва следует оценка вероятности больших отклонений:wikipedia.org

P(|X − E[X]| ≥ kσ) ≤ 1 / k², где σ = √D[X].

Для нормального распределения оценки можно усилить: не менее 95 % значений лежат в пределах двух стандартных отклонений от среднего, около 99,7 % – в пределах трёх.

Пример расчёта дисперсии случайной величины X

Теоретический пример для дискретной X

Пусть X принимает значения 1, 2 и 3 с вероятностями 0,2; 0,5 и 0,3 соответственно. Требуется найти D[X].

Математическое ожидание:
E[X] = 1·0,2 + 2·0,5 + 3·0,3 = 0,2 + 1 + 0,9 = 2,1.
Квадраты отклонений:
- для 1: (1 − 2,1)² = 1,21;
- для 2: (2 − 2,1)² = 0,01;
- для 3: (3 − 2,1)² = 0,81.
Дисперсия:
D[X] = 0,2·1,21 + 0,5·0,01 + 0,3·0,81 = 0,242 + 0,005 + 0,243 = 0,49.

Проверим по вычислительной формуле:

E[X²] = 1²·0,2 + 2²·0,5 + 3²·0,3 = 0,2 + 2 + 2,7 = 4,9;
D[X] = E[X²] − (E[X])² = 4,9 − 2,1² = 4,9 − 4,41 = 0,49.

Стандартное отклонение σ = √0,49 = 0,7.

Как считать по выборке

Если у нас есть только выборка X₁,…,Xₙ, а не вероятности, шаги аналогичны:

Найти выборочное среднее X̄.
Для каждого наблюдения посчитать (Xᵢ − X̄)².
Сложить квадраты отклонений.
Разделить сумму на n (смещённая дисперсия) или на n − 1 (несмещённая).

Фактически здесь pᵢ заменяются частотами 1/n.

Интерпретация дисперсии, стандартное отклонение и другие меры разброса

Квадратный корень из дисперсии σ = √D[X] называют стандартным отклонением (или стандартным разбросом).wikipedia.org

Дисперсия измеряется в квадрате единиц X (например, м², руб²).
Стандартное отклонение – в тех же единицах, что и X (метры, рубли), поэтому его проще интерпретировать.

При анализе данных часто используют и другие показатели разброса:hexlet.io

Межквартильный размах (IQR) – разность между 75‑м и 25‑м процентилями; показывает ширину «средней» половины данных и устойчив к выбросам.
Среднее абсолютное отклонение (MAD):
MAD = (1 / n) Σ |xᵢ − x̄| – менее чувствительно к экстремальным значениям, чем дисперсия.

Визуализация разброса

Для наглядного понимания величины дисперсии используют:

гистограммы – широкий разброс столбцов соответствует большой дисперсии;
box‑plot («ящик с усами») – чем длиннее коробка и «усы», тем выше вариативность;
диаграммы рассеяния – плотное облако точек означает малую дисперсию, широкое – большую.

Где применяется дисперсия случайной величины X

Дисперсия – базовый инструмент статистики и анализа данных.hexlet.io

Ключевые области применения:

Статистика: оценка надёжности измерений, построение доверительных интервалов, проверка гипотез (t‑тесты, F‑тесты, дисперсионный анализ).
Машинное обучение: анализ ошибки моделей, критерии разбиения в деревьях регрессии, регуляризация и выбор моделей.
Финансы: оценка риска по дисперсии (или стандартному отклонению) доходностей активов; чем выше дисперсия, тем менее предсказуемы результаты.
Инженерия и качество: контроль стабильности технологических процессов, оценка разброса параметров продукции.

Термин «дисперсия» (dispersion – рассеяние) был введён Рональдом Фишером в 1918 году и с тех пор стал одной из центральных характеристик случайных величин в теории вероятностей и статистике.wikipedia.org, hexlet.io

Часто задаваемые вопросы

Как по формуле вычислить дисперсию случайной величины X?

Сначала находят математическое ожидание X, затем для каждого возможного значения вычисляют отклонение от среднего, возводят его в квадрат и берут среднее этих квадратов. Для дискретной величины используют сумму pᵢ(xᵢ − μ)², для непрерывной – интеграл (x − μ)²f(x)dx. Для выборки вместо pᵢ берут относительные частоты.

Чем отличается теоретическая дисперсия от выборочной?

Теоретическая дисперсия описывает весь закон распределения случайной величины X и задаётся через математическое ожидание квадрата отклонения. Выборочная дисперсия считается по конечному набору наблюдений и является оценкой теоретической; её вычисляют по формулам с делением на n или n − 1, чтобы приблизиться к истинному значению.

Почему в исправленной выборочной дисперсии делят на n − 1, а не на n?

При вычислении выборочной дисперсии среднее уже подобрано по этим же данным, и разброс относительно него получается систематически заниженным. Деление на n даёт смещённую оценку. Деление на n − 1 компенсирует это смещение: такая дисперсия в среднем совпадает с истинной генеральной дисперсией при повторных выборках.

Что показывает дисперсия случайной величины X в задачах по теории вероятностей?

Дисперсия характеризует, насколько сильно возможные значения X в среднем отклоняются от своего математического ожидания. Небольшая дисперсия означает, что значения плотно сосредоточены вокруг среднего; большая – что распределение «растянуто», и вероятность значительных отклонений выше. В задачах это помогает сравнивать устойчивость разных случайных величин.

Можно ли по дисперсии судить о нормальности распределения?

Одна только дисперсия не позволяет сделать вывод о нормальности распределения. Две разные модели могут иметь одинаковые среднее и дисперсию, но совершенно разную форму плотности. Для проверки нормальности используют дополнительные инструменты: графики (Q–Q‑плот, гистограммы), критерии согласия и анализ асимметрии с эксцессом.

Когда достаточно знать стандартное отклонение вместо дисперсии?

Стандартное отклонение – корень из дисперсии – измеряется в тех же единицах, что и сама случайная величина, поэтому его легче интерпретировать. В прикладных задачах (оценка точности измерений, волатильности, разброса результатов экспериментов) обычно оперируют именно стандартным отклонением, а дисперсию используют как удобную математическую форму в формулах и выводах.