Обновлено:

Дисперсию случайной величины X: формулы и примеры

Если в условии задачи требуется «найти дисперсию случайной величины X», это почти всегда значит одно и то же: вычислить средний квадрат отклонений значений от их математического ожидания. Ниже – формулы, пошаговый алгоритм и наглядный пример.

Как найти дисперсию случайной величины X

Формально дисперсией случайной величины X с математическим ожиданием μ = E[X] называют величину

D[X] = E[(X − μ)²]
или, что эквивалентно,
D[X] = E[X²] − (E[X])².wikipedia.org

Практический алгоритм расчёта:

  1. Найти математическое ожидание X.
  2. Для каждого возможного значения xᵢ вычислить отклонение (xᵢ − μ) и его квадрат (xᵢ − μ)².
  3. Усреднить квадраты отклонений:
    • для дискретной X – с весами pᵢ (вероятностями);
    • для непрерывной X – через интеграл с плотностью f(x);
    • для выборки – как среднее по наблюдениям.

Для дискретной случайной величины X, принимающей значения x₁,…,xₙ с вероятностями p₁,…,pₙ:

  • математическое ожидание:
    E[X] = Σ pᵢ xᵢ;
  • дисперсия:
    D[X] = Σ pᵢ (xᵢ − E[X])².

Для выборки из n наблюдений x₁,…,xₙ:

  • выборочное среднее:
    x̄ = (1 / n) Σ xᵢ;
  • смещённая выборочная дисперсия:
    s² = (1 / n) Σ (xᵢ − x̄)²;
  • исправленная (несмещённая) выборочная дисперсия:
    s²ₙ₋₁ = (1 / (n − 1)) Σ (xᵢ − x̄)².wikipedia.org, hexlet.io
Тип данных

Дискретная распределенность: Введите возможные значения $x_i$ и их вероятности $p_i$. Сумма вероятностей должна равняться 1.

Калькулятор выше автоматизирует эти шаги: по набору значений X и вероятностей (или по выборке) он сначала находит среднее, затем квадраты отклонений и их среднее значение – теоретическую или выборочную дисперсию.

Что такое дисперсия случайной величины X простыми словами

Интуитивно дисперсия показывает «разброс» значений случайной величины X вокруг её среднего.

Если рассматривать, например, рост людей или результаты экзамена:

  • небольшая дисперсия – почти все значения близки к среднему, группа однородная;
  • большая дисперсия – данные сильно различаются, встречаются как очень малые, так и очень большие значения.

Два набора чисел могут иметь одинаковое среднее, но совершенно разную дисперсию. Поэтому одного среднего значения часто недостаточно, и к нему добавляют меру разброса – дисперсию или стандартное отклонение.hexlet.io

Формулы дисперсии: дискретная, непрерывная и выборочная

Общее определение через математическое ожидание

Пусть X – числовая случайная величина на некотором вероятностном пространстве. Тогда

  • определение:
    D[X] = E[(X − E[X])²];
  • вычислительная формула (удобна в задачах):
    D[X] = E[X²] − (E[X])².wikipedia.org

Дисперсия – это второй центральный момент распределения (первый центральный момент равен нулю).

Дисперсия дискретной случайной величины X

Если X принимает значения x₁,…,xₙ с вероятностями p₁,…,pₙ, причём Σ pᵢ = 1, то

  • математическое ожидание:
    E[X] = Σ pᵢ xᵢ;
  • дисперсия:
    D[X] = Σ pᵢ (xᵢ − E[X])².

Эквивалентная форма:

D[X] = Σ pᵢ xᵢ² − (E[X])².

Существует также симметричная формула через попарные разности значений:

D[X] = (1 / 2) Σᵢ Σⱼ pᵢ pⱼ (xᵢ − xⱼ)².wikipedia.org

Она полезна, когда удобнее оперировать попарными различиями между возможными значениями X.

Дисперсия непрерывной случайной величины

Если X – непрерывная случайная величина с плотностью вероятности f(x), то

  • математическое ожидание:
    E[X] = ∫_{−∞}^{+∞} x f(x) dx;
  • дисперсия:
    D[X] = ∫_{−∞}^{+∞} (x − E[X])² f(x) dx.

Используя вычислительную форму:

D[X] = ∫ x² f(x) dx − (E[X])².

Дисперсия может быть бесконечной: если интеграл от x² f(x) не сходится, дисперсия не существует.wikipedia.org

Пример: для равномерного распределения X ~ U(0,1) можно показать, что E[X] = 1/2, E[X²] = 1/3, и поэтому D[X] = 1/3 − (1/2)² = 1/12.wikipedia.org

Выборочная и исправленная дисперсия

В реальных задачах известен не закон распределения, а лишь выборка X₁,…,Xₙ. Тогда используют выборочную дисперсию:

  • смещённая оценка дисперсии:

    s² = (1 / n) Σ (Xᵢ − X̄)²,
    где X̄ = (1 / n) Σ Xᵢ – выборочное среднее;

  • несмещённая (исправленная) оценка:

    s²ₙ₋₁ = (1 / (n − 1)) Σ (Xᵢ − X̄)².wikipedia.org, hexlet.io

Деление на n − 1 связано с степенями свободы: одно ограничение накладывается выборочным средним, поэтому для оценки разброса остаётся только n − 1 независимых отклонений.

Свойства дисперсии случайной величины X

Основные свойства дисперсии:wikipedia.org, hexlet.io

  • Неотрицательность: D[X] ≥ 0. Дисперсия равна нулю только если X почти наверняка равна константе.
  • Сдвиг: D[C + X] = D[X] для любой константы C. Добавление константы не меняет разброс.
  • Масштабирование: D[C·X] = C² D[X]. Умножение X на 2 увеличивает дисперсию в 4 раза и т.д.
  • Ковариация: дисперсия – частный случай ковариации: D[X] = cov(X, X).

Для суммы двух случайных величин:

  • D[X + Y] = D[X] + D[Y] + 2 cov(X, Y).

Для линейной комбинации X₁,…,Xₙ:

  • D[Σ cᵢ Xᵢ] = Σᵢ Σⱼ cᵢ cⱼ cov(Xᵢ, Xⱼ).

Если Xᵢ – попарно независимы (или некоррелированы), ковариации равны нулю, и

  • D[X₁ + … + Xₙ] = D[X₁] + … + D[Xₙ],
  • D[X₁ − … − Xₙ] = D[X₁] + … + D[Xₙ].

Связь с условной дисперсией

В теории случайных процессов используют условную дисперсию D[X | Y]:

D[X | Y] = E[(X − E[X | Y])² | Y].

Справедливо разложение

D[X] = E[D[X | Y]] + D(E[X | Y]).

Из него следует, что дисперсия условного математического ожидания E[X | Y] не превышает дисперсию самой X.wikipedia.org

Неравенство Чебышёва и связь с вероятностями

Из неравенства Чебышёва следует оценка вероятности больших отклонений:wikipedia.org

P(|X − E[X]| ≥ kσ) ≤ 1 / k², где σ = √D[X].

Для нормального распределения оценки можно усилить: не менее 95 % значений лежат в пределах двух стандартных отклонений от среднего, около 99,7 % – в пределах трёх.

Пример расчёта дисперсии случайной величины X

Теоретический пример для дискретной X

Пусть X принимает значения 1, 2 и 3 с вероятностями 0,2; 0,5 и 0,3 соответственно. Требуется найти D[X].

  1. Математическое ожидание:

    E[X] = 1·0,2 + 2·0,5 + 3·0,3 = 0,2 + 1 + 0,9 = 2,1.

  2. Квадраты отклонений:

    • для 1: (1 − 2,1)² = 1,21;
    • для 2: (2 − 2,1)² = 0,01;
    • для 3: (3 − 2,1)² = 0,81.
  3. Дисперсия:

    D[X] = 0,2·1,21 + 0,5·0,01 + 0,3·0,81 = 0,242 + 0,005 + 0,243 = 0,49.

Проверим по вычислительной формуле:

  • E[X²] = 1²·0,2 + 2²·0,5 + 3²·0,3 = 0,2 + 2 + 2,7 = 4,9;
  • D[X] = E[X²] − (E[X])² = 4,9 − 2,1² = 4,9 − 4,41 = 0,49.

Стандартное отклонение σ = √0,49 = 0,7.

Как считать по выборке

Если у нас есть только выборка X₁,…,Xₙ, а не вероятности, шаги аналогичны:

  1. Найти выборочное среднее X̄.
  2. Для каждого наблюдения посчитать (Xᵢ − X̄)².
  3. Сложить квадраты отклонений.
  4. Разделить сумму на n (смещённая дисперсия) или на n − 1 (несмещённая).

Фактически здесь pᵢ заменяются частотами 1/n.

Интерпретация дисперсии, стандартное отклонение и другие меры разброса

Квадратный корень из дисперсии σ = √D[X] называют стандартным отклонением (или стандартным разбросом).wikipedia.org

  • Дисперсия измеряется в квадрате единиц X (например, м², руб²).
  • Стандартное отклонение – в тех же единицах, что и X (метры, рубли), поэтому его проще интерпретировать.

При анализе данных часто используют и другие показатели разброса:hexlet.io

  • Межквартильный размах (IQR) – разность между 75‑м и 25‑м процентилями; показывает ширину «средней» половины данных и устойчив к выбросам.
  • Среднее абсолютное отклонение (MAD):
    MAD = (1 / n) Σ |xᵢ − x̄| – менее чувствительно к экстремальным значениям, чем дисперсия.

Визуализация разброса

Для наглядного понимания величины дисперсии используют:

  • гистограммы – широкий разброс столбцов соответствует большой дисперсии;
  • box‑plot («ящик с усами») – чем длиннее коробка и «усы», тем выше вариативность;
  • диаграммы рассеяния – плотное облако точек означает малую дисперсию, широкое – большую.

Где применяется дисперсия случайной величины X

Дисперсия – базовый инструмент статистики и анализа данных.hexlet.io

Ключевые области применения:

  • Статистика: оценка надёжности измерений, построение доверительных интервалов, проверка гипотез (t‑тесты, F‑тесты, дисперсионный анализ).
  • Машинное обучение: анализ ошибки моделей, критерии разбиения в деревьях регрессии, регуляризация и выбор моделей.
  • Финансы: оценка риска по дисперсии (или стандартному отклонению) доходностей активов; чем выше дисперсия, тем менее предсказуемы результаты.
  • Инженерия и качество: контроль стабильности технологических процессов, оценка разброса параметров продукции.

Термин «дисперсия» (dispersion – рассеяние) был введён Рональдом Фишером в 1918 году и с тех пор стал одной из центральных характеристик случайных величин в теории вероятностей и статистике.wikipedia.org, hexlet.io

Часто задаваемые вопросы

Как по формуле вычислить дисперсию случайной величины X?

Сначала находят математическое ожидание X, затем для каждого возможного значения вычисляют отклонение от среднего, возводят его в квадрат и берут среднее этих квадратов. Для дискретной величины используют сумму pᵢ(xᵢ − μ)², для непрерывной – интеграл (x − μ)²f(x)dx. Для выборки вместо pᵢ берут относительные частоты.

Чем отличается теоретическая дисперсия от выборочной?

Теоретическая дисперсия описывает весь закон распределения случайной величины X и задаётся через математическое ожидание квадрата отклонения. Выборочная дисперсия считается по конечному набору наблюдений и является оценкой теоретической; её вычисляют по формулам с делением на n или n − 1, чтобы приблизиться к истинному значению.

Почему в исправленной выборочной дисперсии делят на n − 1, а не на n?

При вычислении выборочной дисперсии среднее уже подобрано по этим же данным, и разброс относительно него получается систематически заниженным. Деление на n даёт смещённую оценку. Деление на n − 1 компенсирует это смещение: такая дисперсия в среднем совпадает с истинной генеральной дисперсией при повторных выборках.

Что показывает дисперсия случайной величины X в задачах по теории вероятностей?

Дисперсия характеризует, насколько сильно возможные значения X в среднем отклоняются от своего математического ожидания. Небольшая дисперсия означает, что значения плотно сосредоточены вокруг среднего; большая – что распределение «растянуто», и вероятность значительных отклонений выше. В задачах это помогает сравнивать устойчивость разных случайных величин.

Можно ли по дисперсии судить о нормальности распределения?

Одна только дисперсия не позволяет сделать вывод о нормальности распределения. Две разные модели могут иметь одинаковые среднее и дисперсию, но совершенно разную форму плотности. Для проверки нормальности используют дополнительные инструменты: графики (Q–Q‑плот, гистограммы), критерии согласия и анализ асимметрии с эксцессом.

Когда достаточно знать стандартное отклонение вместо дисперсии?

Стандартное отклонение – корень из дисперсии – измеряется в тех же единицах, что и сама случайная величина, поэтому его легче интерпретировать. В прикладных задачах (оценка точности измерений, волатильности, разброса результатов экспериментов) обычно оперируют именно стандартным отклонением, а дисперсию используют как удобную математическую форму в формулах и выводах.

  1. Дисперсия случайной величины – формула и расчёт
  2. Таблица распределения случайной величины: что это и как составить
  3. Калькулятор статистики – онлайн расчёт
  4. Калькулятор отклонений онлайн – стандартное, среднее, относительное
  5. Калькулятор вариации онлайн – расчет коэффициента CV
  6. Калькулятор отклонения онлайн: расчёт стандартного