Обновлено:

Дисперсия случайной величины

Два набора данных с одинаковым средним могут вести себя совершенно по-разному. Один плотно группируется вокруг среднего, другой разбросан широко – и среднее скрывает это различие. Дисперсия случайной величины показывает, насколько значения отклоняются от математического ожидания, и делает разброс измеримым.

Что такое дисперсия случайной величины

Дисперсия – числовая характеристика разброса значений случайной величины относительно её математического ожидания. Чем больше дисперсия, тем сильнее данные «разлетаются» от центра; чем меньше – тем плотнее они сгруппированы.

В русской литературе дисперсию обозначают D[X], в англоязычной – Var(X) или σ². Квадрат в обозначении связан с тем, что отклонения возводятся в квадрат перед суммированием – это исключает компенсацию положительных и отрицательных сдвигов и усиливает вес больших отклонений.

Данные для расчёта Минимум 2 значения для выборочной дисперсии. Дробные числа можно вводить через точку.
Тип дисперсии
Выборочная использует деление на n−1 (поправка Бесселя).

Результат

Генеральная
Дисперсия (D[X]):
Стандартное отклонение (σ):

Разбивка показателей

Количество (n)
Среднее (x̄)
Сумма всех (Σx)
Сумма квадратов (SS)
Визуализация разброса значений относительно среднего
Интерпретация: Введите данные для анализа.

Калькулятор выше рассчитывает дисперсию по введённым данным – достаточно указать значения через запятую, и результат появится мгновенно.

Как рассчитать дисперсию: основные формулы

Определение дисперсии через математическое ожидание:

D[X] = E[(X − E[X])²]

На практике удобнее использовать вычислительную формулу, которая не требует предварительного расчёта отклонений:

D[X] = E[X²] − (E[X])²

Для дискретной случайной величины с значениями x₁, …, xₙ и вероятностями p₁, …, pₙ:

D[X] = Σ pᵢ(xᵢ − E[X])²

Для непрерывной случайной величины с плотностью f(x):

D[X] = ∫(x − E[X])² f(x) dx

Квадратный корень из дисперсии σ = √D[X] называют стандартным отклонением – оно измеряется в тех же единицах, что и сама величина, и проще для интерпретации (ru.wikipedia.org).

Генеральная и выборочная дисперсия – в чем разница?

Когда доступны данные о всех объектах совокупности, используют дисперсию генеральной совокупности:

σ² = Σ(xᵢ − μ)² / n

Когда работают с выборкой – частью совокупности – применяют выборочную дисперсию с поправкой Бесселя:

s² = Σ(xᵢ − x̄)² / (n − 1)

Деление на n − 1 вместо n даёт несмещённую оценку: выборочное среднее x̄ всегда ближе к выборочным значениям, чем истинное μ, поэтому сумма квадратов отклонений систематически занижается. Поправка компенсирует этот эффект (shakhbanov.org).

Пошаговый расчёт дисперсии на примере

Допустим, цены на пять товаров составляют 100, 150, 200, 250 и 300 рублей.

Шаг 1. Среднее значение: x̄ = (100 + 150 + 200 + 250 + 300) / 5 = 200

Шаг 2. Отклонения от среднего: 100 − 200 = −100; 150 − 200 = −50; 200 − 200 = 0; 250 − 200 = 50; 300 − 200 = 100

Шаг 3. Квадраты отклонений: 10 000; 2 500; 0; 2 500; 10 000

Шаг 4. Сумма квадратов: 10 000 + 2 500 + 0 + 2 500 + 10 000 = 25 000

Шаг 5. Дисперсия генеральной совокупности: σ² = 25 000 / 5 = 5 000 (рублей²)

Дисперсия выборки: s² = 25 000 / 4 = 6 250 (рублей²)

Стандартное отклонение для совокупности: σ = √5 000 ≈ 70,71 рубля.

Основные свойства дисперсии

  • Неотрицательность: D[X] ≥ 0 для любой случайной величины.
  • Константа: D[C] = 0 – если величина не варьируется, разброс отсутствует.
  • Сдвиг: D[C + X] = D[X] – добавление постоянной не меняет разброса.
  • Масштаб: D[CX] = C² · D[X] – умножение на константу увеличивает дисперсию в квадрат этой константы.
  • Сумма: D[X + Y] = D[X] + D[Y] + 2cov(X,Y). Для независимых или некоррелированных величин ковариация равна нулю, и дисперсии просто складываются.

Как интерпретировать значение дисперсии?

Дисперсия 5 000 рублей² трудно воспринимать напрямую – поэтому на практике чаще используют стандартное отклонение. Для нормального распределения работает правило:

  • 68,3% значений лежат в пределах ±1σ от среднего
  • 95,4% – в пределах ±2σ
  • 99,7% – в пределах ±3σ

Это следствие неравенства Чебышёва, которое в общем виде утверждает: вероятность отклонения более чем на k стандартных отклонений от среднего не превышает 1/k². Для нормального распределения оценка усиливается до приведённых выше процентов (ru.wikipedia.org).

Большая дисперсия сигнализирует о нестабильности или высокой вариативности данных – например, колебания цен на нестабильном рынке. Малая дисперсия указывает на предсказуемость и однородность.

Статья носит информационный характер. Для задач, связанных с финансовыми или научными расчётами, уточняйте методику оценки дисперсии в профильных источниках.

Часто задаваемые вопросы

Чем отличается дисперсия от стандартного отклонения?

Стандартное отклонение – это квадратный корень из дисперсии. Дисперсия измеряется в квадратах единиц исходных данных, а стандартное отклонение – в тех же единицах, что и сама величина, поэтому его удобнее интерпретировать.

Может ли дисперсия быть отрицательной?

Нет, дисперсия всегда неотрицательна. Это следует из определения: она равна математическому ожиданию квадрата отклонения, а квадрат любого числа ≥ 0. Минимальное значение дисперсии – 0, когда все значения совпадают.

Что означает нулевая дисперсия случайной величины?

Нулевая дисперсия означает, что случайная величина принимает только одно значение – она фактически является константой. Никакого разброса нет, каждый результат равен математическому ожиданию.

Зачем в выборочной дисперсии делить на n−1, а не на n?

Деление на n−1 (поправка Бесселя) даёт несмещённую оценку дисперсии генеральной совокупности. При делении на n оценка систематически занижается, поскольку выборочное среднее ближе к выборочным значениям, чем истинное математическое ожидание.

В каких единицах измеряется дисперсия?

Дисперсия измеряется в квадратах единиц исходной случайной величины. Если величина выражена в рублях, дисперсия – в рублях². Для практической интерпретации обычно используют стандартное отклонение, которое возвращается к исходным единицам.

Как дисперсия связана с ковариацией?

Дисперсия суммы двух случайных величин равна сумме их дисперсий плюс удвоенная ковариация: D[X+Y] = D[X] + D[Y] + 2cov(X,Y). Для независимых величин ковариация равна нулю, и дисперсии просто складываются.

  1. Калькулятор статистики – онлайн расчёт
  2. Калькулятор отклонений онлайн – стандартное, среднее, относительное
  3. Калькулятор вариации онлайн – расчет коэффициента CV
  4. Калькулятор отклонения онлайн: расчёт стандартного
  5. Калькулятор дисперсии – расчет за 10 секунд онлайн
  6. Калькулятор среднего квадратичного: расчёт онлайн