Обновлено:

Дисперсия случайной величины

Что такое дисперсия случайной величины

Математическая дисперсия случайной величины – это числовая характеристика, которая показывает, насколько значения этой величины разбросаны относительно её математического ожидания. Если математическое ожидание говорит о «среднем» значении, то дисперсия отвечает на вопрос о стабильности и предсказуемости.

В русской литературе дисперсия обозначается как D[X], в зарубежной – Var(X) или σ². Квадратный корень из дисперсии называется среднеквадратическим отклонением (σ) и измеряется в тех же единицах, что и исходная величина.

Практическая значимость

Рассмотрим пример из финансов. Два инвестиционных портфеля могут иметь одинаковую среднюю доходность 10% годовых. Но если у первого дисперсия 4, а у второго – 25, второй портфель значительно рискованнее. Значения доходности могут колебаться от -5% до +25%, тогда как первый портфель стабильнее.

Исходные данные Введите числа через запятую, пробел или с новой строки. Допускаются десятичные дроби.
Тип оценки дисперсии
Несмещённая оценка рекомендуется для выборок: она точнее оценивает дисперсию генеральной совокупности.
Данные калькулятора носят справочный образовательный характер. Для научных и профессиональных расчётов используйте специализированное статистическое ПО.

Формальное определение и формулы

Дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от её математического ожидания:

D[X] = E[(X - E[X])²]

Где E обозначает математическое ожидание. Эта формула работает для всех типов случайных величин, но практические вычисления отличаются для дискретных и непрерывных случаев.

Дискретная случайная величина

Если случайная величина X принимает значения x₁, x₂, …, xₙ с вероятностями p₁, p₂, …, pₙ, дисперсия вычисляется по формуле:

D[X] = Σ pᵢ(xᵢ - E[X])²

Существует альтернативная форма вычисления:

D[X] = ½ ΣΣ pᵢpⱼ(xᵢ - xⱼ)²

Эта форма полезна при теоретических выкладках и проверке результатов.

Непрерывная случайная величина

Для непрерывной случайной величины с плотностью вероятности f(x):

D[X] = ∫(x - E[X])²f(x)dx

Пределы интегрирования – от -∞ до +∞. На практике часто используется упрощённая формула через моменты.

Упрощённая формула расчёта

Благодаря линейности математического ожидания, дисперсию можно вычислить проще:

D[X] = E[X²] - (E[X])²

Эта формула удобнее для расчётов, так как требует нахождения только двух математических ожиданий.

Основные свойства дисперсии

Понимание свойств дисперсии помогает упрощать сложные вычисления и проверять результаты.

Неотрицательность

Дисперсия любой случайной величины неотрицательна: D[X] ≥ 0. Это следует из того, что дисперсия – это математическое ожидание квадрата, а квадрат всегда неотрицателен.

Дисперсия константы

Если случайная величина равна константе C, её дисперсия равна нулю: D[C] = 0. Нет разброса – нет вариации.

Влияние константы на дисперсию

Прибавление константы не меняет дисперсию: D[C + X] = D[X]. Сдвиг всех значений на одну величину не влияет на их разброс.

Умножение на константу

При умножении на константу C дисперсия умножается на C²: D[CX] = C²D[X]. Это важно при изменении единиц измерения.

Дисперсия суммы величин

Для двух случайных величин:

D[X + Y] = D[X] + D[Y] + 2cov(X, Y)

Где cov(X, Y) – ковариация величин. Для независимых или некоррелированных величин ковариация равна нулю, и формула упрощается до суммы дисперсий.

Дисперсия линейной комбинации

Для линейной комбинации нескольких случайных величин:

D[ΣcᵢXᵢ] = ΣΣcᵢcⱼcov(Xᵢ, Xⱼ)

Это фундаментальное свойство используется в регрессионном анализе и портфельной теории.

Пример расчёта дисперсии

Рассмотрим классический пример: случайная величина X имеет непрерывное равномерное распределение на отрезке [0, 1]. Плотность вероятности:

  • f(x) = 1 при x ∈ [0, 1]
  • f(x) = 0 при x ∉ [0, 1]

Вычислим математическое ожидание квадрата:

E[X²] = ∫₀¹ x²dx = x³/3|₀¹ = 1/3

Математическое ожидание:

E[X] = ∫₀¹ xdx = x²/2|₀¹ = 1/2

Дисперсия:

D[X] = 1/3 - (1/2)² = 1/3 - 1/4 = 1/12 ≈ 0,083

Этот результат часто используется как эталонный при проверке расчётов.

Выборочная дисперсия

На практике мы редко знаем истинное распределение. Чаще работаем с выборкой данных X₁, X₂, …, Xₙ.

Смещённая оценка

Смещённая оценка дисперсии вычисляется по формуле:

S̄² = (1/n) Σ(Xᵢ - X̄)²

Где X̄ – выборочное среднее. Эта оценка систематически занижает истинную дисперсию.

Несмещённая оценка

Для получения несмещённой оценки необходимо умножить на коэффициент n/(n-1):

S̃² = (1/(n-1)) Σ(Xᵢ - X̄)²

Эта формула используется в большинстве статистических пакетов и даёт более точную оценку дисперсии генеральной совокупности.

Когда использовать каждую формулу

СитуацияФормулаДелитель
Известно полное распределениеТеоретическая
Выборка для описания данныхСмещённаяn
Выборка для оценки генеральной совокупностиНесмещённаяn-1

Связь с другими характеристиками

Стандартное отклонение

Стандартное отклонение σ = √D[X]. Если дисперсия измеряется в квадратах единиц (например, м²), то стандартное отклонение – в исходных единицах (м).

Коэффициент вариации

Для сравнения разброса величин с разными средними используют коэффициент вариации:

CV = σ / E[X] × 100%

Показывает относительный разброс в процентах от среднего.

Ковариация и корреляция

Ковариация показывает совместную вариацию двух величин. Корреляция – нормированная ковариация от -1 до 1.

Неравенство Чебышёва

Из неравенства Чебышёва следует: вероятность того, что значения отстоят от математического ожидания более чем на k стандартных отклонений, менее 1/k².

Для нормального распределения:

  • 95% значений в пределах ±2σ
  • 99,7% значений в пределах ±3σ

Условная дисперсия

В теории случайных процессов используется условная дисперсия D[X|Y] – дисперсия X при известном значении Y:

D[X|Y] = E[X²|Y] - E[X|Y]²

Свойства условной дисперсии

  • Условная дисперсия неотрицательна
  • Равна нулю, когда X полностью определяется Y
  • Для независимых X и Y условная дисперсия равна обычной D[X]

Формула полной дисперсии

D[X] = E[D[X|Y]] + D[E[X|Y]]

Дисперсия складывается из средней условной дисперсии и дисперсии условного математического ожидания.

Применение в различных областях

Финансы и инвестиции

Дисперсия доходности – ключевая мера риска. Портфельная теория Марковица использует дисперсию для оптимизации соотношения риск-доходность.

Контроль качества

В производстве дисперсия размеров деталей показывает стабильность технологического процесса. Малая дисперсия = высокое качество.

Машинное обучение

Дисперсия модели – компонент ошибки предсказания. Баланс между смещением и дисперсией (bias-variance tradeoff) – центральная концепция.

Социологические исследования

Дисперсия ответов показывает однородность выборки. Высокая дисперсия может указывать на наличие подгрупп с разными мнениями.

Страхование

Страховые компании используют дисперсию убытков для расчёта резервов и премий. Чем выше дисперсия, тем больше резерв требуется.

Типичные ошибки при расчёте

Путаница с делителем

Самая частая ошибка – использование n вместо n-1 для выборочной оценки. Всегда уточняйте, оценка это или описание выборки.

Единицы измерения

Дисперсия измеряется в квадратах единиц. Не сравнивайте дисперсии величин с разными единицами без нормировки.

Предположение о независимости

Формула D[X+Y] = D[X] + D[Y] работает только для независимых величин. При наличии корреляции нужно учитывать ковариацию.

Калькулятор дисперсии

Калькулятор выше позволяет рассчитать дисперсию для набора данных. Укажите значения через запятую или с новой строки, выберите тип оценки (смещённая или несмещённая).

Калькулятор автоматически вычисляет:

  • Математическое ожидание
  • Дисперсию по выбранной формуле
  • Стандартное отклонение
  • Коэффициент вариации

Данные калькулятора носят справочный характер. Для критически важных расчётов используйте специализированное статистическое ПО.

Заключение

Математическая дисперсия случайной величины – фундаментальная характеристика вариативности данных. Понимание формул, свойств и областей применения необходимо для работы со статистикой, анализом данных и принятием решений в условиях неопределённости.

Ключевые моменты для запоминания:

  • Дисперсия всегда неотрицательна
  • D[X] = E[X²] - (E[X])² – основная формула для расчётов
  • для выборки используйте делитель n-1
  • Стандартное отклонение = √дисперсии

Информация предоставлена для образовательных целей. В научных и профессиональных расчётах сверяйтесь с актуальными методическими рекомендациями.

Часто задаваемые вопросы

В чём разница между дисперсией и стандартным отклонением?

Дисперсия измеряется в квадратах единиц измерения исходной величины, а стандартное отклонение – в тех же единицах, что и сама величина. Стандартное отклонение равно квадратному корню из дисперсии.

Может ли дисперсия быть отрицательной?

Нет, дисперсия всегда неотрицательна. Минимальное значение дисперсии равно нулю, когда все значения случайной величины одинаковы.

Как интерпретировать значение дисперсии?

Чем больше дисперсия, тем сильнее разбросаны значения вокруг математического ожидания. Низкая дисперсия указывает на стабильность значений.

Что такое несмещённая оценка дисперсии?

Несмещённая оценка используется для выборки и рассчитывается с делением на (n-1) вместо n. Это даёт более точную оценку дисперсии генеральной совокупности.

Как дисперсия связана с математическим ожиданием?

Дисперсия рассчитывается через математическое ожидание: D[X] = E[X²] - (E[X])². Это упрощённая формула для вычислений.

Когда дисперсия равна нулю?

Дисперсия равна нулю, когда случайная величина принимает только одно значение (является константой). Разброс в этом случае отсутствует.

  1. Дисперсия случайной величины – формула и расчёт
  2. Сумма и произведение случайных величин: свойства и расчет
  3. Дисперсию случайной величины X: формула и пример
  4. Калькулятор статистики – онлайн расчёт
  5. Калькулятор отклонений онлайн – стандартное, среднее, относительное
  6. Калькулятор вариации онлайн – расчет коэффициента CV