Дисперсия случайной величины
Что такое дисперсия случайной величины
Математическая дисперсия случайной величины – это числовая характеристика, которая показывает, насколько значения этой величины разбросаны относительно её математического ожидания. Если математическое ожидание говорит о «среднем» значении, то дисперсия отвечает на вопрос о стабильности и предсказуемости.
В русской литературе дисперсия обозначается как D[X], в зарубежной – Var(X) или σ². Квадратный корень из дисперсии называется среднеквадратическим отклонением (σ) и измеряется в тех же единицах, что и исходная величина.
Практическая значимость
Рассмотрим пример из финансов. Два инвестиционных портфеля могут иметь одинаковую среднюю доходность 10% годовых. Но если у первого дисперсия 4, а у второго – 25, второй портфель значительно рискованнее. Значения доходности могут колебаться от -5% до +25%, тогда как первый портфель стабильнее.
Формальное определение и формулы
Дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от её математического ожидания:
D[X] = E[(X - E[X])²]
Где E обозначает математическое ожидание. Эта формула работает для всех типов случайных величин, но практические вычисления отличаются для дискретных и непрерывных случаев.
Дискретная случайная величина
Если случайная величина X принимает значения x₁, x₂, …, xₙ с вероятностями p₁, p₂, …, pₙ, дисперсия вычисляется по формуле:
D[X] = Σ pᵢ(xᵢ - E[X])²
Существует альтернативная форма вычисления:
D[X] = ½ ΣΣ pᵢpⱼ(xᵢ - xⱼ)²
Эта форма полезна при теоретических выкладках и проверке результатов.
Непрерывная случайная величина
Для непрерывной случайной величины с плотностью вероятности f(x):
D[X] = ∫(x - E[X])²f(x)dx
Пределы интегрирования – от -∞ до +∞. На практике часто используется упрощённая формула через моменты.
Упрощённая формула расчёта
Благодаря линейности математического ожидания, дисперсию можно вычислить проще:
D[X] = E[X²] - (E[X])²
Эта формула удобнее для расчётов, так как требует нахождения только двух математических ожиданий.
Основные свойства дисперсии
Понимание свойств дисперсии помогает упрощать сложные вычисления и проверять результаты.
Неотрицательность
Дисперсия любой случайной величины неотрицательна: D[X] ≥ 0. Это следует из того, что дисперсия – это математическое ожидание квадрата, а квадрат всегда неотрицателен.
Дисперсия константы
Если случайная величина равна константе C, её дисперсия равна нулю: D[C] = 0. Нет разброса – нет вариации.
Влияние константы на дисперсию
Прибавление константы не меняет дисперсию: D[C + X] = D[X]. Сдвиг всех значений на одну величину не влияет на их разброс.
Умножение на константу
При умножении на константу C дисперсия умножается на C²: D[CX] = C²D[X]. Это важно при изменении единиц измерения.
Дисперсия суммы величин
Для двух случайных величин:
D[X + Y] = D[X] + D[Y] + 2cov(X, Y)
Где cov(X, Y) – ковариация величин. Для независимых или некоррелированных величин ковариация равна нулю, и формула упрощается до суммы дисперсий.
Дисперсия линейной комбинации
Для линейной комбинации нескольких случайных величин:
D[ΣcᵢXᵢ] = ΣΣcᵢcⱼcov(Xᵢ, Xⱼ)
Это фундаментальное свойство используется в регрессионном анализе и портфельной теории.
Пример расчёта дисперсии
Рассмотрим классический пример: случайная величина X имеет непрерывное равномерное распределение на отрезке [0, 1]. Плотность вероятности:
- f(x) = 1 при x ∈ [0, 1]
- f(x) = 0 при x ∉ [0, 1]
Вычислим математическое ожидание квадрата:
E[X²] = ∫₀¹ x²dx = x³/3|₀¹ = 1/3
Математическое ожидание:
E[X] = ∫₀¹ xdx = x²/2|₀¹ = 1/2
Дисперсия:
D[X] = 1/3 - (1/2)² = 1/3 - 1/4 = 1/12 ≈ 0,083
Этот результат часто используется как эталонный при проверке расчётов.
Выборочная дисперсия
На практике мы редко знаем истинное распределение. Чаще работаем с выборкой данных X₁, X₂, …, Xₙ.
Смещённая оценка
Смещённая оценка дисперсии вычисляется по формуле:
S̄² = (1/n) Σ(Xᵢ - X̄)²
Где X̄ – выборочное среднее. Эта оценка систематически занижает истинную дисперсию.
Несмещённая оценка
Для получения несмещённой оценки необходимо умножить на коэффициент n/(n-1):
S̃² = (1/(n-1)) Σ(Xᵢ - X̄)²
Эта формула используется в большинстве статистических пакетов и даёт более точную оценку дисперсии генеральной совокупности.
Когда использовать каждую формулу
| Ситуация | Формула | Делитель |
|---|---|---|
| Известно полное распределение | Теоретическая | – |
| Выборка для описания данных | Смещённая | n |
| Выборка для оценки генеральной совокупности | Несмещённая | n-1 |
Связь с другими характеристиками
Стандартное отклонение
Стандартное отклонение σ = √D[X]. Если дисперсия измеряется в квадратах единиц (например, м²), то стандартное отклонение – в исходных единицах (м).
Коэффициент вариации
Для сравнения разброса величин с разными средними используют коэффициент вариации:
CV = σ / E[X] × 100%
Показывает относительный разброс в процентах от среднего.
Ковариация и корреляция
Ковариация показывает совместную вариацию двух величин. Корреляция – нормированная ковариация от -1 до 1.
Неравенство Чебышёва
Из неравенства Чебышёва следует: вероятность того, что значения отстоят от математического ожидания более чем на k стандартных отклонений, менее 1/k².
Для нормального распределения:
- 95% значений в пределах ±2σ
- 99,7% значений в пределах ±3σ
Условная дисперсия
В теории случайных процессов используется условная дисперсия D[X|Y] – дисперсия X при известном значении Y:
D[X|Y] = E[X²|Y] - E[X|Y]²
Свойства условной дисперсии
- Условная дисперсия неотрицательна
- Равна нулю, когда X полностью определяется Y
- Для независимых X и Y условная дисперсия равна обычной D[X]
Формула полной дисперсии
D[X] = E[D[X|Y]] + D[E[X|Y]]
Дисперсия складывается из средней условной дисперсии и дисперсии условного математического ожидания.
Применение в различных областях
Финансы и инвестиции
Дисперсия доходности – ключевая мера риска. Портфельная теория Марковица использует дисперсию для оптимизации соотношения риск-доходность.
Контроль качества
В производстве дисперсия размеров деталей показывает стабильность технологического процесса. Малая дисперсия = высокое качество.
Машинное обучение
Дисперсия модели – компонент ошибки предсказания. Баланс между смещением и дисперсией (bias-variance tradeoff) – центральная концепция.
Социологические исследования
Дисперсия ответов показывает однородность выборки. Высокая дисперсия может указывать на наличие подгрупп с разными мнениями.
Страхование
Страховые компании используют дисперсию убытков для расчёта резервов и премий. Чем выше дисперсия, тем больше резерв требуется.
Типичные ошибки при расчёте
Путаница с делителем
Самая частая ошибка – использование n вместо n-1 для выборочной оценки. Всегда уточняйте, оценка это или описание выборки.
Единицы измерения
Дисперсия измеряется в квадратах единиц. Не сравнивайте дисперсии величин с разными единицами без нормировки.
Предположение о независимости
Формула D[X+Y] = D[X] + D[Y] работает только для независимых величин. При наличии корреляции нужно учитывать ковариацию.
Калькулятор дисперсии
Калькулятор выше позволяет рассчитать дисперсию для набора данных. Укажите значения через запятую или с новой строки, выберите тип оценки (смещённая или несмещённая).
Калькулятор автоматически вычисляет:
- Математическое ожидание
- Дисперсию по выбранной формуле
- Стандартное отклонение
- Коэффициент вариации
Данные калькулятора носят справочный характер. Для критически важных расчётов используйте специализированное статистическое ПО.
Заключение
Математическая дисперсия случайной величины – фундаментальная характеристика вариативности данных. Понимание формул, свойств и областей применения необходимо для работы со статистикой, анализом данных и принятием решений в условиях неопределённости.
Ключевые моменты для запоминания:
- Дисперсия всегда неотрицательна
- D[X] = E[X²] - (E[X])² – основная формула для расчётов
- для выборки используйте делитель n-1
- Стандартное отклонение = √дисперсии
Информация предоставлена для образовательных целей. В научных и профессиональных расчётах сверяйтесь с актуальными методическими рекомендациями.
Часто задаваемые вопросы
В чём разница между дисперсией и стандартным отклонением?
Может ли дисперсия быть отрицательной?
Как интерпретировать значение дисперсии?
Что такое несмещённая оценка дисперсии?
Как дисперсия связана с математическим ожиданием?
Когда дисперсия равна нулю?
Похожие калькуляторы и статьи
- Дисперсия случайной величины – формула и расчёт
- Сумма и произведение случайных величин: свойства и расчет
- Дисперсию случайной величины X: формула и пример
- Калькулятор статистики – онлайн расчёт
- Калькулятор отклонений онлайн – стандартное, среднее, относительное
- Калькулятор вариации онлайн – расчет коэффициента CV