Обновлено:
Подсчёт стандартного отклонения
Два набора данных с одинаковым средним могут вести себя совершенно по-разному. Зарплаты 50, 55 и 60 тысяч рублей и зарплаты 20, 55 и 90 тысяч дают среднее 55, но разброс принципиально разный. Подсчёт стандартного отклонения – способ выразить этот разброс одним числом.
Что такое стандартное отклонение
Стандартное отклонение (σ или s) – это среднее расстояние, на которое значения набора данных удалены от своего среднего арифметического. В русскоязычной литературе также встречается термин среднеквадратическое отклонение (СКО).
Чем больше СКО, тем сильнее данные «разбегаются» от центра. При σ = 0 все значения совпадают – отклоняться не от чего.
Как рассчитать стандартное отклонение
Формула для генеральной совокупности
Когда доступны данные обо всей совокупности (например, все сотрудники небольшой компании из 12 человек), используют формулу:
$$\sigma = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}}$$| Обозначение | Значение |
|---|---|
| σ | Стандартное отклонение совокупности |
| N | Количество элементов совокупности |
| xi | i-е значение |
| μ | Среднее арифметическое совокупности |
Формула для выборки
На практике чаще работают с выборкой – подмножеством совокупности. Тогда в знаменателе стоит N − 1 (поправка Бесселя):
$$s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n - 1}}$$| Обозначение | Значение |
|---|---|
| s | Стандартное отклонение выборки |
| n | Размер выборки |
| xi | i-е значение |
| x̄ | Среднее арифметическое выборки |
Деление на n − 1 вместо n даёт несмещённую оценку дисперсии. Если считать по формуле совокупности, результат будет систематически занижен.
Пошаговый алгоритм расчёта
Разберём подсчёт стандартного отклонения выборки на конкретных числах: 4, 8, 6, 5, 3.
Шаг 1. Найти среднее арифметическое
x̄ = (4 + 8 + 6 + 5 + 3) / 5 = 26 / 5 = 5,2
Шаг 2. Вычислить отклонения от среднего
| xi | xi − x̄ | (xi − x̄)² |
|---|---|---|
| 4 | −1,2 | 1,44 |
| 8 | 2,8 | 7,84 |
| 6 | 0,8 | 0,64 |
| 5 | −0,2 | 0,04 |
| 3 | −2,2 | 4,84 |
Шаг 3. Суммировать квадраты отклонений
Σ(xi − x̄)² = 1,44 + 7,84 + 0,64 + 0,04 + 4,84 = 14,80
Шаг 4. Разделить на n − 1
Дисперсия s² = 14,80 / (5 − 1) = 14,80 / 4 = 3,70
Шаг 5. Извлечь квадратный корень
s = √3,70 ≈ 1,92
Стандартное отклонение выборки равно 1,92. Для генеральной совокупности (деление на N = 5) получилось бы √(14,80 / 5) ≈ 1,72.
Где применяется стандартное отклонение
- Финансы: оценка волатильности акций и портфелей. Высокое СКО доходности – высокий риск.
- Производство: контроль качества через шесть сигм (Six Sigma). Цель – не более 3,4 дефекта на миллион возможностей.
- Научные исследования: оценка погрешности измерений, сравнение групп через t-критерий.
- Машинное обучение: нормализация признаков (z-score = (x − μ) / σ), выявление выбросов.
- Образование: шкалирование результатов экзаменов, расчёт рейтинговых баллов.
Какой формулой пользоваться – выборки или совокупности?
Выбор зависит от того, чем именно вы располагаете:
| Ситуация | Формула |
|---|---|
| Данные содержат все элементы группы (перепись, полный штат компании) | Совокупности (деление на N) |
| Данные – часть большей группы (опрос 300 из 10 000 клиентов, лабораторная выборка) | Выборки (деление на n − 1) |
| Размер выборки больше 30 | Разница между формулами минимальна |
При n > 30 разница между делением на N и на n − 1 становится практически незаметной.
Правило трёх сигм
Для нормально распределённых данных действует эмпирическое правило:
- ±1σ от среднего – содержит около 68,3% значений
- ±2σ – около 95,4%
- ±3σ – около 99,7%
Значения за пределами ±3σ считают статистическими выбросами. Например, при среднем росте 170 см и σ = 10 см рост 210 см (на 4σ выше среднего) – крайне редкое явление.
Коэффициент вариации
Стандартное отклонение выражено в тех же единицах, что и сами данные. Это затрудняет сравнение разброса для разных масштабов. Коэффициент вариации решает проблему:
$$CV = \frac{\sigma}{\bar{x}} \times 100\%$$При CV < 10% вариация считается слабой, 10–20% – умеренной, > 20% – сильной.
Расчёты носят информационный характер. Для ответственных финансовых и научных решений сверяйтесь с профессиональными инструментами.
Часто задаваемые вопросы
Чем отличается стандартное отклонение выборки от генеральной совокупности?
При расчёте для генеральной совокупности делят на N, а для выборки – на N−1. Поправка Bessel помогает получить несмещённую оценку, когда исследуется не вся совокупность, а лишь её часть.
Может ли стандартное отклонение быть отрицательным?
Нет. Стандартное отклонение всегда неотрицательно, так как является квадратным корнем из дисперсии. Нулевое значение означает, что все элементы набора данных одинаковы.
Как интерпретировать величину стандартного отклонения?
Чем больше значение, тем сильнее разброс данных вокруг среднего. Малое отклонение указывает на то, что значения сгруппированы плотно. Абсолютную величину оценивают в контексте единиц измерения.
Что такое правило трёх сигм?
При нормальном распределении около 68% значений лежат в пределах ±1σ от среднего, 95% – в пределах ±2σ, и 99,7% – в пределах ±3σ. Это правило помогает выявлять аномальные значения.
Зачем используют поправку N−1 в знаменателе для выборки?
Деление на N−1 вместо N компенсирует тот факт, что выборочное среднее всегда ближе к элементам выборки, чем истинное среднее генеральной совокупности. Без этой поправки дисперсия систематически занижалась бы.
Как стандартное отклонение связано с дисперсией?
Дисперсия – это средний квадрат отклонений от среднего, а стандартное отклонение – квадратный корень из дисперсии. Дисперсия выражена в квадратах единиц, СКО – в тех же единицах, что и исходные данные.
Похожие калькуляторы и статьи
- Калькулятор отклонений онлайн – стандартное, среднее, относительное
- Математическая дисперсия случайной величины: формулы и расчёт
- Дисперсия случайной величины – формула и расчёт
- Калькулятор статистики – онлайн расчёт
- Калькулятор вариации онлайн – расчет коэффициента CV
- Калькулятор отклонения онлайн: расчёт стандартного