Обновлено:
Калькулятор статистики
Набор из десятка чисел мало о чём говорит без обобщающих показателей. Калькулятор статистики за секунды рассчитает среднее, медиану, дисперсию, стандартное отклонение, квартили и обнаружит выбросы – всё, что нужно для описательного анализа выборки.
Что рассчитывает калькулятор статистики
Инструмент обрабатывает числовой ряд и выдаёт более 20 показателей, сгруппированных по смыслу.
Меры центральной тенденции
Описывают «центр» распределения – типичное значение набора данных.
- Среднее арифметическое (μ) – сумма всех значений, делённая на их количество. Чувствительно к выбросам.
- Медиана – серединное значение упорядоченного ряда. При чётном числе элементов – среднее двух центральных. Устойчива к экстремальным значениям.
- Мода – наиболее часто встречающееся значение. Ряд может быть унимодальным, бимодальным или не иметь моды вовсе.
Меры разброса (дисперсии)
Показывают, насколько данные рассеяны относительно центра.
- Размах – разница между максимумом и минимумом. Простейшая, но чувствительная к выбросам мера.
- Дисперсия – средний квадрат отклонений от среднего. Выборочная (s²) использует делитель N−1, генеральной совокупности (σ²) – делитель N.
- Стандартное отклонение – квадратный корень из дисперсии. Удобнее для интерпретации, поскольку выражается в тех же единицах, что и исходные данные.
- Среднее абсолютное отклонение (MAD) – среднее расстояние от каждой точки до среднего. Менее чувствительно к выбросам, чем дисперсия.
Квартили и межквартильный размах
- Q1 – 25-й процентиль (медиана нижней половины данных).
- Q3 – 75-й процентиль (медиана верхней половины).
- IQR = Q3 − Q1 – разброс средних 50% данных. Устойчив к выбросам и используется для их обнаружения.
- Квартильное отклонение – половина IQR.
Дополнительные показатели
- Стандартная ошибка (SE) – оценка отклонения выборочного среднего от истинного среднего генеральной совокупности. Рассчитывается как s / √N.
- Коэффициент вариации (CV) – стандартное отклонение в процентах от среднего. Позволяет сравнивать разброс выборок с разным масштабом.
- Геометрическое среднее – корень N-й степени из произведения всех значений. Подходит для темпов роста и мультипликативных процессов (только для положительных чисел).
- Гармоническое среднее – N, делённое на сумму обратных величин. Применяется для средних скоростей и отношений (только для положительных чисел).
- Среднеквадратичное значение (RMS) – корень из среднего арифметического квадратов значений.
Основные формулы
Среднее арифметическое:
$$\bar{x} = \frac{\sum_{i=1}^{N} x_i}{N}$$Выборочное стандартное отклонение:
$$s = \sqrt{\frac{\sum_{i=1}^{N}(x_i - \bar{x})^2}{N-1}}$$Дисперсия генеральной совокупности:
$$\sigma^2 = \frac{\sum_{i=1}^{N}(x_i - \mu)^2}{N}$$Межквартильный размах:
$$\text{IQR} = Q_3 - Q_1$$Разница между выборочной (N−1) и генеральной (N) дисперсией – поправка Бесселя. Она компенсирует систематическое занижение дисперсии при оценке по выборке.
Пример расчёта
Возьмём результаты теста: 72, 85, 90, 65, 78, 92, 88, 76.
| Показатель | Значение |
|---|---|
| Количество (N) | 8 |
| Сумма | 646 |
| Среднее | 80,75 |
| Медиана | 81,5 |
| Мода | нет |
| Мин / Макс | 65 / 92 |
| Размах | 27 |
| Выборочная дисперсия (s²) | 95,93 |
| Выборочное отклонение (s) | 9,79 |
| Q1 / Q3 | 73 / 89,5 |
| IQR | 16,5 |
Медиана (81,5) и среднее (80,75) близки – распределение примерно симметрично. Стандартное отклонение ≈ 9,8 говорит о том, что типичный результат отклоняется от среднего примерно на 10 баллов.
Какую меру центральной тенденции выбрать?
| Мера | Когда использовать | Ограничение |
|---|---|---|
| Среднее | Данные симметричны, выбросов нет | Сильно искажается экстремальными значениями |
| Медиана | Асимметрия или выбросы (зарплаты, цены жилья) | Игнорирует конкретные значения крайних точек |
| Мода | Категориальные данные, поиск частого значения | Может отсутствовать или быть не единственной |
Для зарплатной статистики медиана надёжнее среднего: один доход в 10 млн руб. сдвинет среднее, но почти не повлияет на медиану.
Как обнаружить выбросы методом IQR
Калькулятор автоматически находит выбросы по правилу 1,5×IQR:
- Рассчитайте Q1, Q3 и IQR = Q3 − Q1.
- Определите нижнюю границу: Q1 − 1,5 × IQR.
- Определите верхнюю границу: Q3 + 1,5 × IQR.
- Все значения за пределами [нижняя граница; верхняя граница] – выбросы.
В примере выше: границы = [73 − 24,75; 89,5 + 24,75] = [48,25; 114,25]. Ни одно значение не выходит за эти пределы – выбросов нет. Если бы в выборке была оценка 30, она попала бы в категорию выбросов.
Где применяется описательная статистика
- Образование – анализ баллов ЕГЭ, среднего балла класса, сравнение групп.
- Контроль качества – отслеживание отклонений размеров деталей от номинала; низкое стандартное отклонение = стабильный процесс.
- Финансы – оценка волатильности доходности портфеля через стандартное отклонение и CV.
- Медицина – определение референсных интервалов лабораторных показателей (по квартилям).
- Маркетинг – сегментация клиентов по среднему чеку и разбросу покупок.
Результаты калькулятора носят справочный характер и не заменяют профессиональный статистический анализ.
Часто задаваемые вопросы
Чем выборочное стандартное отклонение отличается от отклонения по генеральной совокупности?
Выборочное отклонение делит сумму квадратов отклонений на N−1 (поправка Бесселя), а отклонение по совокупности – на N. Первый вариант используют, когда данные – лишь выборка из большей популяции.
Что показывает коэффициент вариации?
Коэффициент вариации выражает стандартное отклонение в процентах от среднего. Он позволяет сравнивать разброс данных с разными единицами измерения или масштабами – например, вес в граммах и рост в сантиметрах.
Можно ли использовать калькулятор для отрицательных чисел?
Да, среднее, медиана, мода, дисперсия и стандартное отклонение корректно рассчитываются для отрицательных значений. Геометрическое и гармоническое среднее требуют только положительных чисел.
Сколько чисел нужно ввести для корректного расчёта?
Минимум 2 числа – для вычисления размаха и дисперсии. Для определения моды достаточно одного значения, но она имеет смысл при повторяющихся элементах набора.
Что такое межквартильный размах и зачем он нужен?
IQR – это разница между третьим и первым квартилем (Q3−Q1). Он описывает разброс средних 50% данных и устойчив к выбросам, в отличие от обычного размаха.
Как калькулятор находит выбросы?
По правилу 1,5×IQR: значение считается выбросом, если оно меньше Q1−1,5×IQR или больше Q3+1,5×IQR. Метод основан на квартилях, поэтому экстремальные значения не искажают границу.
Похожие калькуляторы и статьи
- Калькулятор отклонений онлайн – стандартное, среднее, относительное
- Калькулятор вариации онлайн – расчет коэффициента CV
- Калькулятор дисперсии – расчет за 10 секунд онлайн
- Калькулятор отклонения онлайн: расчёт стандартного
- Среднее число калькулятор: онлайн расчет с дополнительной статистикой
- Расчет среднего калькулятор: среднее арифметическое онлайн