Я инженер на сотню рублей,И больше я не получу.Мне 25, и я до сих порНе знаю, чего хочуБорис Борисович поет о безнадежно типичной зарплате, хотя в Советском Союзе были инженеры, получавшие больше.
Как вычислить типичный показатель? Надо сделать так, чтобы слишком большие или слишком маленькие значения не учитывались. Пусть все советские инженеры (или российские врачи) построятся в ряд в соответствии со своей зарплатой. Пусть в начале ряда стоят те, у кого она самая маленькая, а в конце – те, у кого самая большая. Тогда в середине окажутся врачи с самой типичной зарплатой, а их соседями окажутся люди с ближайшей зарплатой.
Показатель, при котором с одной стороны стоит N людей с зарплатой не меньше, а с другой – N людей с зарплатой не больше, называется медианой (не путайте с медианой треугольника). Он так и считается – упорядочиваем выборку, берем центральный элемент. Если элементов четное количество, обычно используется среднее арифметическое двух центральных. Но чтобы не запоминать все эти правила, мы обычно берем таблицу, переносим ее в Excel и используем функцию МЕДИАНА[62].
Это один из самых полезных показателей для журналиста. Если у вас есть список миллиардеров, вы можете узнать состояние типичного миллиардера. Часто медиана поможет понять, сколько стоит квадратный метр в городе, если у вас есть разбивка по районам. С помощью медианы легко понять, каково «реальное» среднее в объеме данных, которые на вас вывалил источник.
В статистике есть еще один показатель для типичных значений, мода. Представьте, что вам нужен типичный, но не числовой показатель. Например, самая популярная модель iPhone. Тогда бессмысленно пытаться выстроить смартфоны в ряд и целиться в середину. Надо просто подсчитать число устройств на каждую модель и объявить победителя. Именно эта модель и будет модой.
Важно, что мод может быть несколько. Представьте, что компания продает 10 моделей автомобиля и отчитывается в миллионах штук. Продано 5 миллионов машин одной модели и 5,1 миллиона другой. Остальные разошлись хуже. Если мы округляем до целого числа миллионов, то в новости называем самыми популярными две модели.
Мода как термин редко вызывает проблемы у журналистов, потому что интуитивно понятна. С другой стороны, она редко дает возможность найти что-то неожиданное.
7.1.4 Когорта
Когда римские легионеры выстраивались в когорты, они вряд ли думали о социологии и демографии. Управлять легионом, разделенным на десять когорт, было просто удобно. Военачальник мог специализировать некоторые из когорт, ставил им различные боевые задачи.
Американскому экономисту Паскалю Уэлптону в 1947 году пришла в голову счастливая мысль разделить общество, как легион, на когорты. Так появился когортный анализ, который теперь применяется везде, где надо разбить людей на группы, объединенные той или иной характеристикой. Когортный анализ позволяет избежать проклятия «среднего человека». Как писали Ильф и Петров:
Известно, сколько какой пищи съедает в год средний гражданин республики. Известно, сколько этот средний гражданин выпивает в среднем водки, с примерным указанием потребляемой закуски.
Но, конечно, все эти данные бессмысленны. Средняя гражданка пьет совсем другое количество водки, а средний ребенок, будем надеяться, не пьет вообще, а только портит статистику среднему гражданину.