Гальтон показал, что регрессия к среднему значению имеет место каждый раз, когда изучаемый феномен находится под влиянием игры случайных факторов. Но насколько сильны эти факторы по сравнению с влиянием наследственности?
Чтобы понять, о чем говорят данные, Гальтону пришлось представить их в графическом виде, более наглядном, чем столбец чисел. Впоследствии он вспоминал:
Я начал с линованного листа бумаги, разграфленного поперек, с горизонтальной шкалой, соответствующей росту сыновей, и вертикальной шкалой для обозначения роста отцов. Кроме того, я сделал отметки карандашом в тех местах, которые соответствовали росту каждого сына и росту его отца{219}.
Подобный метод визуализации данных берет свое начало в аналитической геометрии Рене Декарта, предлагающего нам рассматривать точки на плоскости как пары чисел (координата х и координата y). Таким образом, аналитическая геометрия объединила алгебру и геометрию прочными объятиями, в которые они заключены с тех пор навсегда.
Каждой паре «отец – сын» соответствует пара чисел, а именно – рост отца, затем рост сына. Рост моего отца 185 сантиметров, у меня такой же рост; следовательно, если информация о нашем росте входила бы в набор данных Гальтона, мы были бы записаны как (185, 185). И Гальтон зафиксировал бы наше существование, отметив на своем листе бумаги точку с координатами x = 185 и y = 185. Для каждого сына и отца в огромном массиве данных Гальтона необходимо было сделать отметку на бумаге, и это продолжалось до тех пор, пока на листе не появлялось множество точек, отображающих весь диапазон значений роста. Гальтон изобрел тип графика, который мы называем теперь диаграммой разброса[258]{220}.
Диаграммы разброса особенно хорошо раскрывают взаимосвязи между двумя переменными. Загляните в любой современный научный журнал – почти в каждом найдется целый ряд таких диаграмм. В конце XIX столетия наступил период расцвета визуализации данных. Шарль Минар в 1869 году составил знаменитую диаграмму, отображающую резкое сокращение численности армии Наполеона во время похода в Россию и последующего отступления (эту диаграмму часто называют величайшим графиком всех времен). Диаграмма Минара, в свою очередь, была преемником диаграммы Флоренс Найтингейл «петушиный гребень»[259], на которой со всей наглядностью было показано, что в ходе Крымской войны большинство британских солдат погибли от различных инфекционных заболеваний, а не от рук русских.
Диаграмма «петушиный гребень» и диаграмма разброса согласуются с нашими когнитивными способностями: мозг человека плохо воспринимает столбцы чисел, но прекрасно справляется с анализом закономерностей и данных, представленных в двумерном поле зрения.
В некоторых случаях это не вызывает никаких трудностей. Предположим, например, что каждый сын и отец имеют одинаковый рост, как у меня с моим отцом. Это та самая ситуация, когда случай не играет никакой роли[260], а ваш рост целиком и полностью зависит от унаследованных от отца качеств. В таком случае все точки нашей диаграммы разброса будут иметь одинаковые координаты x и y; другими словами, они будут сосредоточены в непосредственной близости от диагональной линии, уравнение которой x = y: