Нассим Талеб: Почему знание частей не помогает понять целое

Нассим Талеб: Почему знание частей не помогает понять целое

by Евгений Волков -
Number of replies: 0

Нассим Талеб: Почему знание частей не помогает понять целое

Нассим Талеб
Американский экономист и трейдер, автор теории «Черного лебедя»

Автор «Черного Лебедя» о том, где ошибаются экономисты, нейробиологи, эволюционисты и специалисты по теории игр.

Попробуем развить идею, сформулированную в предыдущей главе (Как работает диктатура меньшинства), обобщить ее и придать ей чуть более технический характер.

Это поможет нам развенчать некоторые заблуждения, укоренившиеся в психологии, «эволюционной теории», теории игр, поведенческой экономике, нейробиологии и других областях знания, где не в обычае должная логическая (и математическая) строгость, несмотря на случайные вкрапления сравнительно сложных уравнений.

Например, мы увидим, почему поведенческая экономика обязательно нас подведет, даже если верно предсказывает результаты на индивидуальном уровне, и почему попытки объяснить поведение через науку о мозге — не более чем рекламный трюк, призванный повысить популярность определенных публикаций.

Примем следующее утверждение за правило: всякий раз, когда мы имеем дело с нелинейностью, среднее больше не имеет значения. Следовательно: чем более нелинейным является результат операции, тем меньше полезной информации для нас несет среднее значение.

Выпитый стакан воды приносит вам определенную пользу. Если десять стаканов воды означают в десять раз больше пользы, мы имеем дело с линейным результатом. Если это не так, то среднее потребление воды с неизбежностью окажется не так значимо, как некий другой фактор, который мы далее будем называть «неравномерностью», или волатильностью, или неравенством потребления.

Предположим, что вам необходим в среднем литр воды в сутки. Если в один из дней я дам вам десять литров воды, а в оставшиеся девять ничего — вы, скорее всего, не выживете. Общий объем воды должен быть распределен настолько равномерно, насколько это возможно. Это не значит, что вам нужно выпивать по несколько капель каждую минуту, но в масштабе дня потребление воды должно быть максимально стабильным.

Я уже писал о влиянии нелинейности результата на среднее значение — и об информационной ценности такого среднего значения — в своей книге «Антихрупкость»; собственно, это и было темой книги, поэтому я буду считать, что здесь хватит и краткого изложения. С информационной точки зрения, если кто-то говорит вам: «Мы обеспечим вам в среднем литр воды в день», он не раскрывает весьма существенную часть информации. Нужно ввести дополнительное измерение, — вариации вокруг этого среднего значения. Вы определенно умрете от жажды, если его среднее значение подразумевает сто литров воды каждые сто дней.

Обратите внимание: с математической точки зрения среднее и сумма — одно и то же с точностью до простого деления на константу, поэтому неприменимость среднего значения в определенных ситуациях указывает нам на неприменимость суммирования — в том числе это означает, что мы не можем рассматривать систему, включающую много компонентов, исходя из свойств одного из них.

Как мы видели, сложные системы определяются взаимодействием между частями, и свойства целого нельзя (во всяком случае, не так просто) вывести из свойств его частей.

Существует богатый математический аппарат для изучения внутрисистемных взаимодействий, изначально разработанный в рамках так называемой модели Изинга.

Физик Эрнст Изинг разработал ее для описания ферромагнетиков, но позже она была адаптирована ко многим другим направлениям. Модель состоит из дискретных переменных, которым соответствуют атомы, способные находиться в одном из двух состояний — «спинов».

Переменная указывает на это состояние, которое обозначается как «поле вверх» или «поле вниз» (или +1 и-1). Атомы организованы в решетку, которая позволяет каждому из них взаимодействовать со своими соседями. В элементарных случаях — например, в одномерной системе, когда для каждого атома вы рассматривате взаимодействие с двумя соседними, слева и справа от него, или в двумерной, где добавляется еще одно направление — модель Изинга проста и особенно хороша для простых решений.

Один из методов, используемых в таких ситуациях, называется «методом среднего поля», где среднее взаимодействие рассматривается в масштабах всей системы. Это возможно тогда и только тогда, когда между взаимодействиями в различных частях системы нет никакой зависимости.

Таким образом, этот метод представляет собой противоположность ренормализации, описанной в последней главе. И, конечно, такое использование среднего значения не представляется возможным, если эффект взаимодействия оказывается нелинейным.

В общем случае, худшая из возможных ошибок — использовать метод «среднего поля», высчитывая среднее и применяя к нему функцию, вместо того, чтобы находить среднее функций. Это нарушение неравенства Йенсена [неравенство Йенсена, определение: функция от среднего не является средним значением функции, и разница возрастает при нарушении однородности]. Метод среднего поля приводит к неизбежным искажениям в присутствии нелинейностей.

Сейчас это может показаться вам сложным, но в примере со средним потреблением воды вам так не казалось. Давайте попробуем найти эквивалентные простые примеры явлений, которые не сводятся к среднему.

Из предыдущей главы:

Средние диетические предпочтения населения не позволят нам понять диетические предпочтения населения в целом.

Некоторые ученые, наблюдая отсутствие арахиса в американских школах, могли бы сделать вывод, что средний ученик страдает аллергией на арахис, тогда как в действительности она обнаруживается лишь у очень небольшого процента школьников.

Или, что приводит к более серьезным последствиям:

Среднее поведение участника рынка не позволяет понять общее поведение рынка.

Эти утверждения кажутся очевидными после нашей дискуссии о ренормализации. Они могут сделать несостоятельным кое-что из того, что, как вам казалось, вы знаете. Но если мы сделаем всего один шаг дальше, мы обнаружим, что несосоятельной может оказаться вся наша наука об обществе:

Психологические эксперименты на отдельных лицах демонстрируют те или иные отклонения или когнитивные искажения, но не позволяют нам понять коллективное поведение, как и поведение групп.

Человеческую природу нельзя определить иначе как через события с участием других людей. Помните, что мы не одиночные, а коллективные существа, и почти никакая актуальная информация не относится к отдельному человеку — который, как правило, и служит объектом для изучения в лабораторном стиле.

Некоторые «когнитивные искажения», которые психолухи, желающие объявить все человеческое патологией, считают «иррациональными», могут оказаться вполне разумными, если оценивать их влияние на коллектив.

Это объясняет в том числе, почему так называемая поведенческая экономика не может дать нам больше информации, чем ортодоксальные теории (которые тоже не блещут), — ни о том, как играть на бирже, ни о планировании денежно-кредитной политики, ни об экономике в целом.

Но если мы двинемся дальше, придется вспомнить о такой штуке, как теория игр, которая мало что дала нам, кроме гор словоблудия. Почему?

Среднее взаимодействие, в том виде, как его рассматривает теория игр, предсказывает индивидуальное поведение и не позволяет вывести предпочтения и принципы поведения групп.

Группы — самостоятельные действующие единицы. Существуют качественные различия между группой из десяти и, скажем, 395 435 человек. Каждая группа — это отдельное существо, в буквальном смысле, и порой они отличаются сильнее, чем книга от здания. Когда мы смотрим на привычный нам масштаб, это может нас смутить, но с какого-то момента все становится иначе. В строгом математическом смысле.

Чем больше масштаб — другими словами, чем выше число возможных взаимодействий, — тем труднее понять большое по малому, целое по частям. Или, несмотря на всеобщий восторг по поводу нашей способности проникать в тайны сознания, используя так называемую нейробиологию:

Понимание того, как работают составляющие головного мозга (например, нейроны), никогда не позволит нам понять, как работает мозг.

Мы до сих пор не имеем ни малейшего представления о том, как работает нервная сеть нематоды Caenorhabditis elegans, в которой всего около трехсот нейронов. C. elegans была первым живым существом, чей геном полностью секвенировали. А теперь вcпомните, что в человеческом мозге около 100 млрд нейронов, и при этом система из 301 нейрона может оказаться вдвое сложнее, чем система из 300 (сказать по правде, я обнаружил ситуации, когда введение новой переменной может повысить определенный аспект сложности значительно сильнее, чем вдвое — например, переход от 1000 к 1001 переменной может вызвать рост сложности в миллиард раз). Так что мы вполне спокойно можем употребить здесь слово «никогда».

А вот еще одно правило, которое позвлит понять, почему, несмотря на превозносимые «достижения» в секвенировании ДНК, мы по-прежнему не можем получить никакой действительно новой информации, кроме как о некоторых заболеваниях:

Понимание генетического устройства организма никогда не позволит нам понять поведение самого организма.

Напомню, что это — не мое мнение. Это математический факт.

А вот мое любимое:

Большая часть локальных исследований в области экспериментальной биологии, несмотря на их видимую «научность» и доказуемость, не проходят простую проверку на математическую строгость.

Это означает, что мы должны очень осторожно судить о том, какие выводы мы можем или не можем сделать о наблюдаемых явлениях, какими бы надежными ни казались результаты, полученные на локальном уровне. Это невозможно из-за проклятия размерности, из-за того, что обычные экспериментальные методы в науке предполагают получение информации о сложной системе через ее упрощение. Невозможно.

Мой коллега Бар Ям показал, как метод среднего поля доказывает несостоятельность эволюционной теории эгоистичного гена, о которой кричат агрессивные журналисты вроде Ричарда Докинза, Стивена Пинкера и других наивных знаменитостей, которые лучше владеют английским языком, чем теорией вероятности. Он продемонстрировал, что частные свойства, определяемые геном, не могут сохраняться в силу простых географических причин, следовательно, если такое понятие, как эгоистичный ген, и существует, оно может сильно отличаться от того, как его описывают. Недостатки концепции «эгоистичного» обнаруживаются, если рассматривать их математически, как Мартин Новак и его коллеги.

Фридрих фон Хайек, очень глубоко понимавший свойства сложных систем, выдвинул идею «наукообразия», которая развенчивает бессмыслицу, которую сделали похожей на науку, чтобы получить власть, деньги, друзей, украшения, приглашения на обед с норвежским министром культуры, возможность использовать VIP-зону в аэропорту Казани и другие подобные бонусы.

С развитием науки мы увидим и дальнейшее развитие наукообразной ереси. Чтобы противостоять ей, я делаю следующее:

  1. Проверяю в любой системе наличие простой нелинейности, следовательно, неравенства Йенсена. Если такая нелинейность обнаруживается, я звоню Янибу Бар-Яму в Институт сложных систем Новой Англии для дружеской беседы о надежности результатов;
  2. Если авторы работы используют что-нибудь, хоть отдаленно напоминающее «регрессию» и «P-значение», я игнорирую количественные результаты.
Подробнее на https://ru.insider.pro/opinion/2016-09-12/nassim-taleb-pochemu-znanie-chastej-ne-pomogaet-ponyat-celoe/

1526 words