Ловушка Байеса — термин необщепринятый, но мне понравился. Звучит красиво, хотя Байес ни о каких ловушках ничего не рассказывал.
Полвека назад ловушку Байеса обнаружили среди врачей. Они неправильно толковали результаты анализов.
Некоторые лабораторные исследования не гарантируют 100%-й результат: иногда результаты тестов показывают истинное положение вещей только с некоторой вероятностью. Скажем, тест на наличие заболевания может давать
1) верноположительный результат (тест обнаруживает болезнь у больного человека)
2) верноотрицательный результат (тест не обнаруживает болезнь у здорового человека)
3) ложноположительный результат (тест обнаруживает болезнь у здорового человека)
4) ложноотрицательный результат (тест не обнаруживает болезнь у больного человека)
Тесты разрабатывают так, чтобы снизить вероятность 3 и 4 исходов, ведь они вводят нас в заблуждение. Снижать одновременно вероятности их обоих не получается. Если тест очень чувствительный (срабатывает при малейших признаках болезни), то снижается вероятность ложноотрицательного результата, но повышается вероятность ложноположительного. И наоборот.
Стоимость ошибки при ложноотрицательном результате (пропустили признак тяжелой болезни на раннем этапе) велика — тяжелое развитие болезни. Стоимость ошибки при ложноположительном результате (сказали здоровому человеку, что он болен) все-таки ниже — это потеря нервов, времени и денег. Поэтому при разработке тестов снижают еще и вероятность ложноотрицательного результата за счет небольшого повышения вероятности ложноположительного.
Результаты обследования 1024 человек на наличие редкой болезни выглядят примерно так, как на картинке.
10 больных, это 1% от обследованных, обозначены яркими клетками. У 8 из них тест выявил болезнь (ярко-оранжевые клетки), а 2 пропустил (ярко-синие клетки, ложноотрицательный результат). Бледные клетки — это здоровые люди (1014 человек), у 10% (101) тест выявил болезнь (бледно-оранжевые клетки, ложноположительный результат), а у остальных (913) не выявил.
Эта картинка показывает, что совсем не похожи вероятности двух таких ситуаций:
А: Если человек болен, то результат теста положительный.
В: Если результат теста положительный, то человек болен.
И правда, вероятность А — это 8/10 = 0,8 — доля ярко-оранжевых клеток среди всех ярких,
а вероятность В — это 8/(8+101) = 0,07, то есть доля ярко-оранжевых клеток среди всех оранжевых.
50 лет назад специально организованные исследования показали, что врачи часто путают эти ситуации, и лишь 15% врачей правильно могут оценить вероятности. Именно к такой ошибке и приводит ловушка Байеса. Имя Байеса ей дали по формуле Байеса, которая и связывает вероятность причины при заданном следствии с вероятностью следствия при заданной причине.
Особенно резко ловушка Байеса проявляется, когда болезнь редкая и тяжелая. Раз болезнь редкая, то вероятность заболевания очень мала, а раз тяжелая — тест разрабатывают так, чтобы снизить вероятность ложноотрицательного результата за счет вероятности ложноположительного.
Я надеюсь, что с тех пор врачей уже научили лучше во всем этом разбираться.
История вопроса:
W. Casscells, A. Schoenberger, and T. Grayboys. Interpretation by physicians of clinical laboratory results, New England Journal of Medicine 299 (1978) 999–1001.
D.M. Eddy. Probabilistic reasoning in clinical medicine: Problems and opportunities, in: (D. Kahneman, P. Slovic, and A. Tversky, eds.), Judgement Under Uncertainty: Heuristics and Biases, Cambridge University Press, Cambridge, 1982.
G. Gigerenzer and U. Hoffrage. How to improve Bayesian reasoning without instruction: frequency formats, Psychological Review 102 (1995) 684–704.
Ответ кажется самым убедительным и верным, но не затрагивает ситуацию и новые значения. Когда вы пытаетесь применить что-то новое для уточнения это отталкивает вас назад от верного ответа. Меньше объясняй вернее будет.