.
Вероятности
.
Эволюция неплохо подготовила нас к оцениванию вероятностей. Мы умеем за доли секунды оценить ситуацию и решить: сыграть или удрать? Сбивать пламя или бежать в безопасное место? Мы также воспитываем в себе понимание того, что новая информация воздействует на вероятности некоторых событий. Например, даже если вы не знаете, интересуется ли классической музыкой ваша новая знакомая, вы, скорее всего, оцените шансы «за» ниже, если обнаружите, что она путает Шумана и Шуберта.
.
Эти довольно расплывчатые идеи можно выразить математически точно, используя понятие
условной вероятности. В качестве математического примера рассмотрим вероятность выпадения чётного числа при бросании игральной кости. Она, конечно же, равна ½. Однако, если известно, что выпало простое число, то эта вероятность падает до 1/3, так как между 1 и 6 только три простых числа - 2, 3 и 5 - и только одно из них - 2 - чётное.
.
В математике имеется формула, известная под названием
формулы Байеса, которая позволяет обращать условные вероятности. Представьте себе бармена, которому по опыту известен процент посетителей, оставляющих чаевые. Допустим, что это в среднем 40%, а для туристов это среднее увеличивается до 80%. Поэтому, информация о том, что кто-то из посетителей - турист, увеличивает шансы на то, что он оставит чаевые. Формула Байеса позволяет сделать и обратный вывод: зная, что оставлены чаевые, можно вычислить вероятность того, что оставивший был именно туристом.
.
Впрочем, нельзя сказать, что вычисления вероятности получить чаевые - фундаментально важная задача. Однако те же самые методы применимы к гораздо более важным вопросам. Знаменитый пример -
эффективность медицинских тестов. Чему равна вероятность, что у меня определённая болезнь, если результат теста оказался положительным? Тех, кто имеет опыт получения положительного результата, можно утешить математически - эта вероятность гораздо меньше, чем подсказывает интуиция. Эволюция запрограммировала на быть слишком пессимистичными в этом случае. Математика развеивает этот миф.
.
НО это не математический блог, так что подробных изложений того, что из себя представляют вероятности, в т.ч. условные, и сама формула Байеса здесь не будет - поиском в интернете очень легко получить всю информацию на эту тему. Я приведу лишь «выжимку» из теории и покажу, как её можно применить в реальной жизни.
.
Итак, самые важны моменты для нашего «эксперимента»: если А и В - два возможных исхода случайного эксперимента, то Р(А|В) обозначает вероятность осуществления А, если известно, что произошло событие В. В нашем случае событие А это «я болен», а событие В - «тест положительный».
.
Иллюстрация: например, пусть из стандартной колоды в 52 листа извлекают наугад карту. Обозначим А событие «валет пик», а В - «карта пик». Тогда вероятность А равна 1/52, поскольку всего есть 52 карты, и с равными вероятностями может быть извлечена любая из них. Однако, если известно, что извлечена карта пик (осуществилось событие В), то вероятность (условная вероятность) валета пик увеличивается до 1/13, поскольку в колоде 13 различных карт пик.
.
В простейшем случае в формулу Байеса входят два события, А и В. Считается, что известна вероятность Р(В) того, что произойдёт событие В, а также известны условные вероятности Р(А|~В) и Р(В|А). Здесь ~В обозначает событие, дополнительное к В (т.е. событие В не осуществляется), так что если событие В - «карта пик», то ~ В - «карта червей, бубен или треф».
.
.
Тест на корь
.
Теперь можно уточнить, о чём говорит наш медицинский пример, в котором речь идёт о диагностике редкой болезни. Не будем вспоминать
СПИД или
рак, пусть это будет
корь. Однажды утром у себя на лице вы обнаруживаете красноватую сыпь и немедленно хотите узнать, не заразились ли вы корью. Врач назначает тест на корь, и его результат оказывается положительным. Больны вы или нет?
.
Обозначим А событие «тест на корь положителен», а В - событие «у меня корь». Чтобы воспользоваться формулой Байерса, нам нужно знать вероятности Р(В), Р(А|В) и Р(А|~В).
.
Р(В) - вероятность того, что у меня в принципе может быть корь; среди взрослых это редкая болезнь, и мы можем положить её равной 5%, т.е. Р(В)=0,05.
.
Условная вероятность Р(А|В) описывает надёжность теста: чему равна вероятность того, что для больного человека тест даёт положительный результат? Если бы тест был совершенным, эта вероятность была бы равна 1,0 или 100%. Однако таких тестов не существует, и можно только надеяться приблизиться к идеалу. Мы оптимистически положим эту вероятность равной 0,98 (98%).
.
Р(А|~В) - вероятность того, что тест даёт положительный результат, несмотря на то, что вы здоровы. Также было бы хорошо, чтобы это значение было равно нулю, но и эта цель недостижима. Реалистично положить вероятность «фальшивого положительного» результата равной 20% - Р(А|~В)=0,2.
.
Теперь можно приступать к вычислениям. Мы хотим знать Р(В|А) - вероятность того, что при положительном результате действительно имеется заболевание. Воспользовавшись формулой Байерса , мы получаем результат … 0,205 (!!!)
.
Вероятность того, что вы действительно больны, составляет отрадные 20%, что действительно поражает. Большинство людей ожидает, что она окажется гораздо больше. Это обусловлено тем, что, оценивая вероятность, мы недооцениваем информацию о том, что сама по себе болезнь встречается очень редко.
.
Чтобы понять, почему мы ошибаемся, оценивая эти вероятности, можно прибегнуть к геометрической интерпретации этого примера. На рисунке ниже прямоугольник символизирует все возможные интересующие нас исходы. Маленький красный кружок означает событие А - «корь». Кружочек очень маленький, потому что это очень редкая болезнь. Второй круг означает событие В - «тест положителен». Второй круг захватывает большую часть первого, ведь в случае болезни тест почти всегда даёт положительный результат. Доля малого круга вне большого мала, поскольку мы считаем ничтожным число «фальшивых отрицательных» результатов.
.
.
Однако при всех этих условиях доля круга А, захваченного кругом В, невелика: положительный результат не означает, что у вас почти наверняка корь.
.