Статистика по раку груди
ОнкологияВычитала в статье, где разбирают теорему Байеса на примере статистики по маммографии. Оказалось, что более 90% женщин, у которых маммография дает положительный результат, в действительности не больны раком груди.
Обратимся к частному случаю, связанному с эффективностью массовых обследований. Мы знаем (это наше априорное убеждение), что к 40 годам у 1% женщин развивается рак груди (p(A) = 0,01). Кроме того, у нас есть хороший метод выявления рака груди — маммография (этот метод дает нам новые сведения). Результат маммографии будет положительным у 80% женщин с раком груди (p(X|A) = 0,8) и лишь у 9,6% женщин без рака груди (p(X|~A) = 0,096). Таковы вероятности получения наших сведений в случае, если наше убеждение истинно. Судя по этим цифрам, кажется очевидным, что регулярные обследования на предмет наличия рака груди — вещь хорошая. Итак, если мы обследуем всех женщин, то какова будет среди тех, у кого обследование даст положительный результат, доля тех, у кого действительно будет рак груди, то есть каково будет значение p(A|X)?
Учитывая, что этот метод кажется хорошим, каково будет ваше убеждение относительно женщины, для которой только что получен положительный результат маммографического обследования на рак груди? Большинство людей сказали бы, что у нее, скорее всего, рак груди. Но применение теоремы Байеса показывает, что это мнение ошибочно. Мы можем легко убедиться в этом, если на время забудем о вероятностях. Вместо этого давайте рассмотрим 10 000 женщин в возрасте 40 лет и старше.
Еще до обследования эти 10 000 женщин можно мысленно разделить на две группы:
Группа 1: 100 женщин с раком груди;
Группа 2: 9 900 женщин без рака груди.
Группа 1 — этот тот 1% женщин, у которых развился рак: p(A)
После обследования женщин можно разделить на четыре группы:
Группа А: 80 женщин с раком груди и положительной маммографией;
Группа Б: 20 женщин с раком груди, но с отрицательной маммографией.
Группа А — это те 80% женщин с раком груди, у которых его выявляет маммография: p(X|A)
Группа В: 950 женщин без рака груди, но с положительной маммографией;
Группа Г: 8 950 женщин без рака груди и с отрицательной маммографией.
Группа В — это те 9,6% женщин, у которых нет рака груди, но результат маммографии положительный: p(X|~A).
Итак, результат обследования оказался положительным у 950 женщин, у которых нет рака груди, и только у 80 женщин, у которых есть рак груди. Чтобы ответить на вопрос “Какова доля женщин с раком груди среди тех, у кого результат маммографии положительный?”, мы разделим число женщин в группе A на суммарное число женщин в группах А и В (то есть на общее число женщин с положительной маммографией). Это даст нам ответ 7,8%. Иными словами, более 90% женщин, у которых маммография дает положительный результат, в действительности не больны раком груди. Несмотря на то что маммография — хороший метод выявления рака груди, теорема Байеса говорит нам, что получаемые с ее помощью сведения сравнительно малоинформативны15. Проблема возникает оттого, что мы обследуем сразу всех женщин в возрасте 40 лет и старше. Для женщин этой большой группы априорное ожидание рака весьма невелико. Теорема Байеса показывает, что результаты маммографии будут намного информативнее, если обследовать “группы риска”, например женщин, у которых в семье были случаи рака груди.
Источник:
P.s. лично я не призываю не проходить обследования, но знаю много примеров, когда люди сгорали за неск. месяцев, узнав, что у них рак.