世界上最有用的数学思维之一——贝叶斯定理大白话讲解
(来源:图灵人工智能)
转自Python数智工坊,仅用于学术分享,如有侵权留言删除张三做了一次癌症筛查,结果显示阳性。
医生告诉他,这个检测的准确率高达99%。
张三当场崩溃,觉得自己大概率得了癌症。
但如果我告诉你:张三真正患癌的概率,可能只有不到10%。
这不是在安慰他,这是数学。背后的逻辑,来自一个18世纪英国牧师的遗作——贝叶斯定理。
一、他是谁?一个从未见过自己最伟大作品出版的人
托马斯·贝叶斯(Thomas Bayes),1702年生于英国,牧师出身,业余数学家。
他的一生默默无闻,既没有大学教职,也没有任何重要头衔,在英国皇家学会的会员身份,据说还是朋友帮他争来的。
1761年,贝叶斯去世,留下了一篇从未发表的手稿,甚至连他自己可能都不太确定这篇东西有没有价值。
他的朋友理查德·普莱斯整理了这份遗稿,两年后以贝叶斯的名义发表。文章几乎没有引起任何反响。
此后将近200年,这个定理被遗忘、被质疑、被主流数学界打压。直到20世纪下半叶,随着计算机的出现,它才重新被发现——并在短短几十年内,彻底改变了统计学、人工智能、医学诊断、搜索引擎……几乎所有需要"在不确定中做决策"的领域。
一个牧师的遗作,迟到了200年,改变了世界。
二、贝叶斯定理在讲什么?一句话的核心
在讲公式之前,先记住这一句话:
当你获得新证据时,你应该如何更新自己原有的判断。
就这一句。
听起来很简单,但这句话背后隐藏着一种和我们日常直觉截然不同的思维方式。
三、一个故事:侦探破案
侦探老李接到一起案件:公司保险柜里的钱不见了,嫌疑人只有两个:财务A和仓管B。
第一步:初始判断
在没有任何证据之前,两人的嫌疑程度相当,老李初步估计A是嫌疑人的概率是50%。
这在贝叶斯语言里叫做先验概率——在看到新证据之前,对某件事的初始判断。
第二步:发现了新证据
调查发现,案发当晚A的门禁卡有异常刷卡记录,而B的记录完全正常。
老李要问两个问题:
如果A真的是嫌疑人,他的门禁卡出现异常的概率有多高?—— 假设是80%
如果A不是嫌疑人,门禁卡也出现异常的概率有多高?—— 假设是20%(可能是系统故障)
第三步:更新判断
贝叶斯定理把这些数字组合起来,告诉老李:在看到"门禁卡异常"这个证据之后,A是嫌疑人的概率是多少?
计算下来约为**80%**。
从50%升到了80%——证据让怀疑更有分量了,但老李不会就此盖棺定论,他还需要继续收集证据。
如果接下来又发现A当天的通话记录有异常,他会再做一次更新;如果又发现A有不在场证明,概率会往回调。
每一条新证据,都是一次更新。这就是贝叶斯定理的核心:用新证据,持续校准判断。
四、公式长什么样?换个写法就懂了
贝叶斯定理的数学表达式是:
P(A|B) = P(B|A) × P(A) / P(B)
把故事里的话对应进来:
符号
意思
故事里的对应
P(A)
先验概率:事件A本来发生的概率
A是嫌疑人的初始概率(50%)
P(B|A)
在A成立的前提下,看到证据B的概率
A是嫌疑人→门禁异常的概率(80%)
P(B)
证据B本身出现的概率(不管原因)
门禁异常这件事本身出现的概率
P(A|B)
后验概率:看到证据B后,A成立的概率
看到门禁异常后,A是嫌疑人的概率
用大白话翻译这个公式:
更新后的判断= 证据对这个判断的支持力度 × 原始判断÷ 这个证据本身出现的概率
或者更口语地说:
新判断 = 旧判断 × 这个证据有多"指向"这个判断
五、回到张三:癌症筛查那个反直觉的结论
现在有了工具,回来解开开头那个让张三崩溃的问题。
已知条件:
某种癌症在人群中的患病率:**1%**(100个人里约有1个患者)
检测准确率:**99%**(真正患癌的人,99%会被检出;没患癌的人,99%显示阴性)
张三的检测结果:阳性
直觉告诉我们:准确率99%,阳性结果,那大概率是真的患癌了。
贝叶斯告诉我们:先等一下,把这件事放到10000个人里想一想。
10000人里参加筛查:│├── 真正患癌:100人(患病率1%)│ ├── 检测阳性:99人 ← 真阳性(被正确检出)│ └── 检测阴性:1人│└── 没有患癌:9900人 ├── 检测阳性:99人 ← 假阳性(被误报) └── 检测阴性:9801人
所有检测阳性的人:99 + 99 = 198人
其中真正患癌的:99人
所以张三检测阳性,真正患癌的概率:99 ÷ 198 = 50%
而如果这种癌症更罕见,患病率只有**0.1%(1000人里1个),那阳性之后真正患癌的概率只有约9%**。
准确率99%的检测,阳性结果只有9%的可能是真的患癌——这不是数学魔术,这是真实的医学统计现象,有个专有名词叫**"假阳性悖论",也称"基础率谬误"**。
核心教训:任何检测结果,都必须结合"这个病本身有多罕见"来解读,而不能只看准确率。
这也是为什么很多筛查分阶段进行:初筛阳性→精确复查→再次更新概率判断→最终确诊。每多一条证据,判断就更准一次。
六、贝叶斯思维,对普通人的三个实际用处
贝叶斯定理不只是数学公式,更是一种在不确定的世界里理性决策的思维框架。
用处一:不要被"一个证据"彻底翻盘
你对同事小王的印象一向不错——工作认真,为人靠谱(先验:他是个靠谱的人,90%)。
然后有人跟你说,小王在背后说了你的坏话(新证据)。
直觉反应:立刻把对他的信任清零,从此疏远。
贝叶斯反应:先问两个问题——这个消息来源可靠吗?即使消息属实,这一件事能否推翻你们多年相处积累的90%信任度?
证据会更新判断,但更新的幅度,取决于证据的可靠程度和你的先验有多强。一条二手传言,不应该让一段长期积累的判断瞬间归零。
贝叶斯不让你无视证据,但也不允许你被单一证据绑架。
用处二:识破"以偏概全"的陷阱
新闻报道:某地有人因为吃外卖食物中毒。
很多人看完就开始恐慌,不敢点外卖了。
贝叶斯会问:这件事有多罕见?它改变了多少概率?
如果每天有1亿个外卖订单,出现1例食物中毒,概率是0.000001%。这条新闻会轻微更新你对外卖安全性的判断——但更新幅度应该极小,而不是引发全面恐慌。
稀少的坏事之所以总上新闻,恰恰是因为它稀少。 贝叶斯帮你把"新闻的显著性"和"事件的真实概率"分开来看,避免被媒体的选择性报道带偏判断。
用处三:做更好的决策,即使信息不完整
假设你在考虑投资一个创业项目。
你不可能100%确定它会成功,但贝叶斯给你一套清晰的决策框架:
先估基础成功率(行业内同类早期项目的存活率,假设20%)—— 这是先验
逐条收集证据,逐次更新:
创始人有成功退出经验?概率上调
产品已有付费用户?再上调
所在赛道竞争极度激烈?下调
核心团队刚刚有人离职?再下调
最终你的判断,不是来自某一个决定性信号,而是来自所有证据的综合积累。
这才是理性决策的真实面目——不是"感觉对了就冲",也不是"没有百分百把握就不动",而是基于现有证据给出当下最合理的判断,并随时准备更新。
七、贝叶斯改变了哪些领域?
贝叶斯定理已经深入渗透进现代世界的技术底层,你每天都在用,只是不知道。
垃圾邮件过滤看到"免费领取""点击链接""恭喜中奖"这些词,系统用贝叶斯不断更新"这封邮件是垃圾邮件的概率",超过阈值就进垃圾箱。这是最早被大规模落地的AI应用之一。
医学诊断辅助医生做鉴别诊断的过程,本质上就是贝叶斯推断:根据症状(证据),不断更新对各种疾病的概率判断,最终锁定最可能的诊断结论。
搜索引擎与推荐算法你输入"苹果",搜索引擎要判断你是想找苹果手机还是苹果水果——它综合你的历史行为、当前上下文、地理位置,用贝叶斯估计最可能的意图。
大语言模型ChatGPT、Claude这类AI,底层的语言生成逻辑,本质上就是在不断预测"下一个最可能出现的词"——这是贝叶斯概率推断的直接应用。
自动驾驶自动驾驶汽车用贝叶斯滤波持续融合摄像头、雷达、激光雷达的传感器数据,实时更新对周围环境的感知和判断,毫秒级做出行驶决策。
八、贝叶斯思维最难的地方:承认"我不确定"
贝叶斯定理有一个前提,是很多人心理上不愿意接受的:
你必须先给出一个初始概率——哪怕是估算的。
传统的严谨观念认为:没有足够数据,不能下结论,猜测是不科学的。
贝叶斯说:你永远需要从某个起点出发。承认"我现在只有60%的把握",比假装"我没有意见"要诚实得多,也有用得多。随着证据积累,你的判断会越来越准。
确定性不是判断的前提,而是不断积累证据之后的结果。
结语
一个18世纪的英国牧师,在去世前写下了一篇关于概率的手稿。他不会知道,它会被写进每一台自动驾驶汽车的算法里、每一个垃圾邮件过滤器里、每一次医学影像的图像重建里。
贝叶斯定理的本质,是一种对世界更谦逊、也更理性的态度:
我不知道真相,但我会根据现有证据给出最好的判断;当新的证据出现,我会更新判断,而不是死守立场。
这不只是数学,这是面对不确定世界的生存哲学。
相关推荐
数学思维赛道正热,「何秋光数学思维」的逻辑是先做好教育内容
从奥数到数学思维,数学才是永远的教育创业风口?
一周项目盘点:36艺教育广场、何秋光数学思维、Lingumi、码高教育、怀特海教育
最有用的算法是减法
资本热钱下,数学思维教育真的有“思维”了吗?
“符号数学”终于向“神经网络”屈服:AI 学会数学证明了?
36氪首发 | 小岳岳也在为课后辅导发愁?获得 1600 万元融资的「火光摇曳」要解决家庭数学辅导这个难题
对抗冠状病毒,世界上最强大的超级计算机已加入战斗
数学思维2019:快速蹿红与暗夜焦虑
36氪独家 | 「豌豆思维」获新东方领投数亿元 B 轮融资,数学思维异军突起
网址: 世界上最有用的数学思维之一——贝叶斯定理大白话讲解 http://www.xishuta.cn/newsview148249.html
推荐科技快讯
- 1问界商标转让释放信号:赛力斯 95792
- 2报告:抖音海外版下载量突破1 25736
- 3人类唯一的出路:变成人工智能 25175
- 4人类唯一的出路: 变成人工智 24611
- 5移动办公如何高效?谷歌研究了 24309
- 6华为 nova14深度评测: 13155
- 7滴滴出行被投诉价格操纵,网约 11888
- 82023年起,银行存取款迎来 10774
- 9五一来了,大数据杀熟又想来, 9794
- 10手机中存在一个监听开关,你关 9519
