知道不是肯定,知道是带着权重的相信

老渔夫有个新徒弟,十六岁,喜欢追根究底。

他俩坐在码头上看雾。海上什么也看不见。徒弟问:"师父,今晚潮水什么时候来?"

老渔夫想了一会,说:"七成可能在午夜前后,两成可能拖到天快亮,一成可能根本不来。"

徒弟皱着眉:"那到底是几点?"

老渔夫不答,只指了指海面。

第二天,雾稍微散了一点。一群海鸥从远处飞过,飞得很高,沿着海岸线偏西。老渔夫看了一会,自言自语:"嗯。海鸥飞得这么高、这么早就转向,潮水多半是要早来的。"他拿出他那本破破烂烂的小本子,把刚才那个"七成、两成、一成"擦掉,改写成:"八成五午夜前,一成天快亮,半成不来"

徒弟看不懂:"师父,你为什么不一开始就说八成五?"

"我一开始没看见海鸥啊。"

第三天,有渔船提前回港,船上的人说外海的鱼群已经在往岸边赶。老渔夫又改了本子:"九成午夜前,半成天快亮"。最后一项干脆被划掉了——"潮水今晚一定来"。

徒弟越看越急:"那你昨天为什么留着那一成不来的可能?今天又划掉?"

老渔夫笑了:"昨天我没看见鱼群。昨天的我对'今晚不来'的可能性有一点保留,因为我想不出强证据排除它。今天鱼群已经在赶过来了——鱼群是不会无故赶来的——那就排除了。我不是改了想法,我是把新看到的东西算了进去。"

到了第七天,徒弟终于火了:"师父,你这一辈子没有一次是直接告诉我潮水几点。你每次都是七成八成。这算什么本事?"

老渔夫沉默了很久,然后做了一件事——他把自己那本小本子翻给徒弟看。

那本子上,密密麻麻地记着他这一辈子的预报:七成、八成、五成、九成五、四成……每一个预报旁边,是当天实际潮水的时间。

"你看这一栏。"老渔夫指着说。

徒弟看了一会儿,慢慢明白了:他师父说"七成"的那些天,大约真的有七成应验了;说"九成"的那些天,大约真的有九成应验了。他从来没有一次说"百分之百",但他从来没有一次错——因为他从来没有过那种会错的肯定

老渔夫合上本子,看着雾里的海:

你以为知道是一锤定音的事。其实知道是带着权重的相信。海告诉你一点,你就把权重挪一挪;海再告诉你一点,你再挪一挪。一辈子,我没干别的事。

寓言之外

这就是 Bayes 定理(贝叶斯推断)——AI 里所有"在不确定中做决策"问题的母法则。

老渔夫的小本子,就是 Bayes 推断在做的事:

先验(Prior)——他一开始基于经验,凭空给出的"七成、两成、一成"。这是他还没看到任何今天的证据之前,对各种可能性的初始相信。

似然(Likelihood)——海鸥早早转向、鱼群提前回港,这些观察。每一个观察的关键不是它本身发生了,而是它在每种假设下"有多正常"。如果潮水今晚早来,海鸥早飞是非常正常的;如果潮水不来,海鸥这样飞反而很反常。所以这一个观察天然地有利于"早来"假设、不利于"不来"假设

后验(Posterior)——把先验乘上似然(再除以归一化常数),就得到看到证据之后修正过的相信。这就是他擦掉旧数字、写下新数字的那一刻。

公式只有一行:

P(假设|证据) = P(证据|假设) × P(假设) / P(证据)

写成日常话就是:一个解释之所以变得更可信,是因为它能更好地预测刚才看到的事情

为什么这件事这么深?因为它颠覆了一种我们大多数人潜意识里的认知方式——我们以为思考是"找出唯一正确答案"。Bayes 告诉你不是。思考是维护一组带权重的可能性,每来一个证据,就让所有权重重新分配一次

这种思考方式,在 AI 里无处不在:

垃圾邮件过滤器——不会说"这封邮件是垃圾",会说"基于'伟哥'这个词出现 + 没有称呼 + 发件人陌生,这封邮件 96% 是垃圾"。每一个词都在用 Bayes 更新。 医学诊断——不会说"病人得了 X 病",会说"基于症状 A、检查 B、年龄 C,最可能的诊断是 X(72%),其次是 Y(20%)"。 自动驾驶——前方那个移动的物体不是直接被识别为"行人",而是"根据轮廓、速度、上下文,82% 行人,12% 自行车,6% 其他"。决策就建立在这组带权重的可能性上。

更深一层——贝叶斯式的不确定性表达,是真正的"知道"。我们的徒弟一开始追求的"几点"那种回答是伪知识——它把不确定性藏起来了,而那种藏起来的不确定性会在错误时让你猝不及防。老渔夫的"七成、八成、九成五"才是诚实的知识。它一开始看起来弱,但它从来不会过度自信地错——这一点,是它最大的力量。

机器学习里有一个对应的概念叫做 校准(Calibration):一个模型的"我有 80% 把握"必须真的对应"我说 80% 的时候,大概有 80% 是对的"。老渔夫的那本小本子,就是他自我校准的工具。今天的大语言模型最大的弱点之一,就是校准很差——它说"我确信"的时候,可能也是错的。这是个未解决的工程难题,而它的根,就在 Bayes。

最后一个话:Bayes 推断没有"找到正确答案"这一步。它只有"在新证据下更新相信"这一步。不存在"完成"的时刻——只要海上还有新的征兆,本子就要再擦再写。这听起来累,但这才是和真实世界保持契合的唯一方式。

老渔夫一辈子干的就是这件事。他不是某个时刻突然懂了潮水。他是一辈子,每一天,都在让自己的相信和海更靠近一点

在 AI 史的位置

Bayes 定理本身可以追溯到 1763 年 Thomas Bayes 的遗稿,200 多年来一直是统计学的角落里的一只小工具。它真正进入 AI 的中央,是 1980 年代 Judea Pearl 等人把它发展成"贝叶斯网络"——一种用图来表达"哪些事件在概率上彼此影响"的形式化语言。这把不确定推理从模糊的"专家系统"里解放了出来。Pearl 因这套贡献获得 2011 年的图灵奖。

后来的故事我们都知道——深度学习的浪潮把"确定性的端到端学习"推到了舞台中央,Bayes 暂时退居幕后。但今天,当大模型开始要回答"我有多确信"、"我什么时候应该说不知道"、"我在多大概率上推荐这个治疗方案"时,Bayes 又被请回了台前。它是一切诚实的不确定性表达的根。

版权声明: 如无特别声明,本文版权归 sshipanoo 所有,转载请注明本文链接。

(采用 CC BY-NC-SA 4.0 许可协议进行授权)

本文标题:06. 在雾中看潮水的渔夫

本文链接:https://www.sshipanoo.com/blog/ai/ai-fables/06-在雾中看潮水的渔夫/

本文最后一次更新为 天前,文章中的某些内容可能已过时!