对抗不是消灭对方,对抗是在彼此身上长出真本事

老吴是个画赝品的人。

这事儿不是什么光彩的事,但他干了一辈子。他临摹一位早已过世的大师的画,落上大师的款,卖给那些不太懂的有钱人,赚一些不算大但够吃饭的钱。

老吴有一个宿敌,叫老柳。老柳是这一带最厉害的鉴定家。每次老吴画完一幅赝品,流到市面上,最后总会有一张落到老柳手里——他要么受人之托去鉴定,要么是某个买主上门请他验真伪。每一次,老柳都能看出来那是假的

刚开始两人不认识。老吴只是听说"市场上有个老柳,什么假的他都看得出来"。老吴觉得受了挑战——他想画出一幅老柳看不出来的画。

他细细研究老柳每次"识假"的理由——通过中间人买回老柳留下的鉴定笔记。老柳第一次说:"墨色偏新,大师晚年的墨该有一种沉旧感。"老吴下次就去买了一批古墨,自己泡水做旧。第二次老柳说:"大师晚年画山的笔意有一种迟疑,这张画的山笔太顺了,假。"老吴下次就练了三个月山的迟疑笔意。第三次老柳说:"印章的边缘磨损方式不像老印章,这是新刻的。"老吴下次就做了一枚边缘做旧过的印章。

每挫败一次,老吴就长一次本事。

但是老柳也在长。老柳本来只能凭"墨色"和"笔意"判断——这是任何鉴定家都能做的。但他被老吴反复欺骗之后,他被迫学会更细的东西。当墨色不再是漏洞,他开始研究纸的纤维方向;当纤维方向不再是漏洞,他开始研究装裱接缝处的胶痕;当装裱也无懈可击,他开始研究画家落笔时手腕的细微停顿——这种东西从前没人在意,因为没必要。老吴逼他不断深入

二十年过去。

某一天,老柳收到一张画,鉴定。他看了三天三夜,最后真的判断不出来——画里所有的细节都对,墨、纸、笔、印章、笔意、纤维、装裱、停顿,没有一处不像。他思来想去,做了一件他这一辈子从来没做过的事——他在鉴定书上写了""。

那张画其实是老吴画的。

老吴拿到鉴定书,本以为会狂喜,但他没有。他一个人坐在屋里看着自己那张画,看了很久。

他终于明白:他不再是一个画赝品的人了。当一张赝品好到连最厉害的鉴定家也分辨不出,它和真品之间还有什么差别?

那张画后来被一个收藏家收走了,挂在客厅最中央的位置。老吴从来没有揭穿。他从此再也不画赝品——他开始画自己的画。他发现,他这一辈子追着一个不存在的影子练了二十年笔法,如今笔法已经是他自己的了

老柳后来也明白了那张画是假的(老吴临死前托人告诉他)。但老柳没有觉得自己输了——他知道,正是因为他每次都识破老吴,老吴才被逼着越画越好;也正是因为老吴每次都画得越来越好,他才被逼着练就了这一双天底下最锐利的眼睛

他俩谁也没赢。他俩都赢了

老柳写过一句话,后来被他的学生抄在墙上:

没有那个一辈子骗我的人,我不可能成为我。真正的鉴定家,是被赝品成全的

寓言之外

这就是 GAN(Generative Adversarial Network,生成对抗网络)——2014 年由 Ian Goodfellow 提出的、被 Yann LeCun 称为"过去十年机器学习里最 cool 的想法"的训练范式。

GAN 由两个神经网络组成:

生成器(Generator)——就是老吴,它试图生成假的、看起来像真的样本。比如生成一张假的人脸、假的风景、假的笔迹。

判别器(Discriminator)——就是老柳,它试图分辨一个样本是真实的(来自训练集),还是生成器伪造的

训练过程是一场博弈:

  • 生成器生成一批假样本,和真样本混在一起喂给判别器
  • 判别器判断每个样本是真是假——它的目标是尽量分对
  • 根据判别器的判断结果,生成器知道自己被识破在哪里——它据此更新自己的参数,下一次生成得更像
  • 同时,判别器也根据这次的胜负更新自己——下一次它能更敏锐地识破

两个网络互相成为对方的训练数据。每一次生成器进步,判别器就被迫更深入地学习真假的差别;每一次判别器进步,生成器就被迫去攻克新的破绽。

当训练收敛时(理想情况下),生成器生成的假样本,判别器只能 50/50 猜对——这意味着假样本和真样本在判别器看来无法区分。这时生成器学到的不再是简单的"复制",它真的学会了那个数据分布的本质特征

这种训练方式有几个深刻之处:

不需要明确的"对错"标签——传统监督学习需要告诉模型"这张是猫,那张是狗"。GAN 不需要任何标签,它只需要真实数据(作为判别器的正例),其他全部由两个网络互相教出来。这是一种自监督的雏形。

目标隐含、过程涌现——GAN 没有写明"生成器要生成漂亮的人脸"。它只说"骗过判别器"。但骗过判别器的唯一办法,就是真的学会人脸的统计规律目标在博弈中自然涌现,而不是被人类明确编码。

对抗带来的进步是无限的——传统模型有一个固定的训练数据集,模型学到的极限就是数据的极限。GAN 不一样,判别器越学越严格,标准本身在动态升级——这是为什么 GAN 训练出来的图像质量,远超同时代的 VAE 等其他生成模型。

GAN 在 2014-2020 年间几乎统治了图像生成。从早期能生成模糊的小猫,到后来能生成以假乱真的人脸(StyleGAN, 2019),再到能生成完整艺术作品(BigGAN)。我们今天看到的"This Person Does Not Exist"那种网站——所有的脸都是 GAN 凭空生成的——就是这场博弈的产物。

但 GAN 也有缺点。两个网络互相博弈,训练极其不稳定——容易出现"模式崩塌(mode collapse)",生成器陷入只生成几种类型的样本(永远画同一种笑脸);也容易出现"判别器太强"或"生成器太强",失衡之后无法恢复。这些问题让 GAN 工程上很难调,后来逐渐被 Diffusion Models(扩散模型) 取代——下一篇会讲到。

但 GAN 的精神没有死。它留下了一个深远的遗产:对抗训练。今天大语言模型的对齐训练里,Constitutional AI、RLHF、Self-Play——本质都有 GAN 的影子:让两个智能体相互挑战,在博弈中各自变强。AlphaGo 就是 self-play 的极致体现——它不是和人下棋学的,它是和自己下了几百万盘棋学的——每个版本的 AlphaGo 都是上个版本最严苛的判别器。

更深一层——GAN 揭示了一种关于"创造"的全新理解。我们直觉上以为创造来自单一智能体的灵感。GAN 说不是。创造可以来自一对永不停歇的对手——一个不停做出新东西,一个不停指出哪里不够好,在这场博弈中,真正的杰作浮现出来

这种描述,适用于科学进步(理论与实验互相挑战)、艺术演化(创作者与批评家互相成就)、市场竞争(产品和消费者互相塑造)、甚至婚姻(两人在长期博弈中互相磨砺)。GAN 不只是一个算法,它是一个关于"为什么对抗能产生卓越"的数学化叙述

老吴和老柳谁也没赢,但他俩共同生成了一种这世界本来不存在的画。这一对宿敌,正是这个世界上最深的伙伴

在 AI 史的位置

GAN 的故事有一个传奇开头——2014 年 蒙特利尔的一个酒吧里,博士生 Ian Goodfellow 和朋友为了一个生成模型问题争论。他在喝酒时突然想到这个对抗训练的方法,回家通宵把代码写出来,第一次跑就成功了。论文几个月后发表,从此整个生成模型领域被改写。

2015-2018 年 是 GAN 的黄金时代——DCGAN、Pix2Pix、CycleGAN、StyleGAN 一个接一个,图像生成质量从模糊到逼真。社交网络上涌现了一波"AI 艺术",大多是 GAN 的产物。2018 年 Christie's 第一次拍卖了一幅 GAN 生成的画(Edmond de Belamy),成交价 43 万美元。

2020 年之后,Diffusion 模型崛起,DALL-E 2(2022)、Stable Diffusion(2022)、Midjourney 全部基于 Diffusion 而非 GAN。GAN 在图像生成上让位了。但对抗训练的精神——从 RLHF 到 self-play 到对抗鲁棒性研究——渗透进了整个 AI 领域。Goodfellow 那一晚的灵感,改变的不只是图像生成,是关于 "学习" 这件事的本质理解

版权声明: 如无特别声明,本文版权归 sshipanoo 所有,转载请注明本文链接。

(采用 CC BY-NC-SA 4.0 许可协议进行授权)

本文标题:10. 画赝品的人和他的宿敌

本文链接:https://www.sshipanoo.com/blog/ai/ai-fables/10-画赝品的人和他的宿敌/

本文最后一次更新为 天前,文章中的某些内容可能已过时!