【导(dǎo)语(yǔ)】从弗洛伊德解析潜意识到神经科学追踪REM睡眠脑波,人类对梦境的探索从未停歇。如今,AI也踏入这场“造梦”之旅——2015年谷歌工程师意外开启的深度梦境(jìng)(DeepDream),让(ràng)神(shén)经(jīng)网(wǎng)络(luò)以(yǐ)人(rén)脑(nǎo)视(shì)觉(jué)机(jī)制(zhì)为(wèi)原(yuán)型(xíng),通(tōng)过(guò)反(fǎn)向(xiàng)激(jī)活(huó)神(shén)经(jīng)元(yuán),将(jiāng)云(yún)朵(duo)幻(huàn)化(huà)为(wèi)狗(gǒu)、树(shù)叶(yè)睁(zhēng)开(kāi)“眼(yǎn)睛(jing)”。AI的(de)梦(mèng)境(jìng),恰(qià)似(shì)人(rén)类(lèi)REM睡(shuì)眠(mián)中(zhōng)记(jì)忆(yì)碎(suì)片(piàn)的(de)重(zhòng)组(zǔ),揭示了感知本质:我们看到的,永远是经验烙印下的主动建构。
梦境光怪陆离,探索梦境的机理是人类长久以来的课题。从弗洛伊德的潜意识解析,到现代神经科学对REM睡眠的脑波追踪,我们总在追问:那些奇异的影像从何而来?而或许你不知道的是,AI也开始做梦了。2015年,谷歌的一位工程师意外打开了这扇窗,让全世界第一次看到了神经网络眼中那个充满幻觉的奇异世界(jiè)。

图(tú)片(piàn)来(lái)源(yuán):Wikipedia
现(xiàn)代(dài)科(kē)学(xué)认(rèn)为(wèi),人(rén)脑(nǎo)做(zuò)梦(mèng)主要(yào)是(shì)因(yīn)为(wèi)睡(shuì)眠(mián)的(de)快(kuài)速(sù)眼(yǎn)动(dòng)期(qī)里(lǐ),大(dà)脑(nǎo)的(de)视(shì)觉(jué)皮(pí)层和关联区域高(gāo)度(dù)活(huó)跃(yuè),脑(nǎo)干(gàn)的(de)随(suí)机(jī)电(diàn)化(huà)学(xué)信(xìn)号(hào)转(zhuǎn)化(huà)为(wèi)生(shēng)动(dòng)、叙(xù)事(shì)般(bān)的(de)影(yǐng)像(xiàng)序(xù)列(liè)。那(nà)么(me)AI之(zhī)所(suǒ)以(yǐ)能(néng)做(zuò)梦(mèng),正(zhèng)是(shì)因(yīn)为(wèi)其(qí)核(hé)心(xīn)机(jī)制(zhì)由(yóu)人(rén)脑(nǎo)视(shì)觉(jué)皮(pí)层(céng)的(de)设(shè)计(jì)原型所启发。我们通过眼睛获取到外界信息后,大脑的处理过程就像剥洋葱,一层一层提炼信息:简单细胞先捕捉边缘信息,避免大脑被海量像素淹没。这些信号再层层上行,由更复杂的细胞组装这些边缘成基本形状,最终抵达高层细胞,把形状融成完整对象。那么既然人脑能通过这种分(fēn)层(céng)抽(chōu)象(xiàng)高(gāo)效(xiào)处(chù)理(lǐ)视(shì)觉(jué)信(xìn)息(xi),那(nà)么(me)如(rú)果(guǒ)让(ràng)人(rén)工(gōng)神(shén)经(jīng)网(wǎng)络(luò)能(néng)够(gòu)模(mó)拟(nǐ)这(zhè)个(gè)层(céng)级(jí)过(guò)程(chéng),岂(qǐ)不(bù)是(shì)就(jiù)能(néng)实(shí)现(xiàn)机(jī)器(qì)视(shì)觉(jué)了(le)?于(yú)是(shì)卷(juǎn)积(jī)神(shén)经(jīng)网(wǎng)络(luò)(CNN)就(jiù)诞(dàn)生(shēng)了(le)。
既然我们了解了CNN在识别图像时的原理,就不难理解它为什么会做梦了。平时它处理的信息是自下而上流动的:也就是前文提到的从像素到边缘,从边缘到形状,从形(xíng)状(zhuàng)到(dào)物(wù)体(tǐ)。那(nà)么(me)让(ràng)它(tā)做(zuò)梦(mèng),就(jiù)是(shì)信(xìn)息(xi)的(de)反(fǎn)向(xiàng)流(liú)动(dòng),这(zhè)就是深度梦境(DeepDream)的核心原理。
如果训练了一个能识别狗的神经网络。当它看到一张云朵的照片时,某些神经元可能会微弱地激活,因为云朵的某个边缘曲线恰好和狗耳朵的特征有那么一点相似。接着,算法会计算网络某一层神经元的激活强度,然后通过梯度上升来修改输入图像,也就是让这些神经元激活得更强烈。这个过程不断迭代更新:神经元越激活,图像就越被修改成能激活这些神经元的样子;图像越修改,神经元就越兴奋。这形成了一个正反馈循环——云朵里那一丝狗耳朵的影子被放大,然后是狗的眼睛,接着整只狗的轮廓都浮现出来了。

图片来源:Wikipedia
更奇妙的是,如果网络的不同层级来进入这个梦境,会得到完全不同的梦境效果。浅层神经元只识别简单的边缘和纹理,所以反向激活会让图像布满波纹、条纹、几何图案,像是迷幻的万花筒。而深层神经元识别的是完整物体,所以它们的梦境里到处都是眼睛、狗头、鸟、建筑,也就是那些网络在训练数据中见过无数次的东西。
这就解释了为什么DeepDream梦到的图像如此诡异:一张名画长出无数狗脸,一片树叶会睁开眼睛凝视你,建筑物的窗户会变成动物的轮廓。神经网络在用它所学到的视觉词汇,强行解读和重构这个世界。它看到的不是真实存在的东西,而是它想看到、被训练去寻找的东西。
这和人类做梦何其相似呢,我们的梦境也充满了日常经验的碎片重组,潜意识将白天的记忆、情感打碎重塑成超现实的叙事。大脑的视觉皮层在REM睡眠中自发激活时,它也在用已知的视觉概念去解读随机的神经信号,于是陌生人的脸拼贴着熟人的特征,不存在的场景融合着多个真实地点的元素。
AI的梦境,本质上是过拟合和特征幻觉的艺术化展现。感知或许从来不是对现实的被动记录,而是基于过往经验的主动建构。我们看到的世界,永远都带着我们已知的烙印。
参考文献
[1] Wikipedia. DeepDream. https://en.wikipedia.org/wiki/DeepDream (Accessed: 2025-10-10).
本文为·创作培育计划扶持作品出品丨中国科协科普部监制丨中国科学技术出版社有限公司、北京中(zhōng)科(kē)星(xīng)河(hé)文化(huà)传媒有限公司
作者:蔡文垂 中国科学院大学博士研究生 中国光学学会会员
审核:于乃功 北京工业大学教授 中国人工智能学会理事