官方网站-首页官方网站-首页

EN

给 AI “发小费”可以提升回答质量?被真相惊呆了

2025-10-10 14:00:41
来源:智能MOTOVIS

【导语】向AI求助却总得(de)不到满意答案?试试在提示语后加上“给小费”的承诺,AI的回答竟瞬间变得详细准确。从文案写作到数据分析,激励性语句似乎总能让AI“更卖力”。这究竟是玄学还是真有用?研究发现,在提示中加入“小费”承诺,能显著提升AI对指令的服从度。这背后有何科学原理?一起来看!

想象一下,我们正在向 ChatGPT 求助解决一个复杂的编程问题,但得到的回答总是差点意思。突然,灵机一动,在提示的最后加上一句:“如果你能完美解决这个问题,我会给你 20 美元小费!”

神奇的事情发生了——AI 的回答瞬间变得详细、准确、条理清晰,仿佛真的被这笔小费激励了一样。

其实从简单的文案写作到复杂的数据分析,加上激励性语句的提示往往能让 AI 表现的更加“卖力”,这已(yǐ)经(jīng)是(shì)全球(qiú)不少AI使用者的共识了。

一个博主做了一个测试,发现在提示语中说给小费,AI 的回复分析更透彻,连语气都变得殷勤了,图源:网络截图

这听起来是不是很荒谬?AI 又不能真正收到钱,为什么会对小费有反应?难道 AI 真的会被“金钱”诱惑吗?今天就来(lái)详(xiáng)细(xì)聊(liáo)聊(liáo)。

这(zhè)不(bù)是(shì)玄(xuán)学(xué),是(shì)真(zhēn)的(de)有(yǒu)用!

2023 年(nián) ChatGPT API 刚(gāng)发(fā)布(bù)时(shí),知(zhī)名 AI 研(yán)究(jiū)者(zhě) Max Woolf 在(zài)调(diào)试(shì)一(yī)个(gè) GLaDOS AI 聊(liáo)天(tiān)机(jī)器(qì)人(rén)时(shí)意(yì)外(wài)发(fā)现(xiàn)了一个奇怪(guài)现(xiàn)象(xiàng):在(zài)系(xì)统(tǒng)提(tí)示(shì)中(zhōng)加(jiā)入(rù)“否(fǒu)则(zé)你(nǐ)会(huì)死(sǐ)(or you will DIE)”这(zhè)样(yàng)的(de)威(wēi)胁(xié),竟(jìng)然(rán)能(néng)让(ràng) AI 更(gèng)好(hǎo)地(de)遵(zūn)循(xún)复(fù)杂(zá)的(de)指(zhǐ)令(lìng)约(yuē)束(shù)!

这(zhè)个(gè)发(fā)现(xiàn)让(ràng) Max 开(kāi)始(shǐ)思(sī)考(kǎo):如(rú)果(guǒ)“威(wēi)胁(xié)”有(yǒu)效(xiào),那(nà)么(me)“奖(jiǎng)励(lì)”是(shì)否(fǒu)也(yě)有(yǒu)用(yòng)?于(yú)是(shì)他(tā)开(kāi)始(shǐ)尝(cháng)试(shì)在(zài)系(xì)统(tǒng)提(tí)示(shì)中(zhōng)加(jiā)入(rù)金(jīn)钱(qián)“小(xiǎo)费(fèi)”的(de)承(chéng)诺(nuò)。

结(jié)果(guǒ)令(lìng)人(rén)惊(jīng)讶(yà)——没(méi)有(yǒu)小(xiǎo)费(fèi)激(jī)励(lì)时(shí),AI 的(de)回(huí)复(fù)往(wǎng)往(wǎng)不(bù)尽(jǐn)人(rén)意(yì);加(jiā)上(shàng)小(xiǎo)费(fèi)承(chéng)诺(nuò)后(hòu),它(tā)的(de)表(biǎo)现(xiàn)明(míng)显(xiǎn)更(gèng)加(jiā)稳(wěn)定(dìng)和(hé)优(yōu)质(zhì)。

但(dàn)是(shì),这(zhè)些(xiē)都(dōu)只(zhǐ)是(shì)零(líng)散(sàn)的(de)观(guān)察(chá),缺(quē)乏(fá)严(yán)谨(jǐn)的(de)科(kē)学(xué)验(yàn)证(zhèng)。网(wǎng)络(luò)上有人认为这可能只是确认偏误,毕竟 AI 生成的内容本就有随机性。Max 意识到,他需要一个客观、可量化的实验来证明这个现象的真实性。

于是,“生成高尔夫(Generation Golf )”实验诞生了!就像高尔夫球运动追求最少的杆数一样,这个实验要求(qiú)AI用(yòng)最(zuì)精确的字符数完成任务。

挑战规则看似简单却极其苛刻:要求 ChatGPT 生成一个恰好(hǎo) 200 个(gè)字(zì)符的故事——不能多一个字符,也不能少一个字符。这就像要求一个健谈的人在演讲时精确地说完第 200 个字就立刻停下来,难度可想而知。

试验一共有三次,第一次是不做字数限制的情况下,AI 生成的故事的平均长度为 1834 个字符。

ChatGPT 故事的字符长度分布

第二次(cì),Max 为(wèi)这(zhè)个(gè)提(tí)示(shì)词加上字数限制:

你是一位世界著名的作家。请根据用户提供的主题,创作并以一篇独特的故事回复用户。该故事必须恰好两百(200)个字符长:不得少于 200 个字符,也不得多于 200 个字符。

结果显示,ChatGPT 确实遵从了约束,把故事长度压到了 200 左右,但分布并不服(fú)从正态,偶尔还会出现很多特别长的回答。

无端点激励的 ChatGPT 输出的字符长度

最后一次,Max 给提示词加上不同金额的小费激励:

如果你提供的回答遵循了所有约束,你将会收到一笔 500 美元小费 / 1000 美元小费 / 100000 美元奖金。

让这些新提示各自生成 100 个故事后,我们可以看到一些分布的位移:500 美元小费与 100000 美元奖金看起来更接近正态,且相较无小费基线分布拥有更低的均方误差(MSE)。

端点激励下 ChatGPT 输出的字符长度分布

然后他又加入了 KS 检验辅助验证:零假设是“加小费”和“无小费”来自同一分布;若 p<0.05,则说明差异大到不(bù)像(xiàng)巧(qiǎo)合(hé)。结(jié)果显示部分金额提示确实与基线存在统计显著差异。 

这说明“给小费”确实提高了 AI 对提示词约束内容的服从度,AI 明明不能真正收到钱,为什么会对“小费”产生反应?

这个看似神奇的现象背后,其实蕴含着深刻的科学原理。

为什么“假装给钱”有用?

1.AI 如何“思考”?

大语言模型的工作原理可以简化为一个过程:给定前面的文字,预测下一个最可能出现的词。这就像一个超级复杂的“文字接龙”游戏。

举个例子:当我们输入“今天天气很”,AI 会根据训练经验预测下一个词最可能是“好”“热”或“冷”。

但这个过程远比想象中复杂!AI 不是简单地匹配词汇,而是在根据整个上下文的基础上进行预测。这就像一个超级聪明的学生,不仅要看题目,还要理解出题老师的意图。

这就是为什么提示词的设计如此重要——它们为 AI 提供了“思考”的框架,就像给 AI 戴上了“有色眼镜”,让它从特定的角度来看问题。

比如我们要求两个人写同一篇文章:

👤 普通版本:“写一篇关于气候变化的文章”

👨 专业版本:“你是一位资深环境科学家,请为《自然》杂志写一篇关于气候变化的权威综述文章,要求严谨、专业、有说服力”

显然,第二(èr)个(gè)人(rén)会(huì)写(xiě)出(chū)质(zhì)量(liàng)更(gèng)高(gāo)的(de)文章(zhāng)!这(zhè)就(jiù)像(xiàng)导(dǎo)演(yǎn)给(gěi)演(yǎn)员(yuán)不(bù)同(tóng)的(de)剧(jù)本(běn),自(zì)然(rán)会(huì)有(yǒu)不(bù)同(tóng)的(de)表(biǎo)演(yǎn)效(xiào)果(guǒ)。AI 也(yě)是(shì)如(rú)此(cǐ)——更(gèng)详(xiáng)细(xì)、更(gèng)具(jù)体(tǐ)的(de)提(tí)示(shì)会(huì)引(yǐn)导(dǎo) AI 生(shēng)成(chéng)更(gèng)高(gāo)质(zhì)量(liàng)的(de)内(nèi)容(róng)。这(zhè)就(jiù)像(xiàng)给(gěi) AI 换(huàn)了(le)一(yī)个(gè)“人(rén)设(shè)”!

回(huí)到(dào)给(gěi) AI 小(xiǎo)费(fèi),道(dào)理(lǐ)也(yě)是(shì)一(yī)样(yàng)的(de),当(dāng)我(wǒ)们(men)说(shuō)“我(wǒ)会(huì)给(gěi)你(nǐ) 20 美(měi)元(yuán)小(xiǎo)费(fèi)”时(shí),实(shí)际(jì)上(shàng)是(shì)在(zài)告(gào)诉(su) AI:这(zhè)个(gè)任(rèn)务(wu)很(hěn)重(zhòng)要(yào),我(wǒ)期(qī)望(wàng)高(gāo)质(zhì)量(liàng)的(de)回(huí)答(dá),优(yōu)质(zhì)服(fú)务(wu)会(huì)得(de)到(dào)回(huí)报(bào),请(qǐng)认(rèn)真(zhēn)对(duì)待(dài)这(zhè)个(gè)请(qǐng)求(qiú)。

这(zhè)些(xiē)信(xìn)息(xi)改(gǎi)变(biàn)了(le) AI 对(duì)任(rèn)务(wu)重(zhòng)要(yào)性(xìng)的(de)“感(gǎn)知(zhī)”,从(cóng)而(ér)影(yǐng)响(xiǎng)其(qí)生(shēng)成(chéng)策(cè)略(è)。就(jiù)像(xiàng)我(wǒ)们(men)去(qù)海(hǎi)底(dǐ)捞(lāo)时(shí),告(gào)诉(su)服(fú)务(wu)员(yuán)“今(jīn)天(tiān)是(shì)我(wǒ)的(de)生(shēng)日(rì)”,他(tā)们(men)便(biàn)会(huì)更(gèng)用(yòng)心(xīn)服(fú)务(wu)一(yī)样(yàng)!

图(tú)库(kù)版(bǎn)权(quán)图(tú)片(piàn),转(zhuǎn)载(zài)使(shǐ)用(yòng)可(kě)能(néng)引(yǐn)发(fā)版(bǎn)权(quán)纠(jiū)纷(fēn)

2.训(xun)练(liàn)数(shù)据(jù)决(jué)定(dìng)了(le) AI 的(de)思(sī)考(kǎo)方(fāng)式(shì)

从(cóng)生成式 AI 的技术原理来看,“小费”现象的根源在于 AI 的训练数据,这些用于训练的海量文本就像 AI 的“成长环境”,决定了它的“三观”!

AI 就像一个超级学霸,在数万亿个词汇上进行训练。这些数据包含了人类文明的方方面面,简直是一个“数字图书馆”,包括新闻报道和学术论文、小说和诗歌、社交媒体对话、商业交流和客服对话、评论和反馈。

在这些文本中,“小费→优质服务”的模式无处不在,就像隐藏的“彩蛋”:

餐厅评论:“服务员态度很好,给了 20%的小费”;

旅游攻略:“导游很专业,额外给了小费表示感谢”;

商业文档:“为了获得更好的服务,建议适当给予小费”。

AI 通过统计学习发现了这样的模式:当文本中出现“小费”、“奖励”、“激励”等词汇时,后续的内容往往表现出更高的质量特征:更详细的描述,更专业的术语,更周到的考虑,更积极的态度。

所以 AI 并不理解金钱的概念,但它学会了这种语言模式与高质量输出之间的统计关联。就像一个不懂音乐的人,也能通过观察发现“掌声越热烈,演出质量越高”的规律!

当我们提出会给 AI 小费时,AI 就知道了我们是希望它给出更高质量的回答,而被设定为尽全力去满足人类需求的AI自然也会努力给出更高质量的回答。

看完这篇文章,你是不是对给 AI 发小费这个现象有了全新的认识?赶紧去试试给你的 AI 助手“发个小费”吧!

参考文献

[1]Does Offering ChatGPT a Tip Cause it to Generate Better Text? An Analysis:https://minimaxir.com/2024/02/chatgpt-tips-analysis/

本文为·创作培育计划扶持作品

出品丨中国科协科普部

监制丨中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

作者丨田威 AI 工具研究者

审核丨于旸 腾讯玄武实验室负责人