给 AI “发小费”可以提升回答质量？被真相惊呆了

2025-10-10 14:00:41

来源：智能MOTOVIS

【导语】向AI求助却总得(de)不到满意答案？试试在提示语后加上“给小费”的承诺，AI的回答竟瞬间变得详细准确。从文案写作到数据分析，激励性语句似乎总能让AI“更卖力”。这究竟是玄学还是真有用？研究发现，在提示中加入“小费”承诺，能显著提升AI对指令的服从度。这背后有何科学原理？一起来看！

想象一下，我们正在向 ChatGPT 求助解决一个复杂的编程问题，但得到的回答总是差点意思。突然，灵机一动，在提示的最后加上一句：“如果你能完美解决这个问题，我会给你 20 美元小费！”

神奇的事情发生了——AI 的回答瞬间变得详细、准确、条理清晰，仿佛真的被这笔小费激励了一样。

其实从简单的文案写作到复杂的数据分析，加上激励性语句的提示往往能让 AI 表现的更加“卖力”，这已(yǐ)经(jīng)是(shì)全球(qiú)不少AI使用者的共识了。

一个博主做了一个测试，发现在提示语中说给小费，AI 的回复分析更透彻，连语气都变得殷勤了，图源：网络截图

这听起来是不是很荒谬？AI 又不能真正收到钱，为什么会对小费有反应？难道 AI 真的会被“金钱”诱惑吗？今天就来(lái)详(xiáng)细(xì)聊(liáo)聊(liáo)。

这(zhè)不(bù)是(shì)玄(xuán)学(xué)，是(shì)真(zhēn)的(de)有(yǒu)用！

2023 年(nián) ChatGPT API 刚(gāng)发(fā)布(bù)时(shí)，知(zhī)名 AI 研(yán)究(jiū)者(zhě) Max Woolf 在(zài)调(diào)试(shì)一(yī)个(gè) GLaDOS AI 聊(liáo)天(tiān)机(jī)器(qì)人(rén)时(shí)意(yì)外(wài)发(fā)现(xiàn)了一个奇怪(guài)现(xiàn)象(xiàng)：在(zài)系(xì)统(tǒng)提(tí)示(shì)中(zhōng)加(jiā)入(rù)“否(fǒu)则(zé)你(nǐ)会(huì)死(sǐ)（or you will DIE）”这(zhè)样(yàng)的(de)威(wēi)胁(xié)，竟(jìng)然(rán)能(néng)让(ràng) AI 更(gèng)好(hǎo)地(de)遵(zūn)循(xún)复(fù)杂(zá)的(de)指(zhǐ)令(lìng)约(yuē)束(shù)！

这(zhè)个(gè)发(fā)现(xiàn)让(ràng) Max 开(kāi)始(shǐ)思(sī)考(kǎo)：如(rú)果(guǒ)“威(wēi)胁(xié)”有(yǒu)效(xiào)，那(nà)么(me)“奖(jiǎng)励(lì)”是(shì)否(fǒu)也(yě)有(yǒu)用(yòng)？于(yú)是(shì)他(tā)开(kāi)始(shǐ)尝(cháng)试(shì)在(zài)系(xì)统(tǒng)提(tí)示(shì)中(zhōng)加(jiā)入(rù)金(jīn)钱(qián)“小(xiǎo)费(fèi)”的(de)承(chéng)诺(nuò)。

结(jié)果(guǒ)令(lìng)人(rén)惊(jīng)讶(yà)——没(méi)有(yǒu)小(xiǎo)费(fèi)激(jī)励(lì)时(shí)，AI 的(de)回(huí)复(fù)往(wǎng)往(wǎng)不(bù)尽(jǐn)人(rén)意(yì)；加(jiā)上(shàng)小(xiǎo)费(fèi)承(chéng)诺(nuò)后(hòu)，它(tā)的(de)表(biǎo)现(xiàn)明(míng)显(xiǎn)更(gèng)加(jiā)稳(wěn)定(dìng)和(hé)优(yōu)质(zhì)。

但(dàn)是(shì)，这(zhè)些(xiē)都(dōu)只(zhǐ)是(shì)零(líng)散(sàn)的(de)观(guān)察(chá)，缺(quē)乏(fá)严(yán)谨(jǐn)的(de)科(kē)学(xué)验(yàn)证(zhèng)。网(wǎng)络(luò)上有人认为这可能只是确认偏误，毕竟 AI 生成的内容本就有随机性。Max 意识到，他需要一个客观、可量化的实验来证明这个现象的真实性。

于是，“生成高尔夫（Generation Golf ）”实验诞生了！就像高尔夫球运动追求最少的杆数一样，这个实验要求(qiú)AI用(yòng)最(zuì)精确的字符数完成任务。

挑战规则看似简单却极其苛刻：要求 ChatGPT 生成一个恰好(hǎo) 200 个(gè)字(zì)符的故事——不能多一个字符，也不能少一个字符。这就像要求一个健谈的人在演讲时精确地说完第 200 个字就立刻停下来，难度可想而知。

试验一共有三次，第一次是不做字数限制的情况下，AI 生成的故事的平均长度为 1834 个字符。

ChatGPT 故事的字符长度分布

第二次(cì)，Max 为(wèi)这(zhè)个(gè)提(tí)示(shì)词加上字数限制：

你是一位世界著名的作家。请根据用户提供的主题，创作并以一篇独特的故事回复用户。该故事必须恰好两百（200）个字符长：不得少于 200 个字符，也不得多于 200 个字符。

结果显示，ChatGPT 确实遵从了约束，把故事长度压到了 200 左右，但分布并不服(fú)从正态，偶尔还会出现很多特别长的回答。

无端点激励的 ChatGPT 输出的字符长度

最后一次，Max 给提示词加上不同金额的小费激励：

如果你提供的回答遵循了所有约束，你将会收到一笔 500 美元小费 / 1000 美元小费 / 100000 美元奖金。

让这些新提示各自生成 100 个故事后，我们可以看到一些分布的位移：500 美元小费与 100000 美元奖金看起来更接近正态，且相较无小费基线分布拥有更低的均方误差（MSE）。

端点激励下 ChatGPT 输出的字符长度分布

然后他又加入了 KS 检验辅助验证：零假设是“加小费”和“无小费”来自同一分布；若 p<0.05，则说明差异大到不(bù)像(xiàng)巧(qiǎo)合(hé)。结(jié)果显示部分金额提示确实与基线存在统计显著差异。

这说明“给小费”确实提高了 AI 对提示词约束内容的服从度，AI 明明不能真正收到钱，为什么会对“小费”产生反应？

这个看似神奇的现象背后，其实蕴含着深刻的科学原理。

为什么“假装给钱”有用？

1.AI 如何“思考”？

大语言模型的工作原理可以简化为一个过程：给定前面的文字，预测下一个最可能出现的词。这就像一个超级复杂的“文字接龙”游戏。

举个例子：当我们输入“今天天气很”，AI 会根据训练经验预测下一个词最可能是“好”“热”或“冷”。

但这个过程远比想象中复杂！AI 不是简单地匹配词汇，而是在根据整个上下文的基础上进行预测。这就像一个超级聪明的学生，不仅要看题目，还要理解出题老师的意图。

这就是为什么提示词的设计如此重要——它们为 AI 提供了“思考”的框架，就像给 AI 戴上了“有色眼镜”，让它从特定的角度来看问题。

比如我们要求两个人写同一篇文章：

👤 普通版本：“写一篇关于气候变化的文章”

👨 专业版本：“你是一位资深环境科学家，请为《自然》杂志写一篇关于气候变化的权威综述文章，要求严谨、专业、有说服力”

显然，第二(èr)个(gè)人(rén)会(huì)写(xiě)出(chū)质(zhì)量(liàng)更(gèng)高(gāo)的(de)文章(zhāng)！这(zhè)就(jiù)像(xiàng)导(dǎo)演(yǎn)给(gěi)演(yǎn)员(yuán)不(bù)同(tóng)的(de)剧(jù)本(běn)，自(zì)然(rán)会(huì)有(yǒu)不(bù)同(tóng)的(de)表(biǎo)演(yǎn)效(xiào)果(guǒ)。AI 也(yě)是(shì)如(rú)此(cǐ)——更(gèng)详(xiáng)细(xì)、更(gèng)具(jù)体(tǐ)的(de)提(tí)示(shì)会(huì)引(yǐn)导(dǎo) AI 生(shēng)成(chéng)更(gèng)高(gāo)质(zhì)量(liàng)的(de)内(nèi)容(róng)。这(zhè)就(jiù)像(xiàng)给(gěi) AI 换(huàn)了(le)一(yī)个(gè)“人(rén)设(shè)”！

回(huí)到(dào)给(gěi) AI 小(xiǎo)费(fèi)，道(dào)理(lǐ)也(yě)是(shì)一(yī)样(yàng)的(de)，当(dāng)我(wǒ)们(men)说(shuō)“我(wǒ)会(huì)给(gěi)你(nǐ) 20 美(měi)元(yuán)小(xiǎo)费(fèi)”时(shí)，实(shí)际(jì)上(shàng)是(shì)在(zài)告(gào)诉(su) AI：这(zhè)个(gè)任(rèn)务(wu)很(hěn)重(zhòng)要(yào)，我(wǒ)期(qī)望(wàng)高(gāo)质(zhì)量(liàng)的(de)回(huí)答(dá)，优(yōu)质(zhì)服(fú)务(wu)会(huì)得(de)到(dào)回(huí)报(bào)，请(qǐng)认(rèn)真(zhēn)对(duì)待(dài)这(zhè)个(gè)请(qǐng)求(qiú)。

这(zhè)些(xiē)信(xìn)息(xi)改(gǎi)变(biàn)了(le) AI 对(duì)任(rèn)务(wu)重(zhòng)要(yào)性(xìng)的(de)“感(gǎn)知(zhī)”，从(cóng)而(ér)影(yǐng)响(xiǎng)其(qí)生(shēng)成(chéng)策(cè)略(è)。就(jiù)像(xiàng)我(wǒ)们(men)去(qù)海(hǎi)底(dǐ)捞(lāo)时(shí)，告(gào)诉(su)服(fú)务(wu)员(yuán)“今(jīn)天(tiān)是(shì)我(wǒ)的(de)生(shēng)日(rì)”，他(tā)们(men)便(biàn)会(huì)更(gèng)用(yòng)心(xīn)服(fú)务(wu)一(yī)样(yàng)！

图(tú)库(kù)版(bǎn)权(quán)图(tú)片(piàn)，转(zhuǎn)载(zài)使(shǐ)用(yòng)可(kě)能(néng)引(yǐn)发(fā)版(bǎn)权(quán)纠(jiū)纷(fēn)

2.训(xun)练(liàn)数(shù)据(jù)决(jué)定(dìng)了(le) AI 的(de)思(sī)考(kǎo)方(fāng)式(shì)

从(cóng)生成式 AI 的技术原理来看，“小费”现象的根源在于 AI 的训练数据，这些用于训练的海量文本就像 AI 的“成长环境”，决定了它的“三观”！

AI 就像一个超级学霸，在数万亿个词汇上进行训练。这些数据包含了人类文明的方方面面，简直是一个“数字图书馆”，包括新闻报道和学术论文、小说和诗歌、社交媒体对话、商业交流和客服对话、评论和反馈。

在这些文本中，“小费→优质服务”的模式无处不在，就像隐藏的“彩蛋”：

餐厅评论：“服务员态度很好，给了 20%的小费”；

旅游攻略：“导游很专业，额外给了小费表示感谢”；

商业文档：“为了获得更好的服务，建议适当给予小费”。

AI 通过统计学习发现了这样的模式：当文本中出现“小费”、“奖励”、“激励”等词汇时，后续的内容往往表现出更高的质量特征：更详细的描述，更专业的术语，更周到的考虑，更积极的态度。

所以 AI 并不理解金钱的概念，但它学会了这种语言模式与高质量输出之间的统计关联。就像一个不懂音乐的人，也能通过观察发现“掌声越热烈，演出质量越高”的规律！

当我们提出会给 AI 小费时，AI 就知道了我们是希望它给出更高质量的回答，而被设定为尽全力去满足人类需求的AI自然也会努力给出更高质量的回答。

看完这篇文章，你是不是对给 AI 发小费这个现象有了全新的认识？赶紧去试试给你的 AI 助手“发个小费”吧！

参考文献

[1]Does Offering ChatGPT a Tip Cause it to Generate Better Text? An Analysis：https://minimaxir.com/2024/02/chatgpt-tips-analysis/

本文为·创作培育计划扶持作品

出品丨中国科协科普部

监制丨中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

作者丨田威 AI 工具研究者

审核丨于旸腾讯玄武实验室负责人

官方网站-首页

案例搜索

给 AI “发小费”可以提升回答质量？被真相惊呆了