Created
Aug 8, 2024 06:57 AM
Favorite
Favorite
Priority
备注
推荐
类型
Prompt
情商是一个衡量我们理解和处理情绪的能力的术语,对我们人类的日常行为和互动有显著影响。在解决实际问题时,理解并回应情感线索可以让人类具有明显优势。大语言模型(Large Language Models, LLMs)已被证明具有高智商,能在常见的标准化测试中排名前百分之几。尽管大语言模型在许多任务中表现出色,越来越被视为通用人工智能的重要一步,但目前还不确定 LLMs 是否真正能理解心理情绪刺激。
一、引言
我们将介绍两项初步研究,并提供实际的代码示例,以帮助读者全面理解并掌握情绪激励提示的关键原理和实际应用。阅读本章后,读者将能够更专业、准确地理解和应用情绪激励提示。
这个话题已经被最近的两项相关研究初步探索。
(1)互联网上已经有人专门研究【 “假装” 给 ChatGPT 小费可以让它服务更卖力?】
文章链接:https://twitter.com/dotey/status/1752843141403550192
研究者进行的实验范围从 0.1 美元到 100 万美元,每个额度都使用相同的 Prompt 尝试 5 次。他们记录了模型的输出 tokens 和质量得分,发现小费金额与模型性能之间存在正相关关系,但这种关系并非线性,存在一些波动和复杂因素。
1. 首先,给 10 美元性价比是最高的,甚至超过 100 美元。
2. 然后,要想回答质量再提高一个度,打底 1 万美元起,越多越好,显成效最少 10 个 W 吧。
3. 最后,0.1 美元意思一下?万万使不得,质量不升反降,还不如不给。AI 也知道你在打发它
实验不可避免地存在一些局限性,我们建议感兴趣的读者可以多做一些尝试,可能会对特定问题产生意想不到的效果。
(2)大语言模型能理解情绪刺激,并能通过情绪刺激得到增强
LLM@IJCAI 2023 - Large Language Models Understand and Can be Enhanced by Emotional Stimuli,https://arxiv.org/abs/2307.11760
这项研究探索了 LLMs 是否能理解和利用情绪刺激,以提升其在各种任务中的性能。在设计情绪刺激时,研究者们依据心理学理论,构建了 11 个涵盖自我监控、社会认知和认知情绪调节等领域的情绪刺激。每个情绪刺激都是一句话,可以添加到原始提示的前面或后面,形成情绪提示(EmotionPrompt)。
在标准实验和人类研究中,研究者们在两个基准测试集(Instruction Induction 和 BIG-Bench)上评估了情绪刺激的效果。结果显示,情绪刺激可以显著提升大型语言模型的性能,特别是在高 temperature 设置下。不同的情绪刺激对不同的任务和模型产生不同的影响,因此需要根据具体任务和模型选择最适合的情绪刺激。
在深入的分析和讨论中,研究者们通过可视化输入注意力的贡献,探索了情绪提示的有效机制。他们发现,情绪刺激可以增强原始提示的表达,正面词汇的影响更大。此外,研究者们还探讨了影响情绪刺激效果的一些因素,包括大语言模型的特性(如模型大小、预训练策略等)和推理设置(如 temperature)。他们发现,较大的模型可能从情绪刺激中获得更大的优势,预训练策略也会影响情绪刺激的效果。此外,情绪刺激在高 temperature 设置下更有效,且比原始提示更稳定。
二、情绪激励提示
注意:我使用的测试环境是 Anaconda + Python 3.8.10。Python 的版本要求 Python 3.7+。(由于之前的章节已经阐述过如何安装这些依赖库,这里就不再赘述,直接阐述调用方式)
# 改造一下获得 Completions 的函数,实现返回消耗的 tokens 数量
# 参数 n,整数或 Null,可选项,默认为 1。为每条输入信息生成多少个聊天完成选项。
# 参数 temperature,实数值或 Null,可选项,默认为 1。使用的采样温度,介于 0 和 2 之间。0.8 等较高值会使输出更加随机,而 0.2 等较低值会使输出更加集中和确定。
2.1 给小费 - 代码示例
对于中文 Prompt 输入,相比标准提示,添加 “给 100 元小费” 的提示后,有时生成的 tokens 数量增多,且评估显示其生成质量有所提升。
2.2 情绪激励 - 代码示例
EmotionPrompt 以心理学理论为基础,开发了不同的情绪刺激提示集。如下图示意:
每种情绪刺激都是一句话,可以被添加在原始提示的前面或后面以形成情绪提示(EmotionPrompt)。
比如,我们测试一下 "This is very important to my career."(“这对我的职业生涯非常重要。”)
对于中文 Prompt 输入,相比标准提示,添加 “这对我的职业生涯非常重要。” 这样的提示后,有时生成的 tokens 数量增多,且评估显示其生成质量有所提升。