Prompt或许的新未来， DSPy使用从0到1快速上手

Created

Aug 14, 2024 01:47 PM

Favorite

Priority

URL

https://mp.weixin.qq.com/s/MYZfhcwshjibQAisgBwalg

备注

迭代1-跑通极简的CoT思维模式（无示例）

目标：三分钟跑通极简demo首先介绍利用DSPy包，跑通最简单的一次CoT思维模式问答，该示例涉及到 dspy.Signature 和 dspy.ChainOfThought 类，其中 dsyp.Signature 是定义模块输入输出的类，dspy.ChainOfThought 为DSPy内置的思维模式类，以CoT模式与大模型交互，具体代码如下：

上述代码首先定义了大模型使用 llama3 ，然后，定义了 dspy.Signature 类，输入字段为 question，输出字段为 answer，最后实例化 dspy.ChainOfThought 类，并输入问题调用大模型进行回答，执行结果为：

此外，depy.Signature 类还支持以inline的方式定义，通过简单的字符串描述输入输出字段，如下所示，在第2行直接将原来的 QA 替换为了字符串 "question->answer"，这种写法可以自动的被转换成 dspy.Signature 类：

结果为：

如果希望查看 CoT模式的详细提示词，可以运行如下代码：

结果为：

往期回顾

01DSPy实现技术解析：极端多标签分类的上下文学习02RAG坦途已现！DSPy，将会革命性改变RAG系统的构建方式03DSPy的“前世今生”，从DSPy的核心论文解析其技术演进之路

迭代2-为CoT模式提示词增加示例

目标：通过增加示例提升CoT的成功率众所周知，通过调整提示词的内容，可以改变大模型返回的结果，比较常见的一种调整提示词的办法是为提示词增加示例，那么，如何给 CoT 模式增加示例呢？此处将引入 dspy.Example 类，是DSPy的数据类，用于构建示例，代码如下：

可以看出，上述代码构建了 example实例，并将该实例加入到 dspy.ChainOfThought 的运行函数中，结果如下：

进一步查看提示词内容，

可以看出，提示词中增加了示例的内容，这影响了问题最终的答案。

迭代3-构建示例数据集

目标：通过引入标准数据集，进一步提升CoT的成功率随着我们示例的增加，我们希望通过构建一个数据集来保存示例，并将整个数据集传入到CoT的推理过程中，这里，我们引入了DSPy内置的数据集GSM8K，这是一个多步骤数学推理数据集，示例如下：

此处将数据集传入到demos变量中，并询问了一个和数学计算有关的问题，结果如下：

实际上这个答案是错误的，正确的答案是11，因此提示词可以优化大模型的输出，但是也很难保证回答问题的准确性。提示词如下：

迭代4-自动优化模板

目标：通过自优化的方式，调整访问模型参数（如Temperature）、筛选影响度较高的示例，进一步提升CoT的准确率通过扩大示例可以提高大模型回答问题的准确性，但是存在2个问题，（1）增加示例也并不能保证大模型预测准确（2）当大模型调整时原有提示词可能是不适用的，针对于这两个问题，DSPy提供了对提示词和大模型参数进行自动化优化的功能，可以进一步提高模型的准确性以及在不同大模型上的稳定性。用户只需要提供目标领域的训练数据集 Dataset，以及衡量大模型返回结果准确性的衡量标准 Metrics，以及优化器 Optimizer，就可以自动的得到一个最适合目标场景数据集的提示词和模型参数。首先，在优化之前，我们使用dspy的Evaluate类以及Metrics测试当前CoT模块在测试集上的准确率：

结果如下:

可见，在优化之前，基于llama3模型在测试集上的准确率为80%，接下来利用dspy对CoT进行优化：

上述代码中首先导入了内置的优化器 BootstrapFewShot、度量函数 gsm8k_metric、以及gsm8k数据集的前20条数据即 gsm8k_trainset，利用 BootstrapFewShot.compile 函数进行优化，其中内部保留了对回答问题有利的示例以及大模型参数，最终提问，结果如下：

接下来，我来再次利用 dspy.Evaluate 验证优化后的CoT实例的准确率

结果在测试集上达到了100%的预测准确率

迭代5-加载训练参数

目标：通过加载预训练参数，省去重复训练流程

DSPy 与 LangChain 配合使用示例

DSPy有着强大的自动化提示词优化能力，在使用过程中，可能有一部分开发者已经使用LangChain制作过智能体，也有优化的需求。因此，DSPy官方对LangChain的部分组件进行了适配，使得利用DSPy 可以优化由LangChain 创建的“链 (Chain)”；此外DSPy的部分功能如Retriever，也可以融合到LangChain的链中。综上所述，LangChain用户将获得通过任何DSPy优化器优化链的能力。DSPy用户将能够将DSPy程序导出到LCEL中。示例链接：dspy/examples/tweets/compiling_langchain.ipynb at main · stanfordnlp/dspy (github.com) 本文逐步介绍如何利用DSPy优化LangChain的部分模块首先，我们可以通过LangChain的基本语法定义一条链，此链融入了dspy.Retrieve模块，代码如下：

上述代码中展示了如何利用LangChain创建检索、提示词、大模型、输出处理模块，并串成了一条链，其中检索模块使用了DSPy提供的基础检索功能。那么，如何将上述的LangChain的链，封装为DSPy的Module，使得这条链可以被优化呢？如下面代码所示：

如上述代码，首先需要导入LangChainPredict类，该类集成自 langchain_core.runnables.Runnable 类以及 dspy.Predict类，因此可以串联到链中。利用LangChainPredict包装原来的提示词和大模型模块并串联到链中，目前这条链与init_chain 中实现的功能完全一致。

然后，需要导入LangChainModule，并将整条链传入LangChainModule中初始化，zeroshot_chain，如下面代码所示：

LangChainModule集成自dspy.Module，因此可以被优化器优化，此外LangChainModule实现了invoke方法，与Langchain的使用习惯一致。

至此，我们已经得到了一个被DSPy修饰过的LangChain的链。接下来，我们可以使用优化器来优化这条链。在优化之前，我们先利用Metrics 计算zero_shot 在特定数据集上的准确率：

结果为42.7%，在150个测试的问题中，有64个是回答符合Metrics的。

接下来，利用优化器进行优化，并再一次调用 evaluate函数进行验证，如下面代码和图片所示：

可看出，优化之后optimized_chain的准确率有着明显的提高，达到了52.4%。此外，用户可以通过调整优化器的参数，使得得到的结果进一步提高。

总结

本文首先通过一个简单的例子，解释了DSPy如何从最基础的无示例CoT模块问答、到有示例CoT模块、再到构建数据集，并利用Metrics和Optimizer优化Module获得更高的预测准确率的预测和验证过程。然后展示了利用DSPy对LangChain的链的优化、测试、验证过程。DSPy可以有效降低提示词在切换大模型时的脆弱性、并且将提示词开发从手工开发转为抽象的代码开发，提供了更加系统化的方法。DSPy所提出的新范式，将对未来的大模型应用平台技术产生深远影响。

相关链接

1、dspy官网https://dspy-docs.vercel.app

2、Dspy github仓库地址 https://github.com/stanfordnlp/dspy

3、示例代码地址 https://github.com/ziqi-jin/dspy-examples

4、Langchain 介绍文档https://python.langchain.com/v0.1/docs/integrations/providers/dspy/

更多DSPy技术前沿分享，欢迎扫描下方二维码进入技术交流群（或者添加群助手ID：qstarsky 邀请您进群交流）