DSPy和LangChain的无缝集成

Created

Aug 16, 2024 12:31 AM

Favorite

Priority

URL

https://mp.weixin.qq.com/s/4QAafCa8xzLE9_TyQPCs_A

备注

推荐

类型

DSPy

书接上文《DSPy Visualizer：可视化Prompt优化过程》，从示例和可视化方式，观测DSPy是如何对Prompt进行优化的。本文将从以下三方面深入探讨DSPy和LangChain的无缝集成：1.DSPy VS LangChain；2.LangChain和DSPy的结合；3.实践示例：使用DSPy优化LCEL。

1、概述

随着大型语言模型（LLMs）和向量存储的不断强大，出现了一代新的框架，能够通过利用LLMs和向量搜索技术来简化AI应用程序的开发。这些框架简化了从检索增强生成（RAG）应用程序到具有先进会话能力的复杂聊天机器人的构建过程，甚至还能支持复杂的推理驱动的AI应用。

其中最知名的框架可能是LangChain。该项目由Harrison Chase于2022年10月推出，并迅速获得了广泛关注，吸引了数百位开发者在GitHub上贡献代码。LangChain在对文档、数据源和API的广泛支持方面表现出色。此外，它与Qdrant等向量存储的无缝集成以及能够链接多个LLM，使得开发者能够构建复杂的AI应用，而无需重新发明轮子。然而，尽管像LangChain这样强大的框架已经解锁了许多能力，开发者仍需掌握提示工程的专业知识，以编写最佳的LLM提示。此外，优化这些提示并适应多阶段推理AI的构建在现有框架中仍然是一项挑战。事实上，当你开始构建生产级AI应用程序时，你应该会知道单次的LLM调用不足以释放LLMs的全部能力。相反，你需要创建一个工作流程，让模型与外部工具（如网络浏览器）互动，提取文档中的相关片段，并将结果汇总到一个多阶段推理管道中。这涉及构建一个结合并推理中间输出的体系结构，并根据任务要求调整LLM提示，以生成最终输出。对于这样的场景，手动提示工程的方法很快就会显得不够用。2023年10月，斯坦福NLP的研究人员发布了一个库DSPy，该库完全自动化了大型语言模型（LLMs）的提示和权重优化过程，从而消除了手动提示或提示工程的需求。DSPy的一个关键特性是它能够自动调整LLM提示，这种方法在你的应用需要在管道中多次调用LLM时尤其强大。因此，在构建基于LLM和向量存储的AI应用时，你应该选择哪个框架？在本文中，我们将深入探讨每个框架的能力，并讨论它们各自的适用场景。

2、DSPy VS LangChain

DSPy和LangChain都是构建AI应用程序的强大框架，利用大型语言模型（LLMs）和向量搜索技术。以下是它们的关键特性、性能和使用场景的比较分析：

特点	LangChain	DSPy
核心关注点	提供大量构建模块，简化使用LLMs与用户指定数据源结合的应用程序开发。	自动化和模块化LLM交互，消除手动提示工程，提高系统可靠性。
方法	利用模块化组件和可以使用LangChain表达语言（LCEL, LangChain Expression Language）链接在一起的链。	通过编程而非提示来简化LLM交互，并自动优化提示和权重。
复杂管道	通过LCEL创建链，支持异步执行和与各种数据源及API的集成。	使用模块和优化器简化多阶段推理管道，并通过减少手动干预确保可扩展性。
优化	依赖用户的提示工程和多个LLM调用的链式操作。	内置优化器自动调整提示和权重，提高LLM管道的效率和效果。
社区与支持	拥有庞大的开源社区，文档丰富，示例众多。	新兴框架，社区支持不断增长，带来LLM提示的新范式。

LangChain 优势：

数据源和API：LangChain支持多种数据源和API，允许与不同类型的数据无缝集成，非常适用于各种AI应用。

模块化组件：LangChain提供的模块化组件可以组合在一起，LangChain表达语言（LCEL）使得使用声明性语法构建和管理工作流程变得更容易。

丰富的文档和示例：作为较早的框架，LangChain拥有丰富的文档和成千上万的示例，开发者可以从中获得灵感。

劣势：

复杂推理任务：对于涉及复杂多阶段推理任务的项目，LangChain需要大量的手动提示工程，这既耗时又容易出错。

可扩展性问题：管理和扩展需要多个LLM调用的工作流可能非常具有挑战性。

提示工程需求：开发者需要对提示工程有深入理解，才能构建需要多

DSPy

优势：

DSPy 自动化了提示生成和优化过程，显著减少了手动提示设计的需求，使得使用大型语言模型（LLMs）更为容易，并有助于构建可扩展的AI工作流。

该框架包含内置的优化器，如 BootstrapFewShot 和 MIPRO，可以自动精化提示并将其适配到特定的数据集。

DSPy 使用通用模块和优化器简化了提示设计的复杂性，使得创建复杂多步骤推理应用变得更为容易，无需担心处理LLMs的复杂细节。

DSPy 支持多种LLMs，并具有在同一程序中使用多个LLMs的灵活性。

通过关注编程而非提示，DSPy 确保了AI应用的可靠性和性能，尤其是在需要复杂多阶段推理的情况下。

劣势：

作为一个较新的框架，DSPy 的社区比 LangChain 小，这意味着资源、示例和社区支持的可用性较为有限。

尽管 DSPy 提供了教程和指南，但其文档比 LangChain 的文档要少，这可能会在您开始使用时带来挑战。

在开始使用 DSPy 时，您可能会感到被它提供的模式和模块所限制。

3、LangChain和DSPy的结合

下面我们将从两个方向来解析LangChain和DSPy的结合。第一，我们先介绍如何将LangChain集成到DSPy中。其次，我们在分析一下，如何将DSPy集成到LangChain，该方向尚处于一个探索阶段，目前LangChain暂不支持。

3.1 将LangChain集成到DSPy

为了适配LangChain，使得LCEL可以使用DSPy优化，DSPy官方提供 LangChainModule 和 LangChainPredict两个类，这两个类将LangChain的模块分别继承自 dspy.Module 和 dspy.Predict 类，同时也实现了必要的方法。LangChainModule：在DSPy中，预测、优化、验证的程序主体为Module，LangChainModule可以将完整的LCEL封装，使得在不改变DSPy原有 Optimizer.compile() 和 Evaluate.evalute() 接口的情况下，无缝传入，完成对LCEL中的提示词和大模型组件的优化。

如上代码所示，LangChainModule继承了dspy.Moudle类，实现了dspy.Module必要的 forward方法，在forward方法中，主要的处理逻辑为 self.chain.invoke，也就是执行LCEL，执行之后再将结果封装为DSPy标准的dspy.Prediction类对象返回。LangChainPredict：被优化和预测的主要逻辑是在Predict类中，DSPy提供的LangChainPredict可以覆盖Predict类的功能，同时又有LCEL的特定，使得LangChainPredict类可以和其他langChain.Runnable子类一起串联到LCEL中。

如上代码所示，LangChainPredict初始化时传入LangChain的大模型和提示词类，初始化函数会根据传入提示词构建 dspy.Signature。在预测时调用forward函数，将传入的内容利用self.siguature转换为字符串类型，传入self.langchain_llm.invoke函数进行推理，实际是在执行LangChain的推理，再将预测内容包装到Prediction类中，存入dspy.settings中，最终返回预测结果。此外 LangChainPredict类也实现了invoke方法，使得LangChainPredict可以和其他LCEL组件串联在一起。

3.2. DSPy集成到LangChain

从上文可知，利用LangChainPredict和LangChainModule可以利用DSPy优化LCEL中的prompt和LLM，那么已经优化好的提示词和大模型，如果在langchian的LCEL中使用呢？作者以为有两种方法将DSPy优化的结果集成到LangChain中

1）将DSPy的 LangChainPredict类之间串联到 LCEL 中

由于LangChainPredict类继承自 Runnable，所以它天然可以在LangChain中使用，因此只需要将优化好的LangChainPredict实例串联到所需的chain中即可。

2）提取优化好的提示词，手动加入到LangChain的Prompt中

由于目前业内尚未发现相关探索，在此给出作者的思路，经过上文2.1的源码分析，可以看出 LangChainPredict类包含signature属性，而在调用 LangChainPredict.forward时可以将signature转换为字符串，因此我们可以仿照这这种写法获取到提示词内容，具体步骤为先获取到 signature变量，然后将 demos传入 signature，会得到字符串类型的提示词。