LLM应用：Prompt flow vs LangChain

背景

Prompt flow和LangChain都是LLM时代，为高效地构建LLM应用而生。

Prompt flow是Microsoft开源的，其诞生时，LangChain已经很有名气了。

所以作为后生的Prompt flow会为我们带来哪些新的东西呢？

概述：

Prompt flow提供了一套开发工具，并通过实验来构建高质量的LLM应用程序，而不是一套框架（LangChain）。

可见其重点是聚焦在LLM应用程序的效果（质量）。

而这正是因LLM的不确定的特点所引发的新的思考方式。

当前的LLM应用，最重要的一个特点是围绕"prompt"提示词。

任何为了构建LLM应用而提供的工具or框架，都应该优先专注于prompt设计以及prompt的调优。

Prompt的特点是不稳定（不确定）。

同一套Prompt在不同的LLM里，其效果是不一样的。

甚至是对于同一个LLM的不同版本，其效果也是无法保证一致的。

所以在实际构建LLM应用时，任何用到Prompt的地方，都要能方便的调优。

由此可以推导出，在实际构建LLM应用时，任何用到Prompt的地方都需要显示出来，可以被修改，可以被调优。

而那些将Prompt隐藏在框架里的方式，很大概率会导致LLM应用的效果不一致，这时候就只能去修改框架了。

因Prompt的不稳定性，所以在LLM应用构建时，需要重点关注效果。

类似算法的常见评估指标：准确率、召回率等。

LLM应用的质量（效果）也需要一套评估标准。

Prompt flow为评估任务提供了很多的工具：

LLM应用中使用到的ReAct、RAG等模式，本身并不是新发明的。

其更多的是表达与外部系统的交互，例如与Search Engine的交互，与知识库的交互，与本地数据的交互等。

交互可以认为就是API调用。

在LLM应用构建以效果评估为中心时，我们需要明确的知道每一个交互步骤具体是怎么样的，每一个步骤的效果如何。

因此交互步骤级别的可视化就很有必要，可极大的提升研发和评估效率。

以上便是Prompt flow和LangChain的区别。

显而易见，更多的是理念上区别。

Prompt flow更像是实战派，通过在实战中总结经验，通过第一性原理，找到本质的地方，然后对齐抽象和封装。