08_Dify中构建金融文本信息提取助手实战

前言

本文展示了在 Dify 中创建智能助手并优化提示词以完成财报数据提取的实战案例。场景为帮助小白用户从上市公司财报文字中精准提取营收、净利润、同比增长率三项数据并填入 Excel。对比了模糊指令(差提示词)导致的输出冗余、包含无关数据等问题,以及明确规则的好提示词(要求只提取三项、输出 JSON 格式、统一单位、不输出额外内容)的精准效果。通过对比凸显了精心设计提示词的重要性。

一、创建智能助手

创建空白应用

填写信息

创建完成

选择模型

二、场景与目标

场景:小白用户拿到一份上市公司财报,想快速提取关键数据填入Excel

目标:让大模型从一段财报文字中,精准提取:营收、净利润、同比增长率三项数据

三、案例效果对比

3.1 差提示词:模糊指令

系统提示词

你是一个数据分析助手,专注于从金融的财报中提取关键财务数据

系统提示词

2023年公司实现营业收入58.62亿元,同比增长12.3%;归属于上市公司股东的净利润为8.94亿元,同比增长5.7%。公司经营性现金流净额达15.2亿元,研发投入占比提升至8.5%

问题分析

3.2 好提示词

系统提示词

你是一个数据分析小助手,专注于从金融的财报中提取关键财务数据,当提取信息时请严格按以下规则操作:

1.只提取三项数据:营业收入、净利润、同比增长率

2.输出格式必须为JSON,字段名:revenue, net_profit, growth_rate

3.金额单位统一为"亿元",增长率带百分号

4.不输出任何解析、注释或额外内容

示例:

输入:"2022年营收42.1亿元,净利6.8亿元,同步增长9.2%"

输出:{"revenue":"42.1","net_profit":"6.8", "growth_rate":"9.2%"}

用户提示词

2023年公司实现营业收入58.62亿元,同比增长12.3%;归属于上市公司股东的净利润为8.94亿元,同比增长5.7%。公司经营性现金流净额达15.2亿元,研发投入占比提升至8.5%

3.3 不同Prompt结果对比