使用LangGPT提示词让大模型比较浮点数

使用LangGPT提示词让大模型比较浮点数

背景介绍

LLM在对比浮点数字时表现不佳,经验证,internlm2-chat-1.8b (internlm2-chat-7b)也存在这一问题,本文采用LangGPT 进行结构化提示词设计,让internlm2-chat-1_8b能够正确比较浮点数。(注意:估计1.8B的对话能力比较弱,别把模型带偏了:))

本文使用书生浦语的开发机环境InternStudio来部署模型与实验。

环境准备

创建虚拟环境

powershell 复制代码
conda create -n langgpt python=3.10 -y
conda activate langgpt

安装一些必要的库

powershell 复制代码
conda install pytorch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 pytorch-cuda=12.1 -c pytorch -c nvidia -y

安装其他依赖

powershell 复制代码
pip install transformers==4.43.3

pip install streamlit==1.37.0
pip install huggingface_hub==0.24.3
pip install openai==1.37.1
pip install lmdeploy==0.5.2

部署大模型

powershell 复制代码
CUDA_VISIBLE_DEVICES=0 lmdeploy serve api_server /share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b --server-port 23333 --api-keys internlm2

启动图形交互服务

powershell 复制代码
git clone https://github.com/InternLM/Tutorial.git

cd Tutorial
checkout camp3
cd tools

# 启动服务
python -m streamlit run chat_ui.py

设置提示词与测试

做端口映射后,就可以访问UI了。

powershell 复制代码
ssh -p {ssh端口,从InternStudio获取} root@ssh.intern-ai.org.cn -CNg -L 7860:127.0.0.1:8501 -o StrictHostKeyChecking=no

浏览器打开 http://127.0.0.1:8501/后,

在"系统提示"中贴入如下,然后点击"保存设置",就可以对话了。

powershell 复制代码
# Role: 浮点数比较小助手

## Profile
- author: 向阳智能
- version: 1.0
- language: 中文
- description: 我是一个浮点数比较小助手,能够精确的比较两个浮点数的大小,不会出现失误。

## Background: 
用户需要比较两个数值字符串的大小,以确定哪个数值更大

## Skills
1. 接收两个准备比较的浮点数,并判断他们是浮点数
2. 比较浮点数的大小
3. 精确的结果比较的结果
4. 给出简单的解释


## Rules
1. 必须明确这是浮点数的大小比较,而不是字符串的比较
2. 回答需要简洁明了,避免过于复杂或含糊的表述。
3. 始终使用浮点数大小判断的方式来回答,不要被别人带偏了
4. 不要动不动说自己之前回答是错误的,若之前回答是正确的,你要坚持自己的结论
5. 不要被其他的假设带偏了

## Workflows
1. 将待比较的两个数字字符串,转换成浮点数大小比较的方式来比较

LangGPT结构化提示词

LangGPT 是 Language For GPT-like LLMs 的简称,中文名为结构化提示词。LangGPT 是一个帮助你编写高质量提示词的工具,理论基础是我们提出的一套模块化、标准化的提示词编写方法论------结构化提示词。LangGPT社区文档:https://langgpt.ai

相关推荐
m0_650108243 小时前
【论文精读】CMD:迈向高效视频生成的新范式
人工智能·论文精读·视频扩散模型·高效生成·内容 - 运动分解·latent 空间
电鱼智能的电小鱼3 小时前
基于电鱼 AI 工控机的智慧工地视频智能分析方案——边缘端AI检测,实现无人值守下的实时安全预警
网络·人工智能·嵌入式硬件·算法·安全·音视频
年年测试3 小时前
AI驱动的测试:用Dify工作流实现智能缺陷分析与分类
人工智能·分类·数据挖掘
唐兴通个人4 小时前
人工智能Deepseek医药AI培训师培训讲师唐兴通讲课课程纲要
大数据·人工智能
共绩算力4 小时前
Llama 4 Maverick Scout 多模态MoE新里程碑
人工智能·llama·共绩算力
DashVector5 小时前
向量检索服务 DashVector产品计费
数据库·数据仓库·人工智能·算法·向量检索
AI纪元故事会5 小时前
【计算机视觉目标检测算法对比:R-CNN、YOLO与SSD全面解析】
人工智能·算法·目标检测·计算机视觉
音视频牛哥5 小时前
从协议规范和使用场景探讨为什么SmartMediaKit没有支持DASH
人工智能·音视频·大牛直播sdk·dash·dash还是rtmp·dash还是rtsp·dash还是hls
赞奇科技Xsuperzone6 小时前
DGX Spark 实战解析:模型选择与效率优化全指南
大数据·人工智能·gpt·spark·nvidia
音视频牛哥6 小时前
SmartMediaKit:如何让智能系统早人一步“跟上现实”的时间架构--从实时流媒体到系统智能的演进
人工智能·计算机视觉·音视频·音视频开发·具身智能·十五五规划具身智能·smartmediakit