毕设学习进展周报

文章目录

3.11-3.18

1.阅读ACL文献并记录

2.查找相关资料学习在阿里云部署ChatGLM3-6B

参考:https://blog.csdn.net/H66778899/article/details/135630030

python 复制代码
#  运行
streamlit run /mnt/workspace/ChatGLM3/conposite_demo/main.py

可以得到:

3.学习如何微调

首先需对下载的医疗公开数据集进行处理,选择处理的是内科数据集,大概三万多条数据。

用作处理的代码如下,使用智普AI写的:

python 复制代码
import pandas as pd
import json

# 1. 读取CSV文件
import chardet

with open('internal.csv', 'rb') as f:
    result = chardet.detect(f.read())

print(result)  # 输出检测结果,包括编码和置信度

df = pd.read_csv('internal.csv', encoding=result['encoding'])



# 2. 数据预处理
# 这里可以根据需要对数据进行清洗和处
df.drop_duplicates(inplace=True)
df.fillna(method='ffill', inplace=True)

# 3. 格式转换
# 假设您的CSV文件中有两列:"Question" 和 "Answer",您想用它们来训练模型
# 请根据您的实际数据结构调整下面的代码
data_for_chatglm = []
for index, row in df.iterrows():
    data_for_chatglm.append({
        "instruction": row['title'],
        "output": row['answer']
        # 如果需要的话,可以添加更多键值对
    })

# 4. 保存为JSON格式
with open('medical.json', 'w', encoding='utf-8') as f:
    json.dump(data_for_chatglm, f, ensure_ascii=False, indent=4)

数据集的问答存在的问题为:有些回答包含无意义内容,有些回答的语句不通顺,先作为保留问题,等跑通了再做处理

官方微调文档:https://github.com/THUDM/ChatGLM3/blob/main/finetune_demo/README.md

使用阿里云DSW微调ChatGLM3-6B:https://blog.csdn.net/a131529/article/details/134895649

相关推荐
彤银浦1 小时前
Web学习笔记3
前端·笔记·学习·html5
之歆1 小时前
Python-魔术方法-创建、初始化与销毁-hash-bool-可视化-运算符重载-容器和大小-可调用对象-上下文管理-反射-描述器-二分-学习笔记
笔记·python·学习
优乐美香芋味好喝1 小时前
2025年7月11日学习笔记&一周归纳——模式识别与机器学习
笔记·学习·机器学习
声网3 小时前
对话 AI 陪伴新宠 Tolan 创始人:拒绝「恋爱脑」,「非人」陪伴更受欢迎?丨 Voice Agent 学习笔记
人工智能·笔记·学习
丁满与彭彭3 小时前
嵌入式学习笔记--MCU阶段--day03中断
笔记·单片机·学习
艾莉丝努力练剑4 小时前
【C语言】学习过程教训与经验杂谈:思想准备、知识回顾(五)
c语言·开发语言·数据结构·学习·算法
future14124 小时前
游戏开发日记7.12
数据结构·学习·c#·游戏开发
阿群今天学习了吗5 小时前
pytorch环境配置
人工智能·pytorch·python·学习·机器学习
武昌库里写JAVA6 小时前
使用 Java 开发大数据应用:Hadoop 与 Java API 的结合
java·开发语言·spring boot·学习·课程设计
zlbbme_8 小时前
Android Studio学习笔记:为应用添加文本和图片
笔记·学习