手把手带你实现ChatGLM2-6B的P-Tuning微调

参考文献:chatglm2ptuning

注意问题1:AttributeError: 'Seq2SeqTrainer' object has no attribute 'is_deepspeed_enabl

torch.distributed.elastic.multiprocessing.errors.ChildFailedError:

可能是版本太高,可以参考chatglm2的环境

相关推荐
瑶光守护者16 分钟前
【卫星通信】超低码率语音编码ULBC:EnCodec神经音频编解码器架构深度解析
深度学习·音视频·卫星通信·语音编解码·ulbc
JolyouLu3 小时前
LangChain4J-基础(整合Spring、RAG、MCP、向量数据库、提示词、流式输出)
大模型·提示词·向量数据库·rag·mcp·langchain4j
dundunmm4 小时前
【每天一个知识点】训推一体机
人工智能·大模型·硬件·软件·训练·推理
Uzuki7 小时前
LLM 指标 | PPL vs. BLEU vs. ROUGE-L vs. METEOR vs. CIDEr
深度学习·机器学习·llm·vlm
2501_9248905212 小时前
商超场景徘徊识别误报率↓79%!陌讯多模态时序融合算法落地优化
java·大数据·人工智能·深度学习·算法·目标检测·计算机视觉
SalvoGao12 小时前
空转学习 | cell-level 与 spot-level的区别
人工智能·深度学习·学习
什么都想学的阿超13 小时前
【大语言模型 15】因果掩码与注意力掩码实现:深度学习中的信息流控制艺术
人工智能·深度学习·语言模型
SHIPKING39314 小时前
【机器学习&深度学习】大模型分布式推理概述:从显存困境到高并发挑战的解决方案
人工智能·深度学习
没有梦想的咸鱼185-1037-166320 小时前
AI大模型支持下的:CMIP6数据分析与可视化、降尺度技术与气候变化的区域影响、极端气候分析
人工智能·python·深度学习·机器学习·chatgpt·数据挖掘·数据分析
灵智工坊LingzhiAI21 小时前
基于深度学习的中草药识别系统:从零到部署的完整实践
人工智能·深度学习