技术栈
glm4
又见阿郎
4 个月前
大模型
·
微调
·
glm4
聊聊GLM-4-9B开源模型的微调loss计算
Github官方地址:GLM-4网上已经有很多关于微调的文章,介绍各种方式下的使用,这里不会赘述。我个人比较关心的是微调时的loss计算逻辑,这点在很多的文章都不会有相关的描述,因为大多数人都是关心如何使用之类的应用层,而不是其具体的底层逻辑,当然咱也说不清太底层的计算。
IT大头
4 个月前
人工智能
·
语言模型
·
自然语言处理
·
chatgpt
·
swift
·
glm4
智谱AI GLM4开源!快速上手体验
目录前言在线体验模型链接及下载模型推理使用Transformers 大语言模型推理代码多模态模型推理代码