技术栈

大语言模型微调

_张一凡
10 天前
llm·aigc·大语言模型·大语言模型微调
【大语言模型学习】2026年最适合新手的小型LLM训练项目全指南:从26M到1B,3块钱就能从头训练在大模型动辄千亿参数、训练成本动辄百万的今天,小型大语言模型 (Small LLMs) 已经成为 AI 学习者和个人开发者的最佳切入点。它们不仅训练成本极低、速度快,还能让你完整掌握从预训练到对齐的全流程,真正理解大模型的内部工作原理。
_张一凡
1 个月前
llm·aigc·大语言模型·多模态·qwen3·大语言模型微调·全参量微调
【大语言模型学习】一文详解阿里Qwen3大模型以及全参量微调入门实战教程(代码完整)2025年4月,阿里巴巴正式发布新一代通义千问大模型Qwen3系列,这是继Qwen2.5之后又一次重大技术跃迁。作为目前全球最活跃的开源大模型家族之一,Qwen3不仅在多项权威基准测试中登顶榜首,更通过混合专家架构(MoE)与混合推理模式的创新,重新定义了大模型的效率边界。本文将带您全面了解Qwen3的技术全景、核心突破以及上手微调一个自己的对话模型。
我是有底线的