技术栈
双语
大数据AI人工智能培训专家培训讲师叶梓
2 个月前
人工智能
·
语言模型
·
性能优化
·
开源
·
大模型
·
微调
·
双语
Skywork-13B:开启更开放的双语基础模型时代
人工智能咨询培训老师叶梓 转载标明出处随着模型规模的扩大,如何确保训练数据的质量和模型的泛化能力,避免过度拟合特定数据集,成为了一个挑战。同时许多现有的大型语言模型虽然公开了部分信息,但关键的复现细节和数据集往往不透明,限制了研究者对模型的深入研究和应用。为了重振开源社区的活力并推动AI领域的透明度,Kunlun Inc.的Skywork团队提出了Skywork-13B,一个在超过3.2万亿词符的英文和中文文本上训练的大型双语基础模型。