技术栈

双语

大数据AI人工智能培训专家培训讲师叶梓
8 个月前
人工智能·语言模型·性能优化·开源·大模型·微调·双语
Skywork-13B:开启更开放的双语基础模型时代人工智能咨询培训老师叶梓 转载标明出处随着模型规模的扩大,如何确保训练数据的质量和模型的泛化能力,避免过度拟合特定数据集,成为了一个挑战。同时许多现有的大型语言模型虽然公开了部分信息,但关键的复现细节和数据集往往不透明,限制了研究者对模型的深入研究和应用。为了重振开源社区的活力并推动AI领域的透明度,Kunlun Inc.的Skywork团队提出了Skywork-13B,一个在超过3.2万亿词符的英文和中文文本上训练的大型双语基础模型。