双语 - 双语技术,学习,经验文章

大数据AI人工智能培训专家培训讲师叶梓

2 年前

Skywork-13B：开启更开放的双语基础模型时代人工智能咨询培训老师叶梓转载标明出处随着模型规模的扩大，如何确保训练数据的质量和模型的泛化能力，避免过度拟合特定数据集，成为了一个挑战。同时许多现有的大型语言模型虽然公开了部分信息，但关键的复现细节和数据集往往不透明，限制了研究者对模型的深入研究和应用。为了重振开源社区的活力并推动AI领域的透明度，Kunlun Inc.的Skywork团队提出了Skywork-13B，一个在超过3.2万亿词符的英文和中文文本上训练的大型双语基础模型。