大型语言模型微调 新进展-4篇 论文

1. Brevity is the soul of wit: Pruning long files for code generation

本研究针对大型语言模型的代码生成任务中的数据清理问题进行了探索。研究发现,仅仅剔除过长的代码文件就能显著提高模型训练的效率和性能,甚至优于基于嵌入(embedding)的复杂方法。这种方法不仅能在训练效率上带来两倍的提升,在HumanEval上的表现也提高了3.5%。然而,这也可能导致模型处理长代码文件时的困惑度增加,从而引发关于代码生成模型评估方法的思考。

2. InverseCoder: Unleashing the Power of Instruction-Tuned Code LLMs with Inverse-Instruct

本文介绍了一种名为 INVERSE-INSTRUCT 的方法,该方法通过利用代码本身来生成指令,从而进一步提升了指令微调的代码大型语言模型的能力。基于一个核心观察:将代码(形式语言)翻译成自然语言(非形式语言)比反向操作更为容易。INVERSE-INSTRUCT 利用代码大型语言模型生成代码片段的摘要,从而生成高质量的指令。通过结合原始数据集与自动生成的指令,该方法能够有效提升代码大型语言模型指令微调后的性能,在多个代码生成任务中取得了超越现有模型的成绩。

3. Curriculum Learning for Small Code Language Models

本文发现课程学习能够显著提高小型代码语言模型在代码执行任务上的准确率,尽管它对代码补全的影响并不显著。研究人员提出了一种新的代码难度评估指标,并设计了一种新的课程学习时间表,证明了课程学习方法在训练代码语言模型上的有效性,为未来研究代码语言模型的课程学习应用提供了新的思路。

4. Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models

本文提出了一种名为 Genetic-Instruct 的方法,该方法利用自指令学习,从少量种子数据中生成大量的合成指令,从而提高大型语言模型的代码生成能力。这种方法能够有效地扩展指令生成过程,并且在多个代码生成模型的微调实验中,使用合成指令训练的模型表现出显著的性能提升。

相关推荐
Raink老师5 小时前
【AI面试临阵磨枪-79】实时数据 RAG:订单、商家、物流、天气、动态库存
人工智能·面试·职场和发展
是一个Bug5 小时前
Agent(智能体)应用 的入门学习路径
学习·机器学习
脑极体5 小时前
点亮星河AI+鸿蒙,一座艺术场馆的日神觉醒
人工智能·华为·harmonyos
Cosolar5 小时前
Chroma向量库面试学习指南
数据库·人工智能·面试·职场和发展·数据库架构
BUG指挥官5 小时前
Claude Code的自动化编程
人工智能
意图共鸣5 小时前
意图共鸣科技《认知智能白皮书》——感知与执行分离:认知架构(CA)如何重塑大模型底层结构
人工智能·架构
等一个人的@6 小时前
让数据自己开口:数睿通智库新增智能问数模块
人工智能·自然语言处理
ZGi.ai6 小时前
人工审查节点:让自动化工作流多一步人工把关
运维·人工智能·自动化·人机协同·智能体工作流·人工审查
王莎莎-MinerU6 小时前
MinerU 深度技术解析:从架构原理到生产部署的全面指南
css·人工智能·自然语言处理·架构·ocr·个人开发
盘古信息IMS6 小时前
盘古信息IMS V6 8.0重磅发布:以薪火AI数智平台点燃离散制造数智化引擎
大数据·人工智能·制造