humaneval+ - humaneval+技术,学习,经验文章

hhhhhlt

2 年前

【代码大模型】Is Your Code Generated by ChatGPT Really Correct?论文阅读key word: evaluation framework, LLM-synthesized code, benchmark