利用大型语言模型从需求生成类模型

大型语言模型(LLMs)的出现为自动化软件工程活动开辟了新的可能性,这些活动传统上需要大量的人工投入。其中,类图生成是软件设计中一个关键但资源密集的环节。本文研究了包括GPT-5、Claude Sonnet 4.0、Gemini 2.5 Flash Thinking和Llama-3.1-8B-Instruct在内的最先进LLMs,从自然语言需求自动生成UML类图的能力。

为了评估基于LLM的模型生成的有效性和可靠性,我们提出了一种综合性的双验证框架,该框架将"LLM作为评判者"的方法与人机协同评估相结合。利用八个异构数据集,我们应用思维链提示来提取领域实体、属性和关联,并生成相应的PlantUML表示。

从五个质量维度对生成的模型进行评估:完整性、正确性、标准符合性、可理解性和术语一致性。两个独立的LLM评判者(Grok和Mistral)执行结构化的成对比较,并且它们的判断会进一步与专家评估进行对照验证。我们的结果表明,LLMs能够生成结构连贯且语义有意义的UML图,并与人类评估者达成高度一致。基于LLM的评估与人类评估之间观察到的一致性凸显了LLMs不仅在作为建模助手方面的潜力,而且在自动化需求工程工作流中作为可靠评估者的潜力,为LLM驱动的UML类图自动化的能力和局限性提供了实践洞察。

相关推荐
迁移科技5 小时前
告别人工分拣!迁移科技 AI+3D 视觉让机器人 “看懂” 无序抓取
人工智能·科技·3d·机器人·自动化·视觉检测
IT_陈寒6 小时前
Redis缓存击穿把我整不会了,原来还有这手操作
前端·人工智能·后端
YuanDaima20486 小时前
Linux 进阶运维与 AI 环境实战:进程管理、网络排错与 GPU 监控
linux·运维·服务器·网络·人工智能
跨境数据猎手6 小时前
跨境商城反向海淘系统开发全流程逻辑(上)
人工智能·爬虫·系统架构
听你说326 小时前
丈八科技与浪潮海若达成战略合作:共建人工智能产测一体化超级工厂
人工智能·科技
初心未改HD6 小时前
深度学习之Attention注意力机制详解
人工智能·深度学习
code_pgf6 小时前
模态生成器:原理详解与推荐开源项目
人工智能·深度学习·开源
ws2019076 小时前
AUTO TECH China 2026广州汽车零部件展:从整机集成迈向核心部件的产业跃升
大数据·人工智能·科技·汽车
MomentYY7 小时前
第 3 篇:让 Agent 学会分工,LangGraph 构建多 Agent系统
人工智能·python·agent
初心未改HD7 小时前
深度学习之Transformer架构详解
人工智能·深度学习·transformer