技术栈

agentic

亚里随笔
3 天前
人工智能·语言模型·llm·agentic
VERLTOOL:打通LLM工具强化学习的“任督二脉”,实现多模态多任务统一训练本文将聚焦VERLTOOL框架——一款专为智能体工具强化学习(ARLT)设计的开源系统。它解决了现有工具强化学习代码库碎片化、同步执行效率低、跨领域扩展性差的痛点,通过上游对齐VERL、统一工具管理、异步轨迹执行等核心设计,在数学推理、知识问答等6大任务中表现比肩专用系统,为LLM工具强化学习研究提供了高效、可扩展的基础设施。
OpenCSG
1 年前
数据库·人工智能·数据处理·agentic
OpenCSG DataFlow:锻造大模型智慧的炼金术,开启数据集Agentic新范式在这个数据为王的时代,大模型技术正以前所未有的速度颠覆着各行各业。数据作为驱动大模型的核心燃料,其质量和处理效率直接影响着模型的表现力和应用价值。正所谓“Garbage In, Garbage Out”,只有拥有优质的数据,大模型才能发挥其潜力。面对数据处理的复杂性和高要求的工作流,如何高效地获取、清洗、标注和优化数据,成为核心挑战。在这样的背景下,OpenCSG 重磅推出 DataFlow,提供一个全面而高效的数据集处理解决方案。
我是有底线的