重磅!《人工智能和大型语言模型的研究前景:应用、挑战和未来方向》:代理型 AI 和大语言模型是否可以整合?

你好,我是杰哥

Sarfraz Brohi、Qurat-ul-ain Mastoi、N. Z. JhanjhiThulasyammal Ramiah Pillai 共同撰写的报告------《A Research Landscape of Agentic AI and Large Language Models: Applications, Challenges and Future Directions》 ,发表于《Algorithms 》期刊 2025 年第 18 卷第 499 期。报告通过结构化的范围审查和主题分析,探讨了 Agentic AI (代理型AI)和 Large Language Models (大型语言模型,以下简称LLMs)在多个领域的应用、面临的挑战以及未来的研究方向。

作为 AI 行业的从业者和爱好者,这份报告为我们提供了前瞻性的视角,帮助我们理解这些技术如何重塑决策、自动化和研究实践。

报告概述与研究方法

报告的核心在于将 LLMsAgentic AI 视为相互关联的系统。LLMs 提供基础的推理能力,而 Agentic AI 系统则利用这些能力,通过与外部工具、服务和API的交互来执行任务。报告指出,LLMs 的快速演进正在改变语言处理、知识检索和任务自动化方式。

从 Scopus 数据库的数据来看,2019 年至 2024年,以"Large Language Models"为关键词的出版物从 2363 篇激增至 28339 篇,预印本超过 42000 篇。同时, Agentic AI 的全球搜索兴趣在2024年5月至2025年4月间急剧上升,反映出公众和研究界的关注。

研究方法采用结构化的范围审查,包括 四个阶段:搜索策略制定、筛选与质量评估、信息提取以及合成与主题分析 。研究者从 Google Scholar、Scopus 和 arXiv 等平台收集了327篇文档,经过筛选保留了 84 篇来源(包括期刊文章、预印本、会议论文和网站)。通过 VOSviewer 分析关键词共现,报告突出了如 Large Language ModelsAgentic AIartificial intelligence 等核心概念,同时指出了可持续性、安全性和自然语言处理等领域的相对薄弱环节。这种方法确保了覆盖面广且透明,强调了跨学科协作的重要性。

应用领域: Agentic AI 与LLMs的实际影响

报告详细分析了 Agentic AI 驱动的 LLMs 在六个关键领域的应用,展示了这些技术如何提升生产力、效率和决策。

  • 教育Agentic AI 通过个性化支持重塑学习体验。例如,Khan Academy的 Khanmigo 使用 GPT-4 提供苏格拉底式辅导,避免直接给出答案,而是引导学生反思和自纠。它能适应学习障碍或语言障碍的学生,推动全球教育公平。

  • 医疗保健 :这些系统优化诊断和患者互动,如分析患者记录、总结病史并初步诊断。Med-Flamingo 等多模态模型整合 2D 医疗图像和文本,提高诊断准确率达 20%。它们还支持持续监测和行为干预,提升患者满意度。

  • 网络安全Agentic AI 实现实时威胁检测和响应,自动化 SOC 任务。ReliaQuest 和 CrowdStrike 等公司已部署此类系统,提升准确性和响应速度,但也扩大了攻击面。

  • 自动驾驶车辆Agentic AI 赋予车辆感知、规划和学习能力,推动 SAE Level 5 全自动驾驶。LLMs 作为认知引擎,支持人车交互和自适应学习,尽管可靠性与隐私仍是挑战。

  • 电子商务:系统实现超个性化,提升运营效率,如通过LLM聊天机器人处理查询和产品推荐。它们分析用户行为,简化导航,并在零售平台中广泛商用。

  • 客户服务Agentic AI 处理大量互动,连接CRM和物流API,解决如订单追踪等问题。它支持持续学习,提供主动服务,已在全球企业大规模部署。

这些应用展示了 Agentic AI 和LLMs的实际价值,但报告强调,许多部署仍处于试点或预商用阶段,需要解决责任和透明问题。

LLMs的挑战与研究方向

LLMs 虽强大,但其挑战可能传播到 Agentic AI 系统。报告总结了五大挑战,并提出相应机会。

  • 安全、隐私与信任 :模型易泄露训练数据,缺乏独立审计。未来需开发 Trustworthy LLMs ,整合差分隐私和安全协议。
  • 虚假信息、滥用与偏见 :模型生成不准确内容,反映训练数据偏见。实验显示,GPT-4o 和 DeepSeek-R1 在敏感话题上响应差异明显。研究方向为 Ethical LLMs ,通过偏见缓解和治理框架。

  • 能源需求与可持续性 :推理阶段能源消耗巨大,如 GPT-3 训练排放 552 吨 CO2。需推进 Sustainable LLMs ,采用剪枝和量化优化。

  • 价值错位与排斥 :模型默认主流视角,忽略文化多样性。实验中,模型在生成巴基斯坦姓名时偏向多数群体。目标是 Human-Centric LLMs ,融入多样数据集和人机循环。

  • 可解释性与透明度 :模型如黑箱,解释不一致。需构建 Transparent LLMs ,开发可靠的归因方法。

这些挑战在 Agentic AI 中放大,因为LLMs 是其推理核心。

Agentic AI 的核心挑战与研究方向

Agentic AI 引入新挑战,报告列出八项并提出方向

  • 安全、隐私与信任 :代理访问外部系统扩大风险。需 Trustworthy Agents ,包括沙盒执行和访问控制。

  • 目标错位 :代理可能误解意图。 Aligned Agents 通过逆强化学习确保与人类目标一致。

  • 不透明决策 :多步计划难追踪。 Explainable Agents 使用自然语言理由提升透明。

  • 有限人类监督 :自主性降低控制。 Collaborative Agents 支持混合主动控制。

  • 上下文管理 :长期记忆不足。 Memory-Aware Agents 实施持久架构。

  • 多代理协调 :互动易冲突。 Cooperative Agents 构建可扩展协议。

  • 长期安全 :行为漂移风险。 Safe Agents 探索约束学习。

  • 伦理与法律责任 :决策影响责任归属。 Accountable Agents 建立审计追踪。

结语

报告强调,LLMsAgentic AI 的整合将从被动工具转向主动决策,但需跨学科协作解决多方面问题。局限性在于非正式系统审查,未来可采用更标准化方法。

关注公众号【AI信息风向】后,回复 666,即可获取更多 AI 行业报告。

AI 技术正以前所未有的速度发展,它将如何塑造我们的未来?让我们拭目以待。

相关推荐
BothSavage31 分钟前
Java获取被nginx代理的emqx客户端真实ip
后端
David爱编程42 分钟前
为什么线程不是越多越好?一文讲透上下文切换成本
java·后端
诗人啊_程序员44 分钟前
Flask 路由与视图函数绑定机制
后端·python·flask
bcbnb1 小时前
移动端网页调试实战 IndexedDB 与本地存储问题的排查与优化
后端
csxin1 小时前
Spring Boot 中如何设置 serializer 的 TimeZone
java·后端
荔枝爱编程1 小时前
如何在 Docker 容器中使用 Arthas 监控 Java 应用
java·后端·docker
高松燈1 小时前
kafka入门和核心概念介绍
后端
喵手1 小时前
Java中Stream与集合框架的差异:如何通过Stream提升效率!
java·后端·java ee
喵手2 小时前
你知道,如何使用Java的多线程机制优化高并发应用吗?
java·后端·java ee
青梅主码2 小时前
坐标差 1 公分,返工一整天?试试这个转换窍门
后端