知识增强的大语言模型

王海峰 百度

先从人工智能讲起:

大模型的出现,让人看到AGI的曙光

一是技术通用,二是能力全面

人工智能技术演进:

  1. 规则由人工撰写
  2. 统计机器学习时代:自动学习,但算法模型仍需结合实际选择
  3. 深度学习:算法通用,DNN
  4. 大模型时代:模型通用,可以解决多领域问题。

1.1 人工智能技术的通用性

1.任务

NLP

分词 句法分析 文本分类 语义匹配 实体识别

2.语言

  1. 自然语言 中文、英文等
  2. 形式语言 编程语言,无歧义

3.模态

多模态统一

4.场景

农业 制造 能源 交通 金融 教育等

1.2 人工智能能力的全面性

理解 生成 逻辑 记忆 是 基本能力

生成式模型不仅包括生成能力,同样包括:理解 、逻辑、记忆等能力

2 文心大模型发展历程

基本架构

2.1 基础模型训练

2.2 数据构建与优化

2.3 对齐技术创新

2.4 提示优化

2.5 知识增强

2.6 检索增强

2.7 知识点增强

2.8 对话增强

2.9 智能体

3 人工智能技术栈

相关推荐
数新网络2 小时前
The Life of a Read/Write Query for Apache Iceberg Tables
人工智能·apache·知识图谱
Yangy_Jiaojiao2 小时前
开源视觉-语言-动作(VLA)机器人项目全景图(截至 2025 年)
人工智能·机器人
gorgeous(๑>؂<๑)3 小时前
【ICLR26匿名投稿】OneTrackerV2:统一多模态目标跟踪的“通才”模型
人工智能·机器学习·计算机视觉·目标跟踪
坠星不坠3 小时前
pycharm如何导入ai大语言模型的api-key
人工智能·语言模型·自然语言处理
周杰伦_Jay3 小时前
【智能体(Agent)技术深度解析】从架构到实现细节,核心是实现“感知环境→处理信息→决策行动→影响环境”的闭环
人工智能·机器学习·微服务·架构·golang·数据挖掘
王哈哈^_^3 小时前
【完整源码+数据集】课堂行为数据集,yolo课堂行为检测数据集 2090 张,学生课堂行为识别数据集,目标检测课堂行为识别系统实战教程
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
Elastic 中国社区官方博客4 小时前
Observability:适用于 PHP 的 OpenTelemetry:EDOT PHP 加入 OpenTelemetry 项目
大数据·开发语言·人工智能·elasticsearch·搜索引擎·全文检索·php
ytttr8734 小时前
Landweber迭代算法用于一维、二维图像重建
人工智能·算法·机器学习
feifeigo1234 小时前
Matlab编写压缩感知重建算法集
人工智能·算法·matlab
紫小米5 小时前
提示词(Prompt)工程与推理优化
人工智能·ai·prompt·ai agent