大语言模型的发展-OPENBMB

一、自然语言处理的基础

1、图灵测试 就是验证人工智能程序有多智能

让计算机像人一样,能够听懂问题,然后给出答案;

自然语言发展历史:

advances in Natural Lannguage Processing --论文

2、自然语言处理的基本任务和应用

2.1任务:

词性质(动词,名词),命名实体识别(人名,地名,机构名),共指消解(it,she代指的是谁),句法的理论(主谓宾,定状补),中文分词任务

2.2 应用:

1、搜索引擎,query和document的相似段

搜索引擎出广告:文本匹配的问题

2、知识图谱:是搜索引擎重要的点

query如何找知识图谱的实体,如何构建知识图谱

使用自然语言处理,把一篇文章,识别出哪些实体是有关系,然后自动输出到知识图谱中,用于后续的知识图谱的查询

3、个人助手

智能音箱,理解人说的话给出回复

4、机器翻译

5、情感分类和意见挖掘

6、社会科学 books.google.com/ngrams

3、词表示:就要把我们说的词转换为计算机可以理解的表示

3.1 one hot 表示

任何一个词都表示词表大小的向量

star 【0,0,1,0,0】

sun【0,1,0,0,0

3.2 上下文表示词

词向量的长度也是字典的大小,但是向量中每个值的是上下文中出现的次数

3.3 word embedding

word2vector 方法,使用一个低维度的向量就是表示一个高纬度的向量且信息不丢失

语言模型

根据前面的词预测后面的词

语言模型的假设:后面的词只依赖前面的词;马尔可夫的假设

N-gram模型 使用条件概率和联合概率计算下一个词,每个词都是一个符号没有啥含义

问题:上下文不能特别大;词之间的相似度是独立的

Neural labaguage Model 模型

使用前面说的wordembedding表示的向量

大模型基础知识

word2vec,RNN,Elmo,Bert

预训练语言模型 作为nlp领域的基础工具

预训练语言模型:从无标注数据学习,使用任务相关数据进行微调,最终获取行业的大模型

这种方式也叫迁移学习

相关推荐
mit6.8242 分钟前
[手机AI开发sdk] 模型冻结&解冻.pb | `aidlite`加速AI模型
人工智能·智能手机
落798.7 分钟前
基于 GitCode 云端环境的 CANN ops-math 算子库深度测评:Ascend NPU 上的数学引擎解析
人工智能·gitcode
九河云18 分钟前
华为云ECS与Flexus云服务器X实例:差异解析与选型指南
大数据·运维·服务器·网络·人工智能·华为云
AI优秘企业大脑20 分钟前
如何提升自动化业务流程的效率?
大数据·人工智能
这张生成的图像能检测吗21 分钟前
(论文速读)视觉语言模型的无遗忘学习
人工智能·深度学习·计算机视觉·clip·持续学习·灾难性遗忘
杰克逊的日记29 分钟前
LLM(大语言模型)
人工智能·语言模型·自然语言处理
夏文强31 分钟前
HarmonyOS开发-系统AI视觉能力-图片识别
人工智能·华为·harmonyos
胡耀超34 分钟前
通往AGI的模块化路径:一个可能的技术架构(同时解答微调与RAG之争)
人工智能·python·ai·架构·大模型·微调·agi
说私域36 分钟前
定制开发AI智能名片S2B2C商城小程序的发展与整合资源策略研究
人工智能·小程序
落羽的落羽36 分钟前
【C++】现代C++的新特性constexpr,及其在C++14、C++17、C++20中的进化
linux·c++·人工智能·学习·机器学习·c++20·c++40周年