人工智能前沿讲座——融合知识的自然语言处理

目录

引言

NLP的发展与现状

发展

机器翻译

机器翻译+知识记忆(高频词汇记录)

现状

我们的尝试

融入外部知识库

融合语言先验知识

融合语篇知识

融合人类行为知识


引言

自然语言处理没有大家都认可的一个定义。

研究人与人交际中以及在人与计算机交际中的语言问题的一门学科。

自然语言的变化是不受人控制。

如basical方言太多,已经消亡了。C语言依然兴旺,有人工控制的作用。

语言处理与人工智能密不可分。

怎么机器可以更像人?1、下棋胜过人 2、用语言与人交流

图灵都预言到了。现在的AlphaGo与CHATGPT就是实证。

NLP的发展与现状

发展

机器翻译

66年ALPAC《语言与机器》对机器翻译采取否定的态度。

报告指出,机器翻译难以克服"语义障碍"。(布尔模型的问题)

The pen was in the box. The box was in the pen.

钢笔在盒子里,盒子在围栏里。查字典式的机器翻译被判死刑。

人工智能陷入十年寒冬。

机器翻译+知识记忆(高频词汇记录)

1、知识记忆一开始是学语言学的整理的,他们负责整理规则。(人工整理)

虽然效果不好,但很好做,容易水论文。

1:知识驱动时代 2、3数据驱动时代(有知识,但人越来越难理解,炼丹)

2、从数据当中学知识,人再去标注正确错误。(机器学习)

3、深度学习:自然语言处理系统(知识)

| 微调 ----------------指令

预训练模型 | 标注

| 训练 人类

数据

预训练方法成功的两个关键:自监督学习、transformer

现状

GPT 让GPT做事,要多加限定词,不然知识很难激活,会翻译错意思。

语言跟思维是否等同?若不等同,说明大模型这条路实现不了真正的人工智能。

有些情况不用大模型能否成功?因为大模型需要的资源大部分高校无法提供。

张钹院士,周志华,周明教授都说要在新一代人工智能中加入知识。当时第一个老师有反驳。

这个老师是支持大模型是有知识的,说不承认大模型有知识就是一叶障目不见泰山,但只是它自己的知识,是人不能理解的。

我们的尝试

考虑能不能将知识显化,或者融入几十年间的成果。

融入外部知识库

写一个普法模型 全过程类似搜索引擎的创建

融合语言先验知识

1、生物医学领域命名实体识别

引入辅助任务+多任务学习

2、强化对表情的关注,实现手语翻译功能

方案一:手套(不行)脸部信息

方案二:深度相机(成本太高)

方案三:普通相机或者手机

手语是主宾谓,而且会省略很多词语;

手语中表情很重要。

融合语篇知识

篇章连贯性与篇章连接性

词嵌入:同义词与反义词向量太近

语篇结构指导机器翻译的关联性

基于主-述标注语料

融合人类行为知识

相关推荐
LCG元19 分钟前
垂直Agent才是未来:详解让大模型"专业对口"的三大核心技术
人工智能
我不是QI38 分钟前
周志华《机器学习—西瓜书》二
人工智能·安全·机器学习
操练起来1 小时前
【昇腾CANN训练营·第八期】Ascend C生态兼容:基于PyTorch Adapter的自定义算子注册与自动微分实现
人工智能·pytorch·acl·昇腾·cann
KG_LLM图谱增强大模型1 小时前
[500页电子书]构建自主AI Agent系统的蓝图:谷歌重磅发布智能体设计模式指南
人工智能·大模型·知识图谱·智能体·知识图谱增强大模型·agenticai
声网1 小时前
活动推荐丨「实时互动 × 对话式 AI」主题有奖征文
大数据·人工智能·实时互动
caiyueloveclamp1 小时前
【功能介绍03】ChatPPT好不好用?如何用?用户操作手册来啦!——【AI溯源篇】
人工智能·信息可视化·powerpoint·ai生成ppt·aippt
q***48411 小时前
Vanna AI:告别代码,用自然语言轻松查询数据库,领先的RAG2SQL技术让结果更智能、更精准!
人工智能·microsoft
LCG元1 小时前
告别空谈!手把手教你用LangChain构建"能干活"的垂直领域AI Agent
人工智能
想你依然心痛2 小时前
视界无界:基于Rokid眼镜的AI商务同传系统开发与实践
人工智能·智能硬件·rokid·ai眼镜·ar技术
Learn Beyond Limits3 小时前
Data Preprocessing|数据预处理
大数据·人工智能·python·ai·数据挖掘·数据处理