自然语言研究内容:
1、语音:语音识别、语音合成、说话人识别
- 语音技术:语音摘要、人机对话、语音翻译
2、文字:
- 分析处理:文本分类、情感分类、观点挖掘、主题发现、信息检索、文字校对..
- 理解生成:机器翻译、自动摘要、问答系统、自动写作..
- 自然语言处理:OCR、图片/视频识别,计算机视觉
3、神经科学语言学
语言认知计算
问题挑战:歧义(切分、结构、语义--隐喻),新词、新用法、新含义,不同概念差异
技术方法:
- 理性主义-符号逻辑 1947-1993
- 经验主义-统计学习 1993-2016
- 连结主义-神经网络 2016至今
连结主义-机器翻译:基于规则的方法、统计方法(n元法、神经网络方法)
n元文法模型,构成句子的n元词组的条件概率连乘。建立在统计学和Bayes基础之上。