自然语言NLP的基础处理

NLP基本处理从句子的情感分析、实体与实体直接的关系,句子结构来分析

情感分析

1.句子的情感分析找出句子表达的是正面、负面还是中性的情感。

情感分析的影响因素:

  1. 词语顺序:词语的顺序可以影响句子的整体情感。例如,"我喜欢你" 和 "你不喜欢我" 虽然包含相同的词语,但表达的情感截然不同。

  2. 上下文:上下文信息对于情感分析至关重要。例如,"他今天很好" 在不同的上下文中可能表达不同的情感。

  3. 情感修饰语:情感修饰语可以增强或减弱句子的情感强度。例如,"非常" 或 "有点" 这样的词可以改变情感的强度。

  4. 否定词:否定词的使用可以改变句子的情感方向。例如,"我不喜欢这部电影" 表达了负面的情感,而 "我喜欢这部电影" 则表达了正面的情感

关系

2.NLP任务中的实体标注和实体间关系标注

  1. 实体标注:标注文本中的关键实体,如人名、地名、组织名、时间等。

  2. 关系标注:标注实体之间的特定关系,如主谓关系、动宾关系等。

  3. 事件标注:标注文本中的事件,并标注事件的相关参与者(如执行者、受影响者等)

结构

3.词性标注(Part-of-Speech Tagging,简称 POS Tagging)是一种自然语言处理技术,其目的是为句子中的每个单词(或词组)确定其在语法结构中的类别,即词性。词性标注的结果通常是一个包含词和词性标签的列表,例如:"我(代词)","是(动词)","一个(数词)","好人(名词)"。

文本标注工具:BRAT(Browser-based Annotation Tool)是一款开源的文本标注软件

BRAT 的特点包括:

  • 浏览器端运行:无需安装额外的软件,只需通过浏览器即可使用。
  • 实时标注:标注者可以实时看到标注结果,并且可以与他人协作。
  • 标注历史记录:可以查看和恢复之前的标注版本。
  • 多种标注任务支持:可以定义多种标注任务,并支持自定义标注模板。
  • 标注导出:可以将标注结果导出为多种格式,如CoNLL、BIOES等。
相关推荐
fanged9 分钟前
CNN的小体验
人工智能·深度学习·cnn
悸尢10 分钟前
opencv颜色识别,hsv采用滑块调节
人工智能·opencv·计算机视觉
带带老表学爬虫12 分钟前
opencv第一课-cnblog
人工智能·python·opencv
记录&日常1 小时前
Pip install 和Conda install 的区别和使用场景
人工智能
辰阳星宇2 小时前
N-gram算法的pytorch代码实现
人工智能·pytorch·python·深度学习·机器学习·自然语言处理
PeterClerk3 小时前
PCA算法降维代码示例
人工智能·算法·机器学习·pca
带带老表学爬虫3 小时前
2.opencv保存图片和摄像头读取
人工智能·opencv·计算机视觉
github_zwl3 小时前
昇思25天学习打卡营第6天|linchenfengxue
人工智能·学习·目标跟踪
hf2000123 小时前
实时智能全托管-云器Lakehouse重新定义多维数据分析
大数据·人工智能·数据分析
网恋褙骗八万4 小时前
pytorch跑手写体实验
人工智能·pytorch·python