自然语言NLP的基础处理

NLP基本处理从句子的情感分析、实体与实体直接的关系,句子结构来分析

情感分析

1.句子的情感分析找出句子表达的是正面、负面还是中性的情感。

情感分析的影响因素:

  1. 词语顺序:词语的顺序可以影响句子的整体情感。例如,"我喜欢你" 和 "你不喜欢我" 虽然包含相同的词语,但表达的情感截然不同。

  2. 上下文:上下文信息对于情感分析至关重要。例如,"他今天很好" 在不同的上下文中可能表达不同的情感。

  3. 情感修饰语:情感修饰语可以增强或减弱句子的情感强度。例如,"非常" 或 "有点" 这样的词可以改变情感的强度。

  4. 否定词:否定词的使用可以改变句子的情感方向。例如,"我不喜欢这部电影" 表达了负面的情感,而 "我喜欢这部电影" 则表达了正面的情感

关系

2.NLP任务中的实体标注和实体间关系标注

  1. 实体标注:标注文本中的关键实体,如人名、地名、组织名、时间等。

  2. 关系标注:标注实体之间的特定关系,如主谓关系、动宾关系等。

  3. 事件标注:标注文本中的事件,并标注事件的相关参与者(如执行者、受影响者等)

结构

3.词性标注(Part-of-Speech Tagging,简称 POS Tagging)是一种自然语言处理技术,其目的是为句子中的每个单词(或词组)确定其在语法结构中的类别,即词性。词性标注的结果通常是一个包含词和词性标签的列表,例如:"我(代词)","是(动词)","一个(数词)","好人(名词)"。

文本标注工具:BRAT(Browser-based Annotation Tool)是一款开源的文本标注软件

BRAT 的特点包括:

  • 浏览器端运行:无需安装额外的软件,只需通过浏览器即可使用。
  • 实时标注:标注者可以实时看到标注结果,并且可以与他人协作。
  • 标注历史记录:可以查看和恢复之前的标注版本。
  • 多种标注任务支持:可以定义多种标注任务,并支持自定义标注模板。
  • 标注导出:可以将标注结果导出为多种格式,如CoNLL、BIOES等。
相关推荐
kakaZhui7 分钟前
【llm对话系统】大模型源码分析之 LLaMA 位置编码 RoPE
人工智能·深度学习·chatgpt·aigc·llama
struggle20251 小时前
一个开源 GenBI AI 本地代理(确保本地数据安全),使数据驱动型团队能够与其数据进行互动,生成文本到 SQL、图表、电子表格、报告和 BI
人工智能·深度学习·目标检测·语言模型·自然语言处理·数据挖掘·集成学习
佛州小李哥1 小时前
通过亚马逊云科技Bedrock打造自定义AI智能体Agent(上)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
云空2 小时前
《DeepSeek 网页/API 性能异常(DeepSeek Web/API Degraded Performance):网络安全日志》
运维·人工智能·web安全·网络安全·开源·网络攻击模型·安全威胁分析
AIGC大时代2 小时前
对比DeepSeek、ChatGPT和Kimi的学术写作关键词提取能力
论文阅读·人工智能·chatgpt·数据分析·prompt
山晨啊83 小时前
2025年美赛B题-结合Logistic阻滞增长模型和SIR传染病模型研究旅游可持续性-成品论文
人工智能·机器学习
一水鉴天4 小时前
为AI聊天工具添加一个知识系统 之77 详细设计之18 正则表达式 之5
人工智能·正则表达式
davenian4 小时前
DeepSeek-R1 论文. Reinforcement Learning 通过强化学习激励大型语言模型的推理能力
人工智能·深度学习·语言模型·deepseek
X.AI6664 小时前
【大模型LLM面试合集】大语言模型架构_llama系列模型
人工智能·语言模型·llama
CM莫问5 小时前
什么是门控循环单元?
人工智能·pytorch·python·rnn·深度学习·算法·gru