情感分析的定义
情感分析应用自然语言处理(NLP)、计算语言学和机器学习来识别数字文本的情感基调。 这使得组织能够识别对其品牌、产品、服务或想法的积极、中立或消极情绪。 最终,它使企业能够更好地了解客户,从而为企业提供可行的见解。
作为情感分析的一个例子,流媒体平台可以通过社交媒体帖子的文本分析来确定一系列节目的受欢迎程度。 在这种情况下,情绪分析使主播能够了解公众对内容的看法是积极、中立还是消极。 情绪分析的结果为平台提供了可行的见解:取消剧集、续订剧集或做出不同的演员和/或创意招聘决策。
情感分析 vs. 自然语言处理 (NLP)
情感分析是自然语言处理的一个子类别,这意味着它只是 NLP 执行的众多任务之一。 自然语言处理使计算机能够理解人类书面或口头语言。 NLP 任务包括命名实体识别、问答、文本摘要、语言识别和自然语言生成。
情感分析 vs. 机器学习 (ML)
情感分析使用机器学习来执行任何给定文本的分析。 机器学习使用在输入训练数据时 "学习" 的算法。 通过使用机器学习,情感分析不断发展,以更好地解释它所分析的语言。
情感分析 vs. 人工智能 (AI)
情感分析不应与人工智能混淆。 人工智能更广泛地指机器模仿人类学习和解决问题的能力。 机器学习是人工智能的一个子集,因此机器学习情感分析也是人工智能的一个子集。 虽然这三者都有联系,但它们并不相同。
情感分析 vs. 数据挖掘
情感分析是数据挖掘的一种形式,专门挖掘文本数据进行分析。 数据挖掘简单地指提取和分析大型数据集以发现各种类型的信息和模式的过程。
情感分析的类型
情感分析有多种不同类型,无论是基于规则、机器学习还是混合分析。 这些包括:
- 细粒度分析
- 基于方面的分析
- 情绪检测
- 基于意图的分析
细粒度情绪分析或分级情绪分析允许企业研究评论中的客户评级。 细粒度分析还将极性细化为非常积极、积极、中性、消极和非常消极类别。 因此,例如,1 星评论将被视为非常负面,3 星评论将被视为中立,而 5 星评论将被视为非常正面。
基于方面的情感分析(aspect-based sentiment analysis - ABSA)侧重于对服务或产品的单个方面的情感。 例如,一家科技公司推出了一套新的无线耳机。 需要考虑的一些方面可能是连接性、美学设计和音质。 通过请求的分析分类,基于方面的情感分析允许企业捕获客户对其产品或服务的特定部分的感受。 "These new ears are sexy" 表明了对耳机美学设计的看法。 "我喜欢这些的外观,但音量控制是一个问题" 可能会提醒企业注意实际的设计缺陷。
情绪检测情感分析超越了极性检测,可以识别客户的感受,例如快乐、悲伤或愤怒。 这种类型的分析可以使用词典来评估主观语言。 可怕和可耻之类的词暗示着愤怒。 悲惨和毁灭性的可能预示着悲伤。 令人兴奋或超级可以暗示幸福。 当然,词典并不考虑上下文,人们表达情感的方式也不同。 考虑这个例子:
"stuck (卡主)" 和 "frustrating (沮丧)" 等词表示消极情绪,而 "generous (慷慨)" 则表示积极情绪。 这种情绪微妙且难以归类。
基于意图的情绪分析使企业能够识别客户的意图和兴趣水平。 不同类型的意图包括购买、升级、降级、取消或取消订阅。 基于意图的分析需要使用相关文本(例如客户电子邮件或查询)进行分类训练。 例如,"我的存储空间不足,我该怎么办?" 可以归类为升级机会。 "我不喜欢收到的样品,我不需要更多的眼线"的意图可以归类为取消,但也提醒企业有一个服务改进的机会。 此类分析可帮助企业管理和维护其客户群并最大限度地提高销售机会。
如何应用情感分析
要完成情感分析,你需要:
- 预处理文本,包括标记句子、词形还原为词根形式以及删除停用词。
- 提取特征,其中可以包括将词形还原标记转换为数字表示或生成嵌入。
- 将情感分类器应用于你的数据。
情感分析可以通过三种方式进行:
- 基于规则的
- 机器学习
- 混合
基于规则的情感分析使用手动编写的算法(或规则)来评估语言。 这些规则使用计算语言学方法,例如标记化、词形还原、词干提取和词性标记。 他们还可能使用词典(词库)。
这种类型的分析将解析句子中的特定单词,并评估它们的极性和主观性,以确定情感和意图。 一旦为单词分配了极性(积极、消极),基于规则的方法将计算给定文本中出现的积极或消极单词的数量,以确定其整体情绪。
明显的缺点是这种类型的系统需要付出巨大的努力来创建所有规则。 另外,这些规则没有考虑单词在句子中的使用方式(它们的上下文)。 尽管可以编写新规则来适应复杂性,但这会影响分析的整体复杂性。 保持这种方法的准确性还需要定期评估和微调。
机器学习情感分析是基于规则的情感分析的自动化版本,它依赖于机器学习 (ML) 功能。 该模型需要向 ML 情感分析工具提供训练数据,以便它能够了解哪些单词对应于哪些极性。 训练数据的常见示例包括电影评论、亚马逊产品评论或 Yelp 评级的营业场所。 Hugging Face 是一个人工智能社区,提供开源库、数据集和模型,可帮助构建和训练情感分析工具。
一旦机器学习情感分析训练完成,该过程就归结为特征提取和分类。 为了产生结果,机器学习情感分析方法将依赖于不同的分类算法,例如深度学习、朴素贝叶斯 (Naïve Bayes)、线性回归或支持向量机。
混合情感分析结合了基于规则和机器学习的情感分析方法。 当根据公司或用户的特定需求进行调整时,它可能是最准确的工具。 当情绪更加微妙时,例如企业对企业 (B2B) 沟通,其中负面情绪以更专业的方式表达,它尤其有用。
情感分析的用例
情绪分析通过识别以下内容提供可行的业务见解:
- 所用语言的极性(积极、中性还是消极?)
- 消费者反应的情绪基调(他们生气、高兴还是悲伤?)
- 语气是否紧急
- 消费者的意图或兴趣程度是什么
作为自动意见挖掘,情绪分析可以服务于多种商业目的。
评论
使用情绪分析工具,企业可以收集和分析来自社交平台、博客文章以及各种讨论或评论论坛的评论、评论和提及。 这是非常宝贵的信息,可以让企业评估其品牌认知。
发现积极情绪可以帮助指导公司应该继续做什么,而消极情绪可以帮助确定公司应该停止和开始做什么。 在这个用例中,情绪分析对于营销和品牌团队来说是一个有用的工具。 根据分析见解,他们可以调整策略以维持和提高品牌认知度和声誉。
社交媒体监控
客户对产品或服务的反馈可以出现在互联网上的各个地方。 手动单独收集和分析这些评论效率低下。
情绪分析工具可以立即检测任何提及并立即提醒客户服务团队。 这使得公司能够跟踪客户的态度,进而更有效地管理他们的客户体验。 情绪分析工具也可用于监控。 作为品牌认知监控的延伸,情绪分析可以成为宝贵的危机预防工具。 这使得团队能够仔细监控软件升级和新版本的问题,并在出现问题时缩短响应时间。
市场走向
在进行市场研究时,情绪分析是一个有用的工具,因为它允许组织对整个市场、利基市场以及特定产品和服务进行广泛的审查,从态度中汲取洞察,以更好地评估客户的需求和期望。
情感分析中的常见挑战
语言是一种复杂、不完美且不断发展的人类交流工具。 由于情感分析依赖于语言解释,因此它本身就具有挑战性。
企业对企业评论
了解竞争对手的评论是一项情感分析挑战。 如果一家公司制定规则,将某些描述其业务情绪的语言识别为积极的,那么用于描述竞争对手的相同语言也将被视为积极的。 例如:
- 我喜欢[贵公司]运送产品的速度 (I love how quickly [your company] ships their product.)。
- 我喜欢可以与[你的竞争对手]设置发货窗口 (I love that I can set my shipping window with [your competitor].)。
这两种说法都是积极的,但情绪分析工具无法区分公司及其竞争对手,除非它经过训练,能够将竞争对手的任何积极因素识别为消极因素。
讽刺、挖苦和背景
检测和理解当面讽刺和讽刺的挑战也延伸到情感分析。 讽刺使用积极的词语来描述消极的感受,问题是机器通常没有文本线索来区分真诚与讽刺或反讽。 例如,在回答 "你喜欢橙汁中的果肉吗?" 时,"天哪,你打赌" 如果作者是真诚的,则可以被理解为积极的,如果作者是讽刺的,则可以被理解为消极的。
背景也会扭曲情绪。 考虑这两个回应:
- "只有一点点 (only a little bit)。"
- "很多 (A lot)!"
如果评论是针对 "您推荐该产品的可能性有多大?"之类的问题,则第一个响应被视为负面,而第二个响应被视为正面。 然而,如果提示是 "价格调整对你造成了多大的困扰?",则极性相反。
文化差异
特定文化的语言使用是情感分析的主要挑战之一。 考虑一下一种文化与另一种文化之间的幽默有多么不同。 即使在英语中,辩证差异也使得区分意义变得复杂。 例如:
- "Pants"在美式英语中指的是裤子。 在英国,"pants" 是内衣的意思。
这种差异会影响分析的准确性。 习语也因文化而异。 他们的分析是一个类似的挑战。
主观性
情感分析的主要挑战之一是语言是主观的。 这使得划分为整齐的类别、方面或极性变得复杂。 考虑这个例子:
- "这款手机很棒" 清楚地表明了积极的情绪。
- "这款手机很小" 更难归类。 根据作者对大小的感受,它可能是积极的、中立的或消极的陈述。
由于上下文、讽刺或讽刺的使用以及其他言语特殊性,给定单词的含义可能是主观的。
情绪分析的好处
情感分析通过可行的见解使用户受益。 作为一种工具,它的优点有很多:
让客户的情绪实时变得可行
情绪分析工具可以帮助防止不满和流失,甚至可以找到支持你的产品或服务的客户。 该工具可以分析调查或客户服务互动,以确定哪些客户是推广者或拥护者。 相反,情绪分析还可以帮助识别不满意的客户,他们的产品和服务响应可以提供有关改进领域的宝贵见解。
大规模挖掘客户情绪的文本
情绪分析工具提供实时分析,这对于危机的预防和管理是不可或缺的。 出现问题时立即收到警报,并在即将发生的危机之前采取行动。 作为一种意见挖掘工具,情绪分析还为公关团队提供了宝贵的见解,以制定战略和管理持续的危机。
改善客户服务
情绪分析工具同时从各种来源提取广泛的数据:电子邮件、推文、评论、调查、民意调查和评论。 文本分析工具可以帮助经理更好地管理客户服务运营,确定查询的优先级,并自动跟踪不良交互,方法是让经理能够培训处理棘手客户的客户服务倡导者。
情感分析的常用方法
情感分析有多种方法。 你可以自己构建一个、购买云提供商附加组件或投资现成的情绪分析工具。 有多种软件即服务 (SaaS) 情绪分析工具可供使用,而 Python 或 Java 等开源库可用于构建你自己的工具。 或者,云提供商提供自己的人工智能套件。
建立自己的情感模型
你可以使用 NLP 库(例如 spaCy 或 NLTK)构建自己的情感模型。 对于那些雄心勃勃的人,你甚至可以从头开始构建! 使用 Python 或 Javascript 进行情感分析为你提供更多自定义控制。 尽管定制的好处很重要,但在做出决定时应考虑构建自己的工具所需的成本和时间。
使用交钥匙情绪分析产品
你还可以购买解决方案,例如标准云提供商提供的 SaaS 产品。 这可能包括 Amazon Comprehend、Google AI 和机器学习产品,或 Azure 的认知服务。 SaaS 情绪分析工具的优点是可以快速部署,而且成本通常只是定制工具的一小部分。 该工具的培训过程得到简化,不需要整个工程师和专家团队进行设置。
整合第三方情感分析
借助 Elastic 等第三方解决方案,你可以将自己的或公开可用的情绪模型上传到 Elastic 平台。 然后,你可以实现应用程序来分析 Elastic 中存储的文本数据的情绪。
云提供商 AI 套件
云提供商还将情绪分析工具作为其人工智能套件的一部分。 选项包括谷歌人工智能和机器学习产品,或 Azure 的认知服务。
随着人工智能技术的学习和改进,情感分析方法不断发展。 成功的情绪分析方法需要对培训模型进行持续调整,或对购买的软件进行频繁更新。
开始使用 Elastic 进行情绪分析
使用 Elastic 启动你的情绪分析工具,以便你可以执行自己的意见挖掘并获得所需的可行见解。