集成自然语言理解服务,让应用 “听得懂人话”

如今,应用程序智能化已成趋势,开发者想要实现智能化,那么首先需要赋予应用理解自然语言的能力,使其能够准确地听懂人话,进而响应用户需求,并提供一系列智能化服务。比如用户语音控制应用程序帮忙订票,应用程序在将语音转换成文字后,需要通过技术处理准确地理解指令内容,才可以拉取对应程序功能提供服务。

HarmonyOS SDK自然语言理解服务(Natural Language Kit)提供了多项文本语义理解相关的基础能力,目前包括分词实体抽取,能够帮助开发者更好地处理和分析文本数据。

分词

分词可以将一段文本切分成独立的词语单元,识别出句子中的每个词汇,包括中文、英文和数字内容,从而为后续的语义分析、信息提取等任务奠定基础。

在实际应用场景中,搜索引擎就便用到了这一功能,当用户输入需要搜索的文本内容,搜索引擎将会先对其进行分词处理,在提取关键词后再进行匹配搜索。

开发步骤

分词处理的开发共分为3个步骤。

1.引用相关类添加至工程。

复制代码
import { textProcessing } from '@kit.NaturalLanguageKit';

2.配置输入文本框和按钮,调用分词textProcessing.getWordSegment接口。

复制代码
let inputText: string = '';

TextInput({ placeholder: '请输入文本' })
  .height(40)
  .fontSize(16)
  .width('90%')
  .margin(10)
  .onChange((value: string) => {
    this.inputText = value;
  })

Button('获取分词结果')
  .type(ButtonType.Capsule)
  .fontColor(Color.White)
  .width('45%')
  .margin(10)
  .onClick(async () => {
    try {
      let result = await textProcessing.getWordSegment(this.inputText);
      this.outputText = this.formatWordSegmentResult(result);
    } catch (err) {
      console.error(`getWordSegment error: ${err.message}`);
    }
  })

3.在界面上展示分词结果。

复制代码
private formatWordSegmentResult(segments: textProcessing.WordSegment[]): string {
  let output = 'Word Segments:\n';
  segments.forEach((segment, index) => {
    output += `Word[${index}]: ${segment.word}, Tag: ${segment.wordTag}\n`;
  });
  return output;
}

实体抽取

实体抽取是实现自然语言处理的一项关键能力,它能够精准地从文本中识别出具有特定意义的实体信息,例如人名、地名、时间日期、数字、电话号码、邮箱地址等。开发者可以通过实体抽取能力,结合自身业务场景开发各种智能化应用程序,提高用户服务体验。

例如,在新闻阅读场景中,开发者可以通过该能力对新闻正文进行实体抽取,并对人名、地名、时间、网址等关键实体信息进行高亮标识,从而帮助读者快速获取文章要点,有效提升信息获取效率;在用户填写收货地址的场景中,开发者可以借助实体抽取能力快速识别抽取收件人姓名、地址、手机号等信息,在用户填写表单时提供结构化的文本信息,供用户快速填充表单。

开发步骤

实体抽取的开发共分为4个步骤。

1.引用相关类添加至工程。

复制代码
import { textProcessing, EntityType } from '@kit.NaturalLanguageKit';

2.配置输入文本框。

复制代码
let inputText: string = '';

TextInput({ placeholder: '请输入文本' })
  .height(40)
  .fontSize(16)
  .width('90%')
  .margin(10)
  .onChange((value: string) => {
    this.inputText = value;
  })

3.配置按钮,调用实体抽取textProcessing.getEntity接口。

复制代码
Button('获取实体结果')
  .type(ButtonType.Capsule)
  .fontColor(Color.White)
  .width('45%')
  .margin(10)
  .onClick(async () => {
    try {
      let result = await textProcessing.getEntity(this.inputText, {entityTypes: [EntityType.NAME, EntityType.PHONE_NO]});
      this.outputText = this.formatEntityResult(result);
    } catch (err) {
      console.error(`getEntity error: ${err.message}`);
      this.outputText = 'Error occurred while getting entities.';
    }
  })

4.在界面上展示实体抽取结果。

复制代码
private formatEntityResult(entities: textProcessing.Entity[]): string {
  if (!entities || !entities.length) {
    return 'No entities found.';
  }

  let output = 'Entities:\n';
 for (let i = 0; i < entities.length; i++) {
    let entity = entities[i];
    output += `Entity[${i}]:\n`;
    output += `  oriText: ${entity.text}\n`;
    output += `  charOffset: ${entity.charOffset}\n`;
    output += `  entityType: ${entity.type}\n`;
    output += `  jsonObject: ${entity.jsonObject}\n\n`;
  }
  return output;

自然语言理解服务作为构成智能化应用开发的基础能力,可广泛应用于新闻阅读、信息检索、客户服务、社交聊天、金融运营等多种场景。随着技术的不断进步,我们期待广大开发者继续探索和创新,以发掘更多智能化应用的可能性,推动行业更高层次的智能化发展。

文章转载自: HarmonyOS_SDK

原文链接: https://www.cnblogs.com/HarmonyOSSDK/p/18611872

体验地址: 引迈 - JNPF快速开发平台_低代码开发平台_零代码开发平台_流程设计器_表单引擎_工作流引擎_软件架构

相关推荐
MVP-curry-萌神14 分钟前
FPGA图像处理(六)------ 图像腐蚀and图像膨胀
图像处理·人工智能·fpga开发
struggle202530 分钟前
ebook2audiobook开源程序使用动态 AI 模型和语音克隆将电子书转换为带有章节和元数据的有声读物。支持 1,107+ 种语言
人工智能·开源·自动化
深空数字孪生33 分钟前
AI+可视化:数据呈现的未来形态
人工智能·信息可视化
标贝科技1 小时前
标贝科技:大模型领域数据标注的重要性与标注类型分享
数据库·人工智能
aminghhhh1 小时前
多模态融合【十九】——MRFS: Mutually Reinforcing Image Fusion and Segmentation
人工智能·深度学习·学习·计算机视觉·多模态
格林威1 小时前
Baumer工业相机堡盟工业相机的工业视觉是否可以在室外可以做视觉检测项目
c++·人工智能·数码相机·计算机视觉·视觉检测
陈苏同学1 小时前
MPC控制器从入门到进阶(小车动态避障变道仿真 - Python)
人工智能·python·机器学习·数学建模·机器人·自动驾驶
努力毕业的小土博^_^2 小时前
【深度学习|学习笔记】 Generalized additive model广义可加模型(GAM)详解,附代码
人工智能·笔记·深度学习·神经网络·学习
木偶彡2 小时前
如何通过http访问ollama接口
大模型·ollama·deepseek
小小鱼儿小小林2 小时前
用AI制作黑神话悟空质感教程,3D西游记裸眼效果,西游人物跳出书本
人工智能·3d·ai画图