二十一、【鸿蒙 NEXT】分词和汉字转拼音

【前言】

在某些功能场景,比如实现一个本地搜索功能时,可能需要支持中文搜索,同时支持拼音搜索。这里就会涉及到两个功能点,一个是中文转拼音,一个是将中文进行分词。同时这里有个注意点如果调用系统接口进行批量分词时,使用不当会导致UI卡顿。下面介绍下在鸿蒙next系统中,怎么实现这两个功能,以及怎么避免UI卡顿

1、中文转拼音

在系统接口中有个i18n的工具类,该工具类提供了一个Transliterator工具类,可以实现中文转拼音能力,代码如下

其中res1是包含声调的,res2是不包含声调的

javascript 复制代码
let res1:string = i18n.Transliterator.getInstance('Han-Latin').transform('中国')
let res2:string = i18n.Transliterator.getInstance('Latin-ASCII').transform(res1)

2、分词

在做功能搜索功能时,会将功能名称分词出不同的词语,来适配用户的搜索。这里系统提供了一个 分词功能,textProcessing是系统分词的一个工具类,代码如下,代码将"词语搜索"四个字分词层"词语"和"搜索"两个词

javascript 复制代码
 textProcessing.getWordSegment('词语搜索').then(wordSegments => {
     let words = wordSegments.map(wordSegment => wordSegment.word)
     console.log(`词语搜索 => ${JSON.stringify(words)}`)
   })

3、分词的注意点

这里要注意一点,如果使用不当,可能会造成UI界面的卡顿。

在调用系统分词接口时,实际是跨进程调用系统能力。如果我们一次性循环调用很多次分词接口,由于系统的分词进程最大开两个线程处理分词。因此我们如果循环大量调用接口,会导致我们app一直处于等待状态,而且会影响UI的正常展示。这种阻塞即使我们在app中启动子线程去调用系统接口,也没法起到效果。因为实际上我们跨进程调用分词接口时,本身会启动一个子线程去调用,真正造成UI卡顿的原因是,我们循环大批量开启跨进程调用,会导致app的线程资源耗尽,导致我们app其他线程无法正常获取线程资源。比如会影响网络请求,我们很多UI的展示依赖网络请求的返回值,由于线程资源耗尽,网络请求只能等待。从而影响UI正常展示。

解决方法就是我们可以分批次调用系统接口,比如每批次调用4次,等到前面的处理完成后,再继续下一批次调用。完整的代码实现如下,这里首先在app子线程去做分词功能,并在子线程中分批次调用。我们最终在app启动时调用SegmentUtil.segment();方法实现批量分词效果

javascript 复制代码
// 分词工具类,开启子线程执行
import { textProcessing } from "@kit.NaturalLanguageKit"
import { PromiseBatchUtils } from "./PromiseBatchUtils"
import { taskpool } from "@kit.ArkTS"

export class SegmentUtil {
  public static async segment() {
    let segmentResult = await taskpool.execute(segments) as Promise<string[][]>
    console.log(`segmentResult is ${JSON.stringify(segmentResult)}`)
  }
}

@Concurrent
async function segments():Promise<string[][]> {
  let arr:string[] = ['词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索','词语搜索']
  let arrPromise:(()=>Promise<string[]>)[] = arr.map(str => async () => {
    let wordSegments = await textProcessing.getWordSegment('词语搜索')
    return wordSegments.map(wordSegment => wordSegment.word)
  })
  let result = await PromiseBatchUtils.runWithBatch(arrPromise, 4)
  return result
}

// 分批次调用系统分词

export class PromiseBatchUtils {
  public static async runWithBatch<T>(tasks:(() => Promise<T>)[], batchNum:number):Promise<T[]> {
    let results:T[] = []
    let execute:Promise<void>[] = []
    let index = 0
    while (index < tasks.length) {
      if (execute.length < batchNum) {
        let taskIndex = index++
        console.log(`start index ${taskIndex}`)
        let executePromise = tasks[taskIndex]()
          .then(result => {
            results[taskIndex] = result
            console.log(`end index ${taskIndex}`)
          }).finally(() => {
            let executeIndex = execute.indexOf(executePromise)
            if (executeIndex > -1) {
              execute.splice(executeIndex,1)
            }
          })
        execute.push(executePromise)
      } else {
        await Promise.race(execute)
      }
    }
    await Promise.all(execute)
    return results
  }
}
相关推荐
sam.li3 小时前
鸿蒙HAR对外发布安全流程
安全·华为·harmonyos
sam.li3 小时前
鸿蒙APP安全体系
安全·华为·harmonyos
ChinaDragon6 小时前
HarmonyOS:通过组件导航设置自定义区域
harmonyos
人工智能知识库6 小时前
华为HCIP-HarmonyOS Application Developer题库 H14-231 (26年最新带解析)
华为·harmonyos·hcip-harmonyos·h14-231
C雨后彩虹6 小时前
亲子游戏问题
java·数据结构·算法·华为·面试
以太浮标7 小时前
华为eNSP模拟器综合实验之- 端口镜像(Port Mirroring)配置解析
运维·服务器·网络·华为
搬砖的kk7 小时前
鸿蒙 PC 版 DevEco Studio 使用 OHPM 下载三方库教程
华为·harmonyos
以太浮标21 小时前
华为eNSP模拟器综合实验之-DHCP服务中继配置案例
网络·华为·智能路由器·信息与通信
游戏技术分享21 小时前
【鸿蒙游戏技术分享 第75期】AGC后台批量导入商品失败,提示“参数错误”
游戏·华为·harmonyos
No Silver Bullet1 天前
HarmonyOS NEXT开发进阶(十七):WebView 拉起 H5 页面
华为·harmonyos