HarmonyOS开发-系统AI视觉能力-图片识别

HarmonyOS开发-系统AI视觉能力-图片识别

简介

本文继续介绍HarmonyOS提供的AI能力,Core Vision Kit(基础视觉服务)提供了机器视觉相关的基础能力,本文将着重梳理一下AI视觉服务的使用流程,代码实现等,我们整体的流程是先从手机中选取图片,可以使用本地图片,也可以拍照,选取图片后,我们进行图片识别,话不多说,我们直接上代码

开发步骤:

第一步:我们先要引入视觉服务的工具类,我们这次演示的功能是文字识别,所以我们引入对应的文字

复制代码
import { textRecognition } from '@kit.CoreVisionKit'

另外,我们是在图片识别中需要用图片,选取本地文件和拍照功能,所以我们要对应引入图片的工具类,文件操作工具类,拍照工具类

复制代码
import { image } from '@kit.ImageKit';
import { fileIo } from '@kit.CoreFileKit';
import { photoAccessHelper } from '@kit.MediaLibraryKit';

第二步:根据图片识别的步骤,我们需要先选取图片,定义一个图片选取的方法,其中可以调用拍照,代码如下:

复制代码
 //选择图片
   async selectImage() {
 //这里我们调用图片选取的方法,方法在下面定义了
    let uri = await this.openPicture();
 
    console.log("xwq:::"+JSON.stringify(uri))
    setTimeout(
      async () => {
        let imageSource: image.ImageSource | undefined = undefined;
        let fileSource = await fileIo.open(uri, fileIo.OpenMode.READ_ONLY);
        imageSource = image.createImageSource(fileSource.fd);
        this.chooseImage = await imageSource.createPixelMap();
    },100)

  }
    })
  }

第三步:打开图片选取picker,这块是单独的媒体管理能力,稍后我们另外去讲解

复制代码
```
//打开本地入库
openPicture(): Promise<string> {
    return new Promise<string>((resolve) => {
      let photoPicker: photoAccessHelper.PhotoViewPicker = new photoAccessHelper.PhotoViewPicker();
      photoPicker.select({
        MIMEType: photoAccessHelper.PhotoViewMIMETypes.IMAGE_TYPE,
        maxSelectNumber: 1
      }).then((res: photoAccessHelper.PhotoSelectResult) => {
        resolve(res.photoUris[0]);
      }).catch((err: BusinessError) => {
        resolve('');
      })
    })
  }
```

第四步:对选取的图片进行文字识别,我们使用什么样的功能就选用对用的方法,在这里,我们使用textRecognition.recognizeText方法,这里的参数我们按照官方的文档参数进行填写即可

复制代码
textRecogn() {
    // 调用文本识别接口
    if (!this.chooseImage) {
      return
    }
    //VisionInfo为待OCR检测识别的入参项,目前仅支持PixelMap类型的视觉信息。
    let visionInfo: textRecognition.VisionInfo = {
      pixelMap: this.chooseImage
    };
    //配置通用文本识别的配置项TextRecognitionConfiguration,用于配置是否支持朝向检测
    let textConfiguration: textRecognition.TextRecognitionConfiguration = {
      isDirectionDetectionSupported: false
    };
    textRecognition.recognizeText(visionInfo, textConfiguration)
      .then((data: textRecognition.TextRecognitionResult) => {
        // 将结果更新到Text中显示
        this.dataValues = data.value;
      })
      .catch((error: BusinessError) => {
        this.dataValues = `Error: ${error.message}`;
      });
  }

基于以上四步,就可以完成整体文字识别的功能,以下为完整的代码,可直接复制使用:

复制代码
import { image } from '@kit.ImageKit';
import { fileIo } from '@kit.CoreFileKit';
import { objectDetection, visionBase } from '@kit.CoreVisionKit';
import { photoAccessHelper } from '@kit.MediaLibraryKit';
import { BusinessError } from '@kit.BasicServicesKit';
import { textRecognition } from '@kit.CoreVisionKit'

@Entry
@Component
struct Index {
  private imageSource: image.ImageSource | undefined = undefined;
  @State chooseImage: PixelMap | undefined = undefined
  @State dataValues: string = ''

  async aboutToAppear(): Promise<void> {
    const initResult = await textRecognition.init();
  }
  openPicture(): Promise<string> {
    return new Promise<string>((resolve) => {
      let photoPicker: photoAccessHelper.PhotoViewPicker = new photoAccessHelper.PhotoViewPicker();
      photoPicker.select({
        MIMEType: photoAccessHelper.PhotoViewMIMETypes.IMAGE_TYPE,
        maxSelectNumber: 1
      }).then((res: photoAccessHelper.PhotoSelectResult) => {
        resolve(res.photoUris[0]);
      }).catch((err: BusinessError) => {
        resolve('');
      })
    })
  }

  async selectImage() {
    let uri = await this.openPicture();
    console.log("xwq:::"+JSON.stringify(uri))
    setTimeout(
      async () => {
        let imageSource: image.ImageSource | undefined = undefined;
        let fileSource = await fileIo.open(uri, fileIo.OpenMode.READ_ONLY);
        imageSource = image.createImageSource(fileSource.fd);
        this.chooseImage = await imageSource.createPixelMap();
    },100)

  }

  textRecogn() {
    // 调用文本识别接口
    if (!this.chooseImage) {
      return
    }
    //VisionInfo为待OCR检测识别的入参项,目前仅支持PixelMap类型的视觉信息。
    let visionInfo: textRecognition.VisionInfo = {
      pixelMap: this.chooseImage
    };
    //配置通用文本识别的配置项TextRecognitionConfiguration,用于配置是否支持朝向检测
    let textConfiguration: textRecognition.TextRecognitionConfiguration = {
      isDirectionDetectionSupported: false
    };
    textRecognition.recognizeText(visionInfo, textConfiguration)
      .then((data: textRecognition.TextRecognitionResult) => {
        // 将结果更新到Text中显示
        this.dataValues = data.value;
      })
      .catch((error: BusinessError) => {
        this.dataValues = `Error: ${error.message}`;
      });
  }

  build() {
    Column() {
      Image(this.chooseImage)
        .objectFit(ImageFit.Fill)
        .height('60%')

      Text(this.dataValues)
        .copyOption(CopyOptions.LocalDevice)
        .height('15%')
        .margin(10)
        .width('60%')

      Button('选择图片')
        .type(ButtonType.Capsule)
        .fontColor(Color.White)
        .alignSelf(ItemAlign.Center)
        .width('80%')
        .margin(10)
        .onClick(() => {
          // 拉起图库
          this.selectImage()
        })

      Button('文字识别')
        .type(ButtonType.Capsule)
        .fontColor(Color.White)
        .alignSelf(ItemAlign.Center)
        .width('80%')
        .margin(10)
        .onClick(async () => {
          this.textRecogn()
        })
    }
    .width('100%')
    .height('100%')
    .justifyContent(FlexAlign.Center)
  }
}

欢迎大家跟我一起学习鸿蒙开发知识,加入我的班级,参与HarmonyOS赋能资源丰富度建设(第四期),获得HarmonyOS应用开发者认证 每月对前200名学员进行激励,活动期间共计激励1000名

华为开发者学堂

相关推荐
jason成都6 分钟前
物联网智能监控系统:搭建 MQTT + AI 模型
人工智能·物联网
Omigeq15 分钟前
1.4 - 曲线生成轨迹优化算法(以BSpline和ReedsShepp为例) - Python运动规划库教程(Python Motion Planning)
开发语言·人工智能·python·算法·机器人
见山是山-见水是水24 分钟前
鸿蒙flutter第三方库适配 - 文件加密工具
flutter·华为·harmonyos
披星の月24 分钟前
一次完整大模型Lora训练实现“AI面试风”
人工智能·大模型
帐篷Li27 分钟前
教育部:加快普及中小学生人工智能教育政策汇总
人工智能
网络工程小王37 分钟前
【大模型(LLM)的业务开发】学习笔记
人工智能·算法·机器学习
SLAM必须dunk40 分钟前
四足强化入门3---Robot Lab重点机器人配置,训练和调参
人工智能·深度学习·机器学习·机器人
AI医影跨模态组学42 分钟前
ESMO Open 中国医学科学院肿瘤医院:整合影像组学、病理组学和活检适应性免疫评分预测局部晚期直肠癌远处转移
人工智能·深度学习·机器学习·论文·医学·医学影像
Ztopcloud极拓云视角1 小时前
GPT-6 & DeepSeek V4 双雄临近:企业多模型路由网关实战指南
人工智能·gpt·deepseek·gpt-6
hughnz1 小时前
AI和自动化让油田钻工慢慢消失
大数据·人工智能