【图片识别分类】如何快速识别照片中的水印文字,对图片进行关键字分类,快速整理水印相机拍摄图片,基于WPF和腾讯OCR的技术实现

项目背景

在施工现场,施工人员通常会使用水印相机拍摄照片,这些照片带有时间、地点、施工阶段等水印信息。为了便于管理和归档,需要快速识别照片中的水印文字,并根据关键字对照片进行分类和整理。

界面设计

界面设计简洁直观,方便用户快速上手:

  • 主窗口:包含一个图片选择区域、一个识别结果展示区域、一个关键字分类区域以及几个操作按钮(如"选择图片"、"开始识别"、"导出结果"等)。

  • 图片选择区域:用户可以通过按钮选择需要处理的图片文件,支持批量选择。

  • 识别结果展示区域:显示图片中识别到的文字内容。

  • 关键字分类区域:用户可以输入关键字,系统会根据关键字对图片进行分类。

  • 操作按钮

    • 选择图片:打开文件选择对话框,选择图片。

    • 开始识别:调用腾讯 OCR API 对选中的图片进行文字识别。

    • 导出结果:将识别结果和分类结果导出到表格或文件中。

详细代码步骤

以下是基于 WPF 和腾讯 OCR 的实现代码:

1. 引入必要的命名空间
复制代码
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net.Http;
using System.Text;
using System.Threading.Tasks;
using System.Windows;
using System.Windows.Controls;
using System.Windows.Data;
using System.Windows.Documents;
using System.Windows.Input;
using System.Windows.Media;
using System.Windows.Media.Imaging;
using System.Windows.Navigation;
using System.Windows.Shapes;
using Newtonsoft.Json;
using TencentCloud.Common;
using TencentCloud.Common.Profile;
using TencentCloud.Ocr.V20181119;
using TencentCloud.Ocr.V20181119.Models;
2. 主窗口代码

csharp

复制

复制代码
public partial class MainWindow : Window
{
    private string secretId = "your_secret_id";
    private string secretKey = "your_secret_key";
    private List<string> imagePaths = new List<string>();

    public MainWindow()
    {
        InitializeComponent();
    }

    private async void btnSelectImages_Click(object sender, RoutedEventArgs e)
    {
        Microsoft.Win32.OpenFileDialog openFileDialog = new Microsoft.Win32.OpenFileDialog
        {
            Multiselect = true,
            Filter = "Image files (*.jpg;*.jpeg;*.png)|*.jpg;*.jpeg;*.png"
        };
        if (openFileDialog.ShowDialog() == true)
        {
            imagePaths = openFileDialog.FileNames.ToList();
            txtResults.Text = "Selected images: " + string.Join(", ", imagePaths);
        }
    }

    private async void btnStartRecognition_Click(object sender, RoutedEventArgs e)
    {
        if (imagePaths.Count == 0)
        {
            MessageBox.Show("Please select images first.");
            return;
        }

        List<string> results = new List<string>();
        foreach (var imagePath in imagePaths)
        {
            string result = await RecognizeImageText(imagePath, secretId, secretKey);
            results.Add(result);
            txtResults.Text += $"\n\nImage: {imagePath}\nResult: {result}";
        }
    }

    private async Task<string> RecognizeImageText(string imagePath, string secretId, string secretKey)
    {
        try
        {
            Credential cred = new Credential(secretId, secretKey);

            HttpProfile httpProfile = new HttpProfile
            {
                Endpoint = "ocr.tencentcloudapi.com"
            };

            ClientProfile clientProfile = new ClientProfile
            {
                HttpProfile = httpProfile
            };

            OcrClient client = new OcrClient(cred, "ap-guangzhou", clientProfile);

            GeneralBasicOCRRequest req = new GeneralBasicOCRRequest
            {
                ImageBase64 = Convert.ToBase64String(File.ReadAllBytes(imagePath))
            };

            GeneralBasicOCRResponse resp = await client.GeneralBasicOCR(req);
            return JsonConvert.SerializeObject(resp, Formatting.Indented);
        }
        catch (Exception ex)
        {
            return $"OCR recognition failed: {ex.Message}";
        }
    }

    private void btnExportResults_Click(object sender, RoutedEventArgs e)
    {
        SaveFileDialog saveFileDialog = new SaveFileDialog
        {
            Filter = "Text files (*.txt)|*.txt"
        };
        if (saveFileDialog.ShowDialog() == true)
        {
            File.WriteAllText(saveFileDialog.FileName, txtResults.Text);
            MessageBox.Show("Results exported successfully.");
        }
    }
}
3. XAML 界面代码
复制代码
<Window x:Class="WpfApp.MainWindow"
        xmlns="http://schemas.microsoft.com/winfx/2006/xaml/presentation"
        xmlns:x="http://schemas.microsoft.com/winfx/2006/xaml"
        Title="OCR Image Recognition" Height="450" Width="800">
    <Grid>
        <Grid.RowDefinitions>
            <RowDefinition Height="Auto"/>
            <RowDefinition Height="*"/>
            <RowDefinition Height="Auto"/>
        </Grid.RowDefinitions>

        <Button x:Name="btnSelectImages" Content="Select Images" Grid.Row="0" Margin="10" Click="btnSelectImages_Click"/>
        <TextBox x:Name="txtResults" Grid.Row="1" Margin="10" VerticalScrollBarVisibility="Auto" TextWrapping="Wrap"/>
        <Button x:Name="btnStartRecognition" Content="Start Recognition" Grid.Row="2" Margin="10" Click="btnStartRecognition_Click"/>
        <Button x:Name="btnExportResults" Content="Export Results" Grid.Row="2" Margin="10" HorizontalAlignment="Right" Click="btnExportResults_Click"/>
    </Grid>
</Window>

总结优化

  1. 性能优化:对于大量图片的处理,可以考虑使用多线程或异步编程来提高识别效率。

  2. 功能扩展:可以增加更多功能,如支持更多图片格式、支持对识别结果的编辑和校正。

  3. 用户体验:进一步优化界面设计,使其更加友好和直观。

  4. 错误处理:增强错误处理机制,确保在识别失败或网络问题时能够给用户清晰的提示。

通过上述实现,可以快速识别施工现场照片中的水印文字,对图片进行关键字分类,并快速整理水印相机拍摄的图片,提高工作效率

相关推荐
大道随心6 小时前
【wpf】11 在WPF中实现父窗口蒙版效果:原理详解与进阶优化
wpf
LabVIEW开发7 小时前
LabVIEW车牌自动识别系统
数码相机·labview案例
TextIn智能文档云平台7 小时前
PDF文档解析新突破:图表识别、公式还原、手写字体处理,让AI真正读懂复杂文档!
图像处理·人工智能·算法·自然语言处理·pdf·ocr
白熊18817 小时前
【计算机视觉】基于Python的相机标定项目Camera-Calibration深度解析
python·数码相机·计算机视觉
带鱼工作室18 小时前
通义读光系列文字检测+识别模型端到端OCR应用
python·opencv·计算机视觉·ocr
zizisuo20 小时前
9.1.领域驱动设计
wpf
大道随心20 小时前
【wpf】10 C#树形控件高效实现:递归构建与路径查找优化详解
开发语言·c#·wpf
白熊18821 小时前
【计算机视觉】OpenCV实战项目:Text-Extraction-Table-Image:基于OpenCV与OCR的表格图像文本提取系统深度解析
opencv·计算机视觉·ocr
离歌漠1 天前
WPF内嵌其他进程的窗口
c#·wpf
沉到海底去吧Go1 天前
【身份证识别表格】批量识别身份证扫描件或照片保存为Excel表格,怎么大批量将身份证图片转为excel表格?基于WPF和腾讯OCR的识别方案
ocr·wpf·excel·身份证识别表格·批量扫描件身份证转表格·图片识别表格·图片识别excel表格