aardio 图像处理

今天终于学会了编程中的 OCR 技术!原来计算机真的能识别图片里的文字,这种让程序 "看懂" 图像的能力太神奇了,赶紧把学习过程记录下来。

一、初识OCR:让程序读懂图片文字

(一)简单识别实验

OCR就像给程序装上"火眼金睛",我先试了试识别本地图片:

arduino 复制代码
import console;
import string.ocrLite
import string.ocrLite.defaultModels;

var imgpath = "图片路径";
var ocr = string.ocrLite ();

var bit = gdip.bitmap(imgpath);
var text = ocr.detectBitmap(bit);

for(i, value in table.eachIndex(text.blocks)){
console.log(value.text)
}
console.pause();

运行时就像看着程序用"放大镜"逐字扫描图片,当控制台输出文字的那一刻,一种满满的自豪感由然而出!

接着试了网络图片识别,原来只要用inet.http()模块获取图片数据,后面的步骤和本地识别差不多:

arduino 复制代码
import inet.http;
import console;
import string.ocrLite
import string.ocrLite.defaultModels;
var http = inet.http(); 
var imgurl = "图片的url"; 
var ingData = http.get(imgurl)
var ocr = string.ocrLite();
var bit = gdip.bitmap(ingData);
var text = ocr.detectBitmap(bit);
for(i, value in table.eachIndex(text.blocks)){
    console.log(value.text)
}
console.pause();

(二)提高识别准确率的秘诀

我发现图片质量不好时,识别会出错。还能用"图片美容术":

  1. 灰度化处理:把彩色图片变成黑白照片,文字会更清晰
arduino 复制代码
import soImage
import console;
import string.ocrLite
import string.ocrLite.defaultModels;

img = soImage()
img.load("需要转换为灰度图的图片路径") 
// 转换图片为灰度图
img.grayScale()
img.save("保存路径") 

imgpath = "保存路径" 
var ocr = string.ocrLite(); 
var bit = gdip.bitmap(imgpath); 
var text = ocr.detectBitmap(bit); 
for(i, value in table.eachIndex(text.blocks)){
    console.log(value.text)
}
console.pause();

试了下,原本有点模糊的图片处理后,文字边缘果然更清楚了!

二、挑战

今天的挑战是处理这张网络图片:aardio.online/upload/file...

我把学到的知识组合起来,写出了完整代码:

arduino 复制代码
import soImage;
import console;
import inet.http;
import string.ocrLite;
import string.ocrLite.defaultModels;

var img = soImage();
var http = inet.http();

var imageUrl = "https://aardio.online/upload/files/20250423/1745395458.png";
string.save("D:/aaaaaaac.jpg", http.get(imageUrl));

img.load("D:/aaaaaaac.jpg");
//图片灰度化处理
img.grayScale();
img.save("D:/aaabbb.jpg");

var ocr = string.ocrLite();
var bit = gdip.bitmap("D:/aaabbb.jpg");
var imgtext = ocr.detectBitmap(bit);

for(i, value in table.eachIndex(imgtext.blocks)) {
    console.log(value.text)
}
console.pause();

运行时看着程序一步步下载、处理、识别,最后正确输出文字时,成就感爆棚!原来复杂任务都是由一个个小步骤组成的。

三、总结

今天最大的收获是明白OCR不是魔法,而是通过"图片预处理+识别算法"实现的。当图片质量差时,预处理就像给眼睛戴上眼镜,让OCR能看得更清楚。

相关推荐
Highcharts.js21 小时前
企业级可视化生态系统|关于Highcharts集成的前端框架、后端编程语言与生态
开发语言·javascript·python·前端框架·编辑器·编程语言·highcharts
wuhen_n9 天前
LangChain.js 初探:从手写代码到框架思维
langchain·ai编程·编程语言
iceiceiceice15 天前
iOS 26 适配 | 使用 `hidesSharedBackground` 保持导航栏按钮原有样式
ios·objective-c·编程语言
IT老小子19 天前
【c语言】linux下静态库和动态库制作
编程语言
m0_4886333219 天前
C语言学习笔记:探索简洁灵活且具多种特性的编程语言
c语言·学习笔记·编程语言·简洁性·灵活性
荔枝吻23 天前
【AI总结】【技术总结】深入剖析编程语言的分类:运行时语言 vs 编译型语言
编程语言·运行时语言·编译型语言
CoovallyAIHub23 天前
Agency-Agents(52k+ Stars):140+ 个角色模板,让 AI 编程助手变成一支专业团队
前端·算法·编程语言
平常心cyk24 天前
Python基础快速复习——while循环和for循坏
编程语言
土豆125024 天前
Rust宏编程完全指南:用元编程解锁Rust的终极力量
rust·编程语言
IT老小子1 个月前
【C++ STL】bind适配器详解
编程语言