图像识别

TF男孩6 天前
人工智能·github·图像识别
再探老开源项目Tesseract,这次的OCR识别稍微会用了2015年,我首次踏入在线教育行业时,技术总监给我安排了一个任务:研究一下OCR识别。记得他是一个博士,给我推荐了谷歌的开源项目Tesseract。当时,我试了一下,感觉效果不好。他微微一笑,并没有说什么。
崔庆才丨静觅13 天前
api·图像识别
身份证识别及信息核验 API 对接说明本文将介绍一种 身份证识别及信息核验 API 对接说明,它可以通过输入身份证图片 或 姓名和身份证号码,来校验姓名和身份证号的真实性和一致性。本接口用于校验姓名和身份证号的真实性和一致性,您可以通过输入姓名和身份证号或传入身份证人像面照片提供所需验证信息。
算家云17 天前
人工智能·ai·图像识别·数据提取·布局分析·网页信息处理·阅读编辑
MinerU容器构建教程MinerU作为一款智能数据提取工具,其核心功能之一是处理PDF文档和网页内容,将其中的文本、图像、表格、公式等信息提取出来,并转换为易于阅读和编辑的格式(如Markdown)。在这个过程中,MinerU需要利用图像识别、文本识别(OCR)、布局分析等技术来理解和处理PDF文档和网页中的视觉信息。这些技术正是计算机视觉领域的重要组成部分。
ziwu21 天前
人工智能·深度学习·图像识别
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
goomind1 个月前
图像识别
YOLOv8实战工地安全帽检测【数据集+YOLOv8模型+源码+PyQt5界面】本文采用YOLOv8作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv8以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对工地安全帽数据集进行训练和优化,该数据集包含丰富的安全帽图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取安全帽的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了安全帽识别的自动化水平,还为工地生产系统的构建提供了有力支持,具有重要的理论应用价值。
九幽归墟1 个月前
人工智能·边缘计算·图像识别
边缘计算:纯前端如何实现图片裁剪、压缩、转换与智能分类,支持离线与同步在数字化时代,图像处理技术的需求不断增加。无论是社交媒体、电子商务还是医疗影像,如何高效、智能地处理和分类图像成为了一个重要课题。边缘计算作为一种新兴技术,能够将计算任务移至用户设备本地,从而实现更快的处理速度和更低的网络延迟。
振华OPPO1 个月前
人工智能·pytorch·python·深度学习·神经网络·计算机视觉·图像识别
Pytorch快速入门PyTorch 有两个 用于处理数据的原语:torch.utils.data.DataLoader 和 torch.utils.data.Dataset。 Dataset 存储样本及其对应的标签,而 DataLoader 将一个可迭代对象包装在 Dataset 周围。
代码讲故事2 个月前
人工智能·gpt·计算机视觉·ai作画·图像识别·imagen·deepmind
谷歌发布Imagen 3,超过SD3、DALL・E-3,谷歌发布新RL方法,性能提升巨大,o1模型已证明谷歌发布Imagen 3,超过SD3、DALL・E-3,谷歌发布新RL方法,性能提升巨大,o1模型已证明。
Hello 0 12 个月前
语言模型·生活·openai·图像识别·文字转语音
MovieLife 电影生活今天看到一个很有意思的项目:https://www.lampysecurity.com/post/the-infinite-audio-book
扫地僧9852 个月前
人工智能·机器学习·图像识别
基于机器学习的注意力缺陷/多动障碍 (ADHD)(python论文+代码)HYPERAKTIV医疗保健领域的机器学习研究往往缺乏完全可重复性和可比性所需的公共数据。由于患者相关数据附带的隐私问题和法律要求,数据集往往受到限制。因此,许多算法和模型发表在同一主题上,没有一个标准的基准。因此,本文提出了一个公共数据集,包含健康、活动和心率数据,来自诊断的成年患者,更众所周知的ADHD。该数据集包括来自51名ADHD患者和52名临床对照组的数据。除了活动和心率数据,我们还包括了一系列患者属性,如他们的年龄、性别和精神状态信息,以及来自计算机化神经心理测试的输出数据。结合所提供的数据集,我们还提供了基线实
天南星2 个月前
深度学习·图像识别
PaddleOCR和PaddleLite的关联和区别PaddleOCR和PaddleLite是PaddlePaddle生态系统中的两个重要组件,它们各自扮演着不同的角色,并在不同的场景下发挥作用。理解它们之间的关系以及为何需要将模型转换为.nb文件,有助于更好地掌握使用它们的方式。
ziwu2 个月前
人工智能·深度学习·图像识别
植物病害识别系统Python+卷积神经网络算法+图像识别+人工智能项目+深度学习项目+计算机课设项目+Django网页界面植物病害识别系统。本系统使用Python作为主要编程语言,通过收集水稻常见的四种叶片病害图片('细菌性叶枯病', '稻瘟病', '褐斑病', '稻瘟条纹病毒病')作为后面模型训练用到的数据集。然后使用TensorFlow搭建卷积神经网络算法模型,并进行多轮迭代训练,最后得到一个识别精度较高的算法模型,然后将其保存为h5格式的本地模型文件。再使用Django搭建Web网页平台操作界面,实现用户上传一张测试图片识别其名称。
小陈phd3 个月前
人工智能·深度学习·图像识别
深度学习——基于MTCNN算法实现人脸侦测从2016年,MTCNN算法出来之后,属实在工业上火了一把,最近尝试着把论文代码复现了一下。** 这篇论文属于一篇多任务级联卷积神经网络,如图,利用P、R、O 三个网络来进行检测。 算法步骤:
Damon小智3 个月前
深度学习·yolo·目标检测·图像识别·性能指标
YOLO基础-目标检测的性能指标详解与计算方法目标检测是计算机视觉中的重要任务,主要目的是在图像中识别并定位特定的物体。YOLO(You Only Look Once)系列模型作为目标检测领域的代表性方法之一,凭借其高效和准确的特点,广泛应用于实际场景中。本文通过详细介绍目标检测的性能指标及其计算方法,帮助读者更好地理解和评估YOLO系列模型的表现。
谢林中路3 个月前
人工智能·图像识别
基于PCA与FLD技术的人脸识别本文将从数据降维方法开始介绍,分解应用于一个简单的人脸识别的demo,对数据降维与特征判别进行一些定性的讨论。
LabVIEW开发3 个月前
labview·labview开发·图像识别
LabVIEW工件表面瑕疵识别系统开发了一种利用LabVIEW和IMAQ Vision视觉工具进行工件表面瑕疵识别的系统。该系统通过图像处理技术识别并分类工件表面的裂纹、划痕等缺陷,从而提升生产线的分拣效率和产品质量。
ziwu4 个月前
图像识别
【眼疾病识别】图像识别+深度学习技术+人工智能+卷积神经网络算法+计算机课设+Python+TensorFlow眼疾识别系统,使用Python作为主要编程语言进行开发,基于深度学习等技术使用TensorFlow搭建ResNet50卷积神经网络算法,通过对眼疾图片4种数据集进行训练('白内障', '糖尿病性视网膜病变', '青光眼', '正常'),最终得到一个识别精确度较高的模型。然后使用Django框架开发Web网页端可视化操作界面,实现用户上传一张眼疾图片识别其名称。
Dxy12393102164 个月前
python·深度学习·机器学习·网易易盾·图像识别·网易·图标点选验证码
网易易盾图标点选验证码识别代码网易图标点选一直都是一个大难题,如上图所示。难点之一是图标变幻莫测,很难刷出有重复的图标,所以使用传统等等方式去标注、识别具有较大的难度。
子午4 个月前
人工智能·python·深度学习·图像识别·眼疾识别·疾病识别
【眼疾病识别】图像识别+深度学习技术+人工智能+卷积神经网络算法+计算机课设+Python+TensorFlow眼疾识别系统,使用Python作为主要编程语言进行开发,基于深度学习等技术使用TensorFlow搭建ResNet50卷积神经网络算法,通过对眼疾图片4种数据集进行训练(‘白内障’, ‘糖尿病性视网膜病变’, ‘青光眼’, ‘正常’),最终得到一个识别精确度较高的模型。然后使用Django框架开发Web网页端可视化操作界面,实现用户上传一张眼疾图片识别其名称。
子午5 个月前
人工智能·python·深度学习·图像识别·海洋生物识别·卷积神经网络算法
海洋生物识别系统+图像识别+Python+人工智能课设+深度学习+卷积神经网络算法+TensorFlow海洋生物识别系统。以Python作为主要编程语言,通过TensorFlow搭建ResNet50卷积神经网络算法,通过对22种常见的海洋生物(‘蛤蜊’, ‘珊瑚’, ‘螃蟹’, ‘海豚’, ‘鳗鱼’, ‘水母’, ‘龙虾’, ‘海蛞蝓’, ‘章鱼’, ‘水獭’, ‘企鹅’, ‘河豚’, ‘魔鬼鱼’, ‘海胆’, ‘海马’, ‘海豹’, ‘鲨鱼’, ‘虾’, ‘鱿鱼’, ‘海星’, ‘海龟’, ‘鲸鱼’)数据集进行训练,得到一个识别精度较高的模型文件,然后使用Django开发一个Web网页平台操作界面,实现用