图像识别

闲人编程4 天前
pytorch·深度学习·图像识别
图像分类:CIFAR10/ImageNet实战L=−∑i=1Nyilog⁡(pi)L = -\sum_{i=1}^N y_i \log(p_i)L=−∑i=1Nyilog(pi)
xulihang4 天前
前端·javascript·图像识别
在手机浏览器上扫描文档并打印使用手机扫描文档并打印方便快捷。在本文中,我们将编写一个支持在手机浏览器中扫描和打印文档的网页应用。使用Dynamsoft的以下SDK:
刘大猫266 天前
人工智能·设计模式·图像识别
SpringBoot使用Kafka生产者、消费者@[TOC]==说明: ① Topic主题用来区分不同类型的消息 ② GroupId用来解决同一个Topic主题下重复消费问题,比如一条消费需要多个消费者接收到,就可以通过设置不同的GroupId实现,实际消息是存一份的,只是通过逻辑上设置标识来区分,系统会记录Topic主题下--》GroupId分组下--》partition分区下的offsert,来标识是否消费过。==
xulihang10 天前
前端·javascript·图像识别
vCard名片二维码在前端的生成与扫描vCard又名VCF(“虚拟联系人文件”),是电子名片的文件格式标准。以下是vCard文件内容的一个示例:
arbboter12 天前
人工智能·tensorflow·卷积神经网络·keras·图像识别·局部特征提取·简单cnn实现
【AI实践】基于TensorFlow/Keras的CNN(卷积神经网络)简单实现:手写数字识别的工程实践在深度学习的广阔天地中,卷积神经网络(CNN)是计算机视觉领域的经典模型,卷积神经网络(CNN)凭借其强大的特征提取能力,成为了图像识别领域的中流砥柱。今天,就带大家深入剖析一个基于TensorFlow/Keras实现的简单CNN模型,看看它是如何在手写数字识别任务(MNIST数据集)中大显身手的。
yumuing13 天前
算法·强化学习·图像识别
Visual-RFT视觉强化微调:用「试错学习」教会AI看图说话✨ Yumuing 博客🚀 探索技术的每一个角落,解码世界的每一种可能!💌 如果你对 AI 充满好奇,欢迎关注博主,订阅专栏,让我们一起开启这段奇妙的旅程!
大数据AI人工智能培训专家培训讲师叶梓1 个月前
人工智能·计算机视觉·音视频·实时音视频·图像识别·gpt-4·视频生成
OmniHuman:一张图+音频生成逼真视频人工智能咨询培训老师叶梓 转载标明出处想要掌握如何将大模型的力量发挥到极致吗?叶老师带您深入了解 Llama Factory —— 一款革命性的大模型微调工具(限时免费)。
关键帧Keyframe1 个月前
ios·图像识别·音视频开发
音视频面试题集锦第 19 期 | 读取纹理数据我们在知识星球上创建的音视频技术社群关键帧的音视频开发圈已经运营了一段时间了,在这里大家可以一起交流和分享音视频技术知识和实战方案。我们会不定期整理一些音视频相关的面试题,汇集一份音视频面试题集锦(可进入免费订阅)。也会循序渐进地归纳总结音视频技术知识,绘制一幅音视频知识图谱(可进入免费订阅)。
ziwu1 个月前
深度学习·图像识别
基于Python深度学习的【蘑菇识别】系统~卷积神经网络+TensorFlow+图像识别+人工智能蘑菇识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了9种常见的蘑菇种类数据集【"香菇(Agaricus)", "毒鹅膏菌(Amanita)", "牛肝菌(Boletus)", "网状菌(Cortinarius)", "毒镰孢(Entoloma)", "湿孢菌(Hygrocybe)", "乳菇(Lactarius)", "红菇(Russula)", "松茸(Suillus)"】
xulihang2 个月前
前端·javascript·图像识别
在浏览器中扫描DotCode码DotCode 是一种二维(2D)矩阵条形码,主要用于烟草行业,其优点是可以通过高速工业打印机和激光雕刻等方式打印。
飞的肖3 个月前
java·ai·图像识别·dl4j
在 Java 项目中集成和使用 dl4j 实现通过扫描图片识别快递单信息使用DL4J(DeepLearning4J)搭建一个简单的图像识别模型,并将其集成到Spring Boot后端中。我们将使用MNIST数据集来训练一个简单的卷积神经网络(CNN),然后将其部署到Spring Boot应用中。
小陈phd3 个月前
opencv·图像识别·cv·边缘检测
OpenCV(python)从入门到精通——运算操作
华为云开发者联盟4 个月前
人工智能·pytorch·图像识别
领取云主机,带你基于PyTorch构建高效手写体识别系统本文分享自华为云社区《【开发者空间实践指导】基于PyTorch的手写体识别》,作者:开发者空间小蜜蜂。
7yewh4 个月前
ai·图像识别·soc·k210·嵌入式软件·mipi·k230
【K230 CanMV】图像识别-摄像头获取图像 Sensor 函数全解析引言:随着图像处理技术的不断发展,摄像头在嵌入式系统中的应用越来越广泛,尤其是在智能监控、自动驾驶、机器人视觉等领域。K230作为一款高性能的嵌入式处理器,提供了强大的图像处理能力,支持多种类型的摄像头接入与图像采集功能。在使用K230进行图像识别应用时,了解和掌握图像传感器(Sensor)的工作原理与控制方法是至关重要的。本文章将详细解析K230平台下如何通过操作摄像头Sensor模块,进行图像获取与处理,帮助开发者深入理解K230摄像头架构及其相关功能。
老艾的AI世界4 个月前
人工智能·深度学习·神经网络·目标检测·机器学习·ai·图像识别·ai生成视频·ai跳舞·ai视频生成
AI让照片跳舞,人人都能是舞王!Swan下载介绍最近,兵马俑、马斯克以及各地网友跳科目三和网红舞的视频陆续在社交媒体和朋友圈刷屏,这些大约10秒左右的视频都不是真人出镜,均由大模型生成,这种低门槛的跳舞方式引发了网友的广泛体验,掀起了一波斗舞狂潮「AI治愈了我的四肢不协调」
TF男孩4 个月前
人工智能·github·图像识别
再探老开源项目Tesseract,这次的OCR识别稍微会用了2015年,我首次踏入在线教育行业时,技术总监给我安排了一个任务:研究一下OCR识别。记得他是一个博士,给我推荐了谷歌的开源项目Tesseract。当时,我试了一下,感觉效果不好。他微微一笑,并没有说什么。
崔庆才丨静觅4 个月前
api·图像识别
身份证识别及信息核验 API 对接说明本文将介绍一种 身份证识别及信息核验 API 对接说明,它可以通过输入身份证图片 或 姓名和身份证号码,来校验姓名和身份证号的真实性和一致性。本接口用于校验姓名和身份证号的真实性和一致性,您可以通过输入姓名和身份证号或传入身份证人像面照片提供所需验证信息。
算家云5 个月前
人工智能·ai·图像识别·数据提取·布局分析·网页信息处理·阅读编辑
MinerU容器构建教程MinerU作为一款智能数据提取工具,其核心功能之一是处理PDF文档和网页内容,将其中的文本、图像、表格、公式等信息提取出来,并转换为易于阅读和编辑的格式(如Markdown)。在这个过程中,MinerU需要利用图像识别、文本识别(OCR)、布局分析等技术来理解和处理PDF文档和网页中的视觉信息。这些技术正是计算机视觉领域的重要组成部分。
ziwu5 个月前
人工智能·深度学习·图像识别
【车辆车型识别】Python+卷积神经网络算法+深度学习+人工智能+TensorFlow+算法模型车辆车型识别,使用Python作为主要编程语言,通过收集多种车辆车型图像数据集,然后基于TensorFlow搭建卷积网络算法模型,并对数据集进行训练,最后得到一个识别精度较高的模型文件。再基于Django搭建web网页端操作界面,实现用户上传一张车辆图片识别其类型。
goomind5 个月前
图像识别
YOLOv8实战工地安全帽检测【数据集+YOLOv8模型+源码+PyQt5界面】本文采用YOLOv8作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv8以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对工地安全帽数据集进行训练和优化,该数据集包含丰富的安全帽图像样本,为模型的准确性和泛化能力提供了有力保障。通过深度学习技术,模型能够自动提取安全帽的特征并进行分类识别。PyQt5界面设计简洁直观,便于用户操作和实时查看检测结果。本研究不仅提高了安全帽识别的自动化水平,还为工地生产系统的构建提供了有力支持,具有重要的理论应用价值。