深度学习

AI人工智能+10 小时前
人工智能·深度学习·计算机视觉·自然语言处理·ocr
一种基于深度学习的端到端户口本识别技术,通过多阶段神经网络架构实现高精度信息提取随着数字政府与智慧政务建设的深入推进,海量纸质档案的数字化转型成为关键痛点。户口本作为居民身份关系的核心法律凭证,其信息录入长期依赖人工操作,效率低且易出错。本文探讨一种基于神经网络的端到端户口本识别技术。该技术不仅实现了高精度的文字检测与识别(OCR),更引入了语义理解机制,能够自动区分户主页与成员页,精准提取并结构化关键数据,显著提升了信息处理的自动化水平与管理效能。
香蕉鼠片3 小时前
人工智能·深度学习·计算机视觉
数字化图像的过程现实世界光线、景物是连续模拟信号(时域 / 空域连续、亮度连续),计算机只能存储离散数字,一张实景变成矩阵图像必经:采样 → 量化 → 编码三步,是整张图像处理理论根基。
lqqjuly3 小时前
深度学习·神经网络·transformer
深度学习理论:从神经网络到Transformer—前馈网络、反向传播、注意力机制与训练深度学习研究的核心问题是:如何设计和训练多层非线性变换,使得机器能够从数据中自动学习有用的表示?这个问题可以分解为三个子问题:
chsmiao4 小时前
深度学习·ai编程
张量(Tensor)张量在数据本身上可以理解为数组:一个可以存在于任意维度(0 到 N 维)的数组。如果只看"长得像什么",张量和数组很像;但在深度学习框架里,张量通常还带有更强的计算属性:
chsmiao5 小时前
人工智能·深度学习·线性代数
深度学习之线性代数核心目标:把"张量计算"升级为"线性代数视角",理解向量、矩阵和它们的乘法规则。线性代数是深度学习的数学语言:
HyperAI超神经6 小时前
人工智能·深度学习·ai·计算化学
MiniCPM5-1B采用RL+OPD训练,多项复杂任务达SOTA;面向复杂医疗业务自动化:医疗智能体评测数据集 CHI-BenchMiniCPM5-1B 是由 OpenBMB 开源的一款专为端侧部署和资源受限场景设计的 10 亿参数级语言模型,也是 MiniCPM5 系列的首款模型。该模型基于标准 Llama 架构,引入了包含 <think> 标签的混合推理范式。此外,该模型借助先进的 RL+OPD 训练工艺,在大幅提升核心性能的同时有效消除了输出冗余。其原生支持 131K 超长上下文,并在智能体调用与代码合成等复杂任务中达到了 1B 级开源的 SOTA 水平。该模型有效规避了云端推理的延迟与隐私困境,为构建高效的本地化 AI 基座
一个王同学7 小时前
人工智能·深度学习·算法·机器学习·计算机视觉
从零到一 | CV转多模态大模型 | week12 | 整理 MiniLLaVA 工程与文档文中代码: https://github.com/wz940216/From0to1-MLLM-StudyLog.git
chsmiao7 小时前
人工智能·深度学习
深度学习之微积分核心目标:理解导数、偏导、梯度与链式法则,并掌握 PyTorch 自动微分的实现机制。在深度学习里,微积分最核心的用途是优化:训练模型就是不断调整参数使损失函数变小——"往哪调、调多少"依赖导数/梯度;"怎么自动算"依赖 autograd。
阳明山水7 小时前
人工智能·深度学习·机器学习·微信公众平台·微信开放平台
LightGBM为何胜过Prophet做销量预测在零售销量预测中,LightGBM在促销频繁或新品冷启动场景下表现优于Prophet,主要源于其模型特性和对复杂数据的处理能力。
JeJe同学7 小时前
深度学习·目标检测
LabelImg报错:IndexError: list index out of range 解决方法最近使用 LabelImg 标注数据时,点击下一张图片直接闪退,并出现如下错误:错误发生在:说明程序正在根据类别编号(class_index)从 classes.txt 中读取对应类别名称。
zhangfeng11338 小时前
人工智能·深度学习·语言模型·gpu算力·芯片
2021-2026 年全球 传统厂家AI 算力卡 GPU 前沿技术研究报告由ai生成,内容不一定准确(以下是基于上述三轮审稿意见修改后的完整报告)我已完成三轮审读。以下是详细的审稿意见,随后提供修改后的全文。
大模型最新论文速读9 小时前
论文阅读·人工智能·深度学习·机器学习·自然语言处理
06-05 · LLM 最新论文速览今日候选池 86 篇,硬过滤 + LLM 打分后通过评估 14 篇,精选 Top-10,另列 4 篇速览。
武子康10 小时前
人工智能·python·深度学习·ai·数字人
调查研究-155 Open-LLM-VTuber 本地部署与互动实战指南在本地搭建一个能听、能说、有形象的 AI 数字人,曾经是只有大型实验室才能玩转的黑科技。但随着开源社区的爆发式增长,现在只要有一台配置尚可的个人电脑,普通开发者也能在几个小时内让虚拟角色“活”起来。很多同学在尝试过程中,往往卡在环境依赖的迷宫里,或者模型加载后迟迟无法开口,甚至因为显存溢出导致程序直接崩溃。这些痛点不仅消磨热情,更让人误以为本地部署高不可攀。
高洁0110 小时前
python·深度学习·数据挖掘·知识图谱
打造行业知识图谱三步走打造行业知识图谱三步走一、 第一步:明确业务场景与知识边界 二、 第二步:抽取实体、关系与属性 三、 第三步:融合、清洗与持续更新 四、 为什么行业知识图谱需要“走对方向” 五、 从起步到落地:避坑指南
装不满的克莱因瓶10 小时前
人工智能·pytorch·python·深度学习·机器学习·ai
使用 PyTorch Tensor 的相关数据处理目录一、前言二、Tensor是什么三、Tensor的创建方式3.1 直接创建3.2 全0 / 全13.3 随机数
happyprince11 小时前
人工智能·深度学习·bert
17-Hugging Face Transformers之BERT 案例详解:Transformers 框架全模块串联本文档以 BERT 模型为例,将 Transformers 框架的所有模块串联起来,展示从加载到推理的完整生命周期。 所有引用均基于真实源码文件。
日光明媚11 小时前
人工智能·深度学习·机器学习·stable diffusion·aigc
从代码的角度解读DMD2dmd2思想解读移步从 DMD 到 DMD2:搞懂扩散模型的 “提速革命“-CSDN博客官方项目地址:tianweiy/DMD2: (NeurIPS 2024 Oral 🔥) Improved Distribution Matching Distillation for Fast Image Synthesis
weixin_4684668512 小时前
人工智能·深度学习·算法·机器学习·ai·unet
UNet 模型结构从零搭建与实战解析在医学影像分析领域,如何从复杂的 CT 或 MRI 扫描中精准地勾勒出病灶区域,一直是困扰开发者的难题。传统的图像处理方法往往依赖人工设计特征,不仅耗时耗力,而且在面对噪声大、边界模糊的医疗数据时,效果常常不尽如人意。随着深度学习的兴起,卷积神经网络(CNN)成为了主流解决方案,但通用的分类网络直接用于像素级分割时,往往会丢失大量的空间细节信息,导致分割边缘粗糙,无法满足临床辅助诊断的高精度需求。
装不满的克莱因瓶12 小时前
人工智能·python·深度学习·神经网络·ai·卷积
基于 Python 进行二维空间线性可分数据单/多层感知器实战目录一、前言二、什么是二维空间线性可分数据三、感知器的数学模型四、构造二维分类数据集五、数据可视化六、训练单层感知器
keyanbanyungong13 小时前
人工智能·深度学习
没预实验怎么申课题?国自然申报的第一道“隐形门槛”很多人以为国自然难在“创新性不够”或者“研究方案不完善”,但实际上,第一道门槛往往是“研究基础”。