技术栈
深度学习
AI人工智能+
14 分钟前
深度学习
·
ocr
·
表格识别
表格识别技术:实现复杂表格内容的精准解析与表格结构的版面还原,推动档案管理从数字化存储向智能化服务转型
档案数字化进程中,财务报表、统计台账、人事登记表等包含大量复杂表格的资料,一直是成本最高、效率最低的“硬骨头”。传统OCR识别结果支离破碎,表格结构尽失,导致大量数字化档案沦为不可检索、不可分析的“死数据”。如何突破这一瓶颈,释放档案深层价值?一种专注于复杂表格内容的精准解析与表格结构的版面还原的智能表格识别技术,正重新定义档案数字化的质量标准。
Hcoco_me
1 小时前
人工智能
·
深度学习
·
算法
·
机器学习
·
vllm
大模型面试题75:讲解一下GRPO的数据回放
在GRPO(群体相对策略优化)训练LLM的过程中,数据回放就像学生的错题本+好题本——把之前训练中“表现好的样本”存起来,后续训练时再拿出来反复用,核心目的是防止模型“学了新的,忘了旧的”,同时还能节省计算资源。咱们还是从小白能懂的基础入手,一步步拆明白。
高洁01
2 小时前
深度学习
·
算法
·
机器学习
·
transformer
·
知识图谱
AIGC技术与进展(1)
AIGC技术与进展(1)一、AIGC的发展历程 二、AIGC的核心技术 三、AIGC的重要进展#智能体搭建#多智能体#VLA#大模型#AI
PeterClerk
2 小时前
人工智能
·
python
·
深度学习
·
计算机视觉
·
benchmark
·
评测
计算机视觉常用指标(Metrics)速查与解释(持续更新)
适用范围:分类 / 检测 / 分割 / 跟踪 / 检索 / 图像复原 / 生成评估 / OCR 说明:不同论文/代码实现对细节(阈值、插值方式、忽略类、边界处理等)可能略有差异,使用前建议核对对应 benchmark 的官方实现。
算法狗2
2 小时前
人工智能
·
深度学习
·
机器学习
·
语言模型
·
面试题
大模型面试题:有以下哪些方式可以在 prompt 中插入指令?
我整理好的1000+面试题,请看 大模型面试题总结-CSDN博客 或者https://gitee.com/lilitom/ai_interview_questions/blob/master/README.md
Hcoco_me
3 小时前
人工智能
·
深度学习
·
算法
·
transformer
·
vllm
大模型面试题76:强化学习中on-policy和off-policy的区别是什么?
要搞懂这两个概念,咱们先记住一个核心区别:on-policy = 边用边学,学的策略和用的策略是同一个; off-policy = 学用分离,学的策略和用的策略不是同一个。
嘉嘉嘉717
3 小时前
python
·
深度学习
·
机器学习
【day 52】神经网络调参指南
@浙大疏锦行
renhongxia1
4 小时前
人工智能
·
深度学习
·
学习
·
机器学习
·
语言模型
·
自然语言处理
大型语言模型性能预测器:学习何时在混合人机-人工智能管理系统中升级
随着大语言模型日益融入人在回路的内容审核系统,核心挑战在于如何判断何时可以信赖其输出,又何时需要提请人工复审。
brent423
5 小时前
人工智能
·
深度学习
·
计算机视觉
DAY52 通道注意力(SE注意力)
目录1. 不同 CNN 层的特征图:从“看轮廓”到“理解语义”2. 什么是注意力:不仅是算法,更是“动物园”
Hcoco_me
5 小时前
人工智能
·
深度学习
·
算法
·
机器学习
·
chatgpt
·
机器人
大模型面试题74:在使用GRPO训练LLM时,训练数据有什么要求?
GRPO(群体相对策略优化)的核心是 “多答案对比选优”,训练数据的好坏直接决定模型能不能学会“挑出好答案”。咱们从小白能懂的基础要求,一步步讲到GRPO专属的进阶要求,保证深入浅出。
杀生丸学AI
6 小时前
人工智能
·
深度学习
·
3d
·
音视频
·
transformer
·
三维重建
【视频生成】HY-World 1.5:实时延迟和几何一致的交互式世界模型系统(腾讯混元)
标题:《HY-World 1.5: A Systematic Framework for Interactive World Modeling with Real-Time Latency and Geometric Consistency》 项目:https://3d.hunyuan.tencent.com/sceneTo3D 来源:腾讯
人工智能培训
6 小时前
人工智能
·
深度学习
·
机器学习
·
大模型
·
aigc
·
ai工程师证书
·
ai证书
AIGC技术与进展(2)
AIGC(人工智能生成内容)核心价值是通过文本、图像、音频、视频等多模态内容的自动化生成,实现降本增效、创意激发、个性化规模化交付,并推动产业模式与社会价值的双重升级,已成为企业数字化转型与内容生态重构的核心引擎。以下从核心价值维度、行业落地与社会价值展开说明。
电棍233
6 小时前
运维
·
深度学习
·
uv
AUTODL服务器环境配置和下载数据概述
1.pip install ,git clone,hugging face等等对于Pip install ,autodl默认添加了阿里云和清华源。
Coding茶水间
6 小时前
人工智能
·
深度学习
·
yolo
·
目标检测
·
机器学习
基于深度学习的交通事故检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
基于深度学习的交通事故检测系统演示与介绍目录视频演示1. 前言2. 项目演示2.1 用户登录界面2.2 新用户注册
传说故事
7 小时前
人工智能
·
深度学习
·
3d
【论文自动阅读】How Much 3D Do Video Foundation Models Encode?
本文通过设计一个轻量级的“探测器”模型,首次在不微调视频大模型的情况下,量化评估了它们内部到底蕴含了多少关于三维世界的理解能力。
囊中之锥.
7 小时前
人工智能
·
深度学习
·
神经网络
神经网络原理通俗讲解:结构、偏置、损失函数与梯度下降
提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 例如:第一章 Python 机器学习入门之pandas的使用
棒棒的皮皮
7 小时前
深度学习
·
yolo
·
目标检测
·
计算机视觉
·
目标跟踪
YOLO 拓展应用全解析(目标跟踪 / 实例分割 / 姿态估计 / 多目标检测)
YOLO 系列算法(以 v8/v11 为核心)的核心优势是实时性强、部署灵活,基于其基础检测架构,可快速拓展至目标跟踪、实例分割、姿态估计、多目标检测等复杂计算机视觉任务。本文从技术原理、模型架构、实操代码、适用场景四个维度,系统讲解 YOLO 的拓展能力,助力从单一检测到多任务融合的落地。
子午
7 小时前
人工智能
·
python
·
深度学习
【2026原创】眼底眼疾识别系统~Python+深度学习+人工智能+CNN卷积神经网络算法+图像识别
本项目是一款基于深度学习的眼疾智能识别Web项目,旨在为用户提供快速、准确的眼部疾病辅助诊断服务研究。系统采用Python Flask作为后端框架,结合TensorFlow深度学习框架,基于ResNet50预训练模型实现了对白内障、糖尿病视网膜病变、青光眼等常见眼疾的自动识别。用户只需上传眼部图像,系统即可在短时间内返回识别结果,包括疾病类型、置信度以及所有可能类别的预测概率。系统还集成了完善的用户认证机制,支持用户注册、登录功能,并记录所有识别历史,方便用户随时查询和管理。整个系统采用RESTful A
Ai尚研修-贾莲
8 小时前
人工智能
·
深度学习
·
机器学习
·
自然科学
·
时空建模
·
高维数据预处理
·
可解释ml/dl
自然科学领域机器学习与深度学习——高维数据预处理—可解释ML/DL—时空建模—不确定性量化-全程AI+Python场景
随着观测技术、数值模拟与计算基础设施的迅猛发展,地球系统科学、生态学、环境科学等自然科学领域正迈入“大数据+智能模型”驱动的新阶段。传统的统计建模方法虽具可解释性,却难以应对高维、非线性、多源异构的复杂自然系统;而以机器学习和深度学习为代表的AI技术,正为科学发现提供强大工具。更进一步,以大模型(Foundation Models) 为代表的新型人工智能范式,正在重塑数据密集型科研的边界,为遥感反演、气候模拟、污染物溯源等任务带来前所未有的泛化与迁移潜力。
赵域Phoenix
8 小时前
深度学习
·
机器学习
赵煜的时序建模学习手札——三种路线概览(统计学/机器学习/深度学习)
时序建模属实是一个令人困惑的抽象概念,因为它被不分场合的混用 (统计学、机器学习、深度学习),术语定义也较为模糊。