既有理论深度又有技术细节——深度学习计算机视觉

推荐序

我曾经试图找到一本既有理论深度、知识广度,又有技术细节、数学原理的关于深度学习的书籍,供自己学习,也推荐给我的学生学习。虽浏览文献无数,但一直没有心仪的目标。两周前,刘升容女士将她的译作《深度学习计算机视觉》初稿呈现给我,目的是要我从专业的角度对译文的严谨性把关。粗读一遍后,顿觉豁然开朗,油然生出得来全不费功夫之感。这大概就是我心心念念苦寻的那本书:该书对人工智能、机器学习、计算机视觉、机器视觉、神经网络、深度学习等基本概念及其相互关系阐述透彻,解决了初学者对一些相关概念的边界认识不清的问题;从各种神经网络架构到网络的训练、评估和调参,各种技术细节深入浅出,为读者运用深度学习方法解决不同领域的实际问题奠定了基础;对各种网络模型背后的数学原理的介绍直观而细致,使得读者可以不停留在抱着神经网络"黑匣子"调参的阶段,而是深入了解其背后的原理,进而有可能研发自己的架构;书中呈现的若干学习项目更是为读者通过实战提升技能创造了条件。

节选自上海大学通信与信息工程学院信息系刘学锋教授为《深度学习计算机视觉》作的推荐序

简介

计算机视觉有多先进?开一开特斯拉就知道了。深度学习技术已在人脸识别、交互式仿真和医学成像方面取得令人兴奋的突破,但最让人心潮澎湃的当属自动驾驶技术。如今,自动驾驶的汽车已经能在高速路上畅意驰骋并对各种复杂路况做出灵活反应了。 计算机如何"理解"它所"看到"的东西?本书试图将深度学习应用于计算机视觉以回答该问题。本书仅用高中代数知识阐明视觉直觉背后的概念。你将了解如何使用深度学习架构来构建视觉系统应用程序,以实现图像生成和人脸识别功能。

主要内容

●图像分类和目标检测

●先进的深度学习架构

●迁移学习与生成对抗网络

●DeepDream和神经风格迁移

●视觉嵌入和图像搜索

相关推荐
MF_AI11 分钟前
苹果病害检测识别数据集:1w+图像,5类,yolo标注
图像处理·人工智能·深度学习·yolo·计算机视觉
美狐美颜sdk2 小时前
Android直播美颜SDK:选择指南与开发方案
android·人工智能·计算机视觉·第三方美颜sdk·视频美颜sdk·人脸美型sdk
sali-tec2 小时前
C# 基于OpenCv的视觉工作流-章7-膨胀
图像处理·人工智能·opencv·算法·计算机视觉
努力犯错2 小时前
LTX-2 进阶 Prompt 技巧:从入门到专业视频创作
人工智能·数码相机·机器学习·计算机视觉·开源·prompt·音视频
杜子不疼.4 小时前
计算机视觉热门模型手册:Spring Boot 3.2 自动装配新机制:@AutoConfiguration 使用指南
人工智能·spring boot·计算机视觉
格林威15 小时前
传送带上运动模糊图像复原:提升动态成像清晰度的 6 个核心方案,附 OpenCV+Halcon 实战代码!
人工智能·opencv·机器学习·计算机视觉·ai·halcon·工业相机
棒棒的皮皮15 小时前
【深度学习】YOLO模型速度优化Checklist
人工智能·深度学习·yolo·计算机视觉
JQLvopkk17 小时前
智能AI“学习功能”在程序开发部分的逻辑
人工智能·机器学习·计算机视觉
狗狗学不会19 小时前
视觉检测的新范式:从“像素感知”到“时序语义推理”—— 基于 Qwen3-VL 与时序拼图策略的通用事件检测系统
人工智能·计算机视觉·视觉检测
scott19851220 小时前
DIFIX3D+: Improving 3D Reconstructions with Single-Step Diffusion Models
人工智能·计算机视觉·扩散模型·生成式