推荐序
我曾经试图找到一本既有理论深度、知识广度,又有技术细节、数学原理的关于深度学习的书籍,供自己学习,也推荐给我的学生学习。虽浏览文献无数,但一直没有心仪的目标。两周前,刘升容女士将她的译作《深度学习计算机视觉》初稿呈现给我,目的是要我从专业的角度对译文的严谨性把关。粗读一遍后,顿觉豁然开朗,油然生出得来全不费功夫之感。这大概就是我心心念念苦寻的那本书:该书对人工智能、机器学习、计算机视觉、机器视觉、神经网络、深度学习等基本概念及其相互关系阐述透彻,解决了初学者对一些相关概念的边界认识不清的问题;从各种神经网络架构到网络的训练、评估和调参,各种技术细节深入浅出,为读者运用深度学习方法解决不同领域的实际问题奠定了基础;对各种网络模型背后的数学原理的介绍直观而细致,使得读者可以不停留在抱着神经网络"黑匣子"调参的阶段,而是深入了解其背后的原理,进而有可能研发自己的架构;书中呈现的若干学习项目更是为读者通过实战提升技能创造了条件。
节选自上海大学通信与信息工程学院信息系刘学锋教授为《深度学习计算机视觉》作的推荐序
简介
计算机视觉有多先进?开一开特斯拉就知道了。深度学习技术已在人脸识别、交互式仿真和医学成像方面取得令人兴奋的突破,但最让人心潮澎湃的当属自动驾驶技术。如今,自动驾驶的汽车已经能在高速路上畅意驰骋并对各种复杂路况做出灵活反应了。 计算机如何"理解"它所"看到"的东西?本书试图将深度学习应用于计算机视觉以回答该问题。本书仅用高中代数知识阐明视觉直觉背后的概念。你将了解如何使用深度学习架构来构建视觉系统应用程序,以实现图像生成和人脸识别功能。
主要内容
●图像分类和目标检测
●先进的深度学习架构
●迁移学习与生成对抗网络
●DeepDream和神经风格迁移
●视觉嵌入和图像搜索