人工智能研究方向的科研小白,天崩开局?手把手教搭建神经网络训练工具准备
第一章 前言
1.1 研究背景
在当今科技迅猛发展的时代浪潮中,人工智能无疑已成为推动各领域变革与创新的核心驱动力。而神经网络,作为人工智能领域的基石与先锋,正以其独特的魅力与强大的效能,重塑着我们对世界的认知与交互方式。
近年来,生成式 AI 的爆发式增长成为科技领域最耀眼的现象之一。以Deep Seek为代表的大型语言模型,凭借其强大的自然语言处理能力,实现了与人类流畅、智能的对话交互,从文本创作、智能客服到知识问答,广泛应用于各个行业,为人们的工作与生活带来了前所未有的便利。图像生成领域,StableDiffusion 等模型能够根据简单的文本描述,创作出令人惊叹的高质量图像,激发了艺术创作的无限可能。这些生成式 AI 的卓越表现,背后离不开神经网络的有力支撑。神经网络通过对海量数据的深度挖掘与学习,掌握了语言、图像等信息的内在模式与规律,从而实现了精准的生成与创造。

1.2 研究意义
在当下,全国各大高校对计算机专业展现出了极高的热情,招生规模不断扩张,新的专业方向与课程设置也如雨后春笋般涌现。
太原理工大学在 2024 年,软件工程专业计划招生 1795 人,实际录取人数更是达到了 1871 人 。而在河南省,多所高校也在大规模扩招计算机专业学生。像河南师范大学,软件工程设置了.Net、Java 等六个方向,网络工程设置了数据安全等两个方向,每个方向计划招生 245 人,合计招生人数达 1960 人 ;河南工业大学,计算机大类设置七个方向,共计划招生 1956 人 ;郑州轻工业大学,软件工程、计算机科学与技术、网络工程等专业共计划招生 1830 人 。
这种现象背后有着多方面的原因。从市场需求角度来看,随着互联网、移动互联网行业的持续迅猛发展,社会对计算机专业人才的需求极为旺盛。新兴技术如人工智能、大数据、云计算等领域不断涌现新的风口,这些领域的发展离不开大量专业计算机人才的支撑。以人工智能为例,无论是智能语音识别、图像识别,还是智能机器人的研发,都需要专业的计算机人才编写复杂的算法、开发高效的软件系统。在这个数字化时代,各个行业都在加速数字化转型,传统行业如制造业、金融业、医疗行业等,也急需计算机专业人才来帮助其提升生产效率、优化业务流程、开发智能管理系统等 。计算机专业的就业前景广阔,薪资待遇普遍较高,这对学生和家长具有极大的吸引力。根据《2024 年中国本科生就业报告》,信息安全、软件工程等计算机类专业薪酬排名靠前 。
从高校自身发展层面分析,计算机类专业尤其是软件工程,开设成本相对较低。相较于一些需要大量实验设备、高昂科研经费投入的专业,如实验物理专业需要建设专门的实验室、聘请顶尖的科研人才,计算机专业仅需基本的机房设备、网络环境以及师资配备即可开展教学 。并且,软件工程专业的学费标准往往高于其他普通专业,如太原理工大学软件工程专业年学费 1.6 万元,而其法学、会计学等专业学费仅 5100 元一年 ;河南财经政法大学的软件工程学费更是飙到 1.75 万元 / 年,是普通专业的近四倍 。这对于高校来说,不仅能增加学费收入,还能提升学校整体的分数线与就业率,在高校排名等竞争中占据更有利的地位 。
在教育政策方面,国家大力倡导培养创新型、复合型人才,推动高等教育与产业需求紧密结合。计算机专业作为与产业发展联系紧密的学科,符合国家的教育发展战略方向,因此能够获得政策上的支持与鼓励,这也促使高校积极布局和扩招计算机专业 。
第二章 研究方法
本文的研究方法主要为通过阅读博客、查阅文献、观看教学视频等方法,自己实践探索。暂时无系统的、严谨的、理论的、学术的方法支撑。或简而言之实践调查法。
第三章 准备步骤
3.1 前期硬件检查
首先要了解自己的设备(通常来说是台式计算机或者笔记本,极少数使用裸机或者极简系统的服务器)、包括硬件和软件。硬件可以自己拆机查看各个组成部分的型号、版本等参数。也可以通过系统中的虚拟设备的方法来查看自己的设备硬件情况。例如,博主本机硬件(笔记本)配置如下:

硬件我们主要看处理器(CPU)、内存(RAM)、显卡(GPU)三个组成部分。首先处理器,当前主流Intel英特尔和AMD超威两大品牌CPU,Intel在原有酷睿i3、酷睿i5、酷睿i7、酷睿i9系列的基础上,又推出了酷睿U5、U7、U9处理器;AMD则有锐龙R3、锐龙R5、锐龙R7、锐龙R9等系列。CPU的主要性能指标包括主频(时钟频率)、字长、缓存容量和核心数与线程数,这些指标共同决定了CPU的运算速度和处理能力。其次内存,从商家的角度来说,主要包括金士顿、威刚、美商海盗船、芝奇、三星、海力士、英睿达(Crucial)、光威、宇瞻和金泰克等品牌。这里简单快速介绍一下几个品牌的内存。

3.1.1主流消费级品牌
金士顿(Kingston):全球知名存储品牌,产品覆盖内存条、固态硬盘等。
威刚(ADATA):提供高性能内存条,主打性价比和稳定性。
美商海盗船(Corsair):以电竞内存条著称,支持RGB灯效和超频。
芝奇(G.Skill):专注高频内存条,适合游戏和超频用户。
英睿达(Crucial):美光旗下品牌,预计2026年3月起将退出消费级市场。
3.1.2核心芯片与模组厂商
三星(Samsung):全球领先的DRAM芯片制造商,也生产零售内存条。
海力士(SK Hynix):另一大DRAM芯片巨头,内存条产品覆盖消费级和企业级。
光威(Gloway):国产存储品牌,主打高性价比内存条。
宇瞻(Apacer):提供稳定可靠的内存条,兼容多种平台。
金泰克(Kimtigo):国产厂商,产品以耐用性和兼容性见长。
最后,最重要的是GPU,显卡(GPU即图形处理器)作为计算领域的核心部件,其算力性能直接决定了诸多应用场景的效率和效果。从深度学习、科学计算到视频处理,GPU的算力已成为衡量技术实力的重要指标。当前市场上GPU算力领先的厂商主要包括英伟达(NVIDIA)、AMD、英特尔(Intel)、国产GPU(华为、景嘉微、壁仞科技等),接下来将简单分析各自的优势与特点。

3.1.3英伟达(NVIDIA)
英伟达是全球GPU市场的绝对领导者,其市场占有率高达87%。英伟达以其强大的CUDA编程环境和GPU计算平台著称,产品线横跨个人游戏、高性能计算和数据中心等多个领域。A100、H100系列GPU以其卓越的FP32单双精度浮点性能及AI运算能力,在AI训练和高性能计算领域独占鳌头。英伟达不断推动技术创新,以应对日益增长的计算需求。其新一代Blackwell GPU架构通过高带宽内存、Chiplet先进封装和片内互联等技术的创新组合,旨在提升系统级性能和能效。英伟达还强调数据中心作为AI工厂的概念,通过多GPU组合形成"巨型GPU",以更低的成本和能耗完成复杂计算任务。

3.1.4AMD
AMD作为英伟达的主要竞争对手,在GPU市场同样占据重要地位。其Radeon系列GPU在游戏市场与英伟达分庭抗礼,同时在数据中心领域推出Instinct系列加速卡,以卓越的计算力和能效比,领跑AI训练和推理领域。AMD不断加大在云原生GPU算力市场的布局,与云服务提供商合作推出基于AMD GPU的云原生解决方案,为用户提供高性能和低延迟的计算服务。AMD还致力于提升GPU的并行处理能力和能效比,以满足日益增长的AI和科学计算需求
3.1.5国产GPU
在全球GPU市场,国产GPU厂商正迅速崛起,展现出强劲的发展势头。华为、景嘉微、壁仞科技等企业通过自主研发和技术创新,不断缩小与国际巨头的差距。华为的GPU采用自家架构,并在高端处理器中集成多个GPU核心,提高并行处理能力,同时支持业界标准的图形API,确保广泛兼容性。国家政策与市场需求双重助力下,国产GPU产业迎来前所未有的发展机遇。国内企业在GPU设计、制造和封装等环节均取得显著进步,逐步建立起完整的产业链。未来,随着技术的不断突破和市场需求的持续增长,国产GPU有望在特定领域树立竞争优势,实现更大规模的市场应用。
3.1.6硬件要求
首先处理器,高校学习、实验要求相对来说要求较低,Intel:Core i7/i9系列(如i7-12700K以上)。AMD:Ryzen 7/9系列(如Ryzen 7 5800X以上)。这些型号平衡了核心数、主频和性价比,能满足大多数入门及中级需求,适合个人学习或小规模项目。Intel Xeon Scalable(如Sapphire Rapids架构)。AMD EPYC(如Genoa架构)。这类CPU提供超多核心、大内存支持和企业级可靠性,但成本较高,适合企业级或大规模训练。CPU主要是负责数据预处理、模型加载等任务,尽量选择多核心、高主频的型号,对于单卡工作站,Intel的i5级别的CPU通常已足够;若使用双卡或多卡,建议选择i9或同级别的CPU以避免成为瓶颈。严格意义上来说,尽管CPU能处理一些深度学习简单学习示例,但不建议使用CPU跑深度学习相关实验或者项目。
其次,最差内存大小建议不低于4GB。内存主要用于存储正在运行的程序和数据。深度学习任务,特别是生成式AI,对内存容量要求很高。有条件至少16GB,但32GB或64GB是更稳妥的选择,可以流畅处理更大规模的数据集和模型。
最后显卡,强烈推荐NVIDIA ,最差建议不低于NVIDIA GeForce RTX 920MX,显存不低于2GB。GPU是深度学习的算力核心,负责并行计算。英伟达(NVIDIA)的GPU通过CUDA和cuDNN库获得最佳支持。有条件的建议起步NVIDIA GeForce RTX 3060(显存8GB/12GB)或TITAN RTX(显存24GB)能满足基础训练和推理需求。后续我们将在处理器为英特尔 第十三代酷睿 i7-13650HX 十四核;内存为16GB DDR5 4800MHz;显卡为NVIDIA GeForce RTX 5060 Laptop GPU(8GB/华硕)且包含其他硬件的笔记本上实践深度学习案例。(如果各位开发者为其他硬件配置,如有同学的电脑是AMD的显卡、有的同学仅仅具有CPU条件、有的同学使用的是苹果笔记本(Mac)使用M系列芯片、有的同学的有显卡配置但低于RTX 920MX或者显存不足等。那么该博文则仅仅具有参考价值,但无论是什么硬件条件,深度学习搭建的原理思维流程基本不变,大家可以查阅其他博文进行尝试实现)。
3.2 操作系统
当前电脑主流操作系统主要包括Windows、macOS、Linux和华为鸿蒙系统(HUAWEI HarmonyOS)四大类。
3.2.1 Windows操作系统
由微软公司开发,是全球市场份额最高的桌面操作系统,广泛应用于个人电脑和企业办公。最新版本为 Windows 11,提供现代化界面、高效任务管理和广泛软件兼容性。主要有以下版本:
Windows 1.0至Windows 3.1:这些早期版本主要提供了基本的图形用户界面和多任务处理能力。它们为后续的Windows系统奠定了基础,并逐渐在市场上获得了用户的认可。
Windows 95:该版本引入了全新的图形化用户界面和即插即用技术,使得硬件设备的安装和配置变得更加简单。此外,它还支持长文件名和32位应用程序等特性。
Windows 98:该版本在Windows 95的基础上进行了优化和改进,提供了更好的稳定性和兼容性。它还增加了对USB设备的支持以及Internet Explorer浏览器等实用功能。
Windows ME:该版本是Windows 9x系列的最后一个版本,主要面向家庭用户。它提供了许多新的多媒体功能和家庭网络支持,但由于存在一些兼容性问题,其市场接受度并不高。
Windows 2000/XP:这些版本主要面向企业和个人用户。它们提供了更高的安全性和稳定性,并支持更多的硬件设备和应用程序。特别是Windows XP,它成为了微软历史上最受欢迎的操作系统之一。
Windows Vista:该版本引入了许多新的功能和安全性改进,如UAC、防火墙等。但由于存在一些兼容性问题和性能问题,其市场接受度并不高。
Windows 7:该版本在稳定性、兼容性和性能方面都得到了显著提升。它结合了Windows Vista的许多新功能和Windows XP的经典元素,成为了一款备受欢迎的操作系统。
Windows 8/8.1:这些版本采用了全新的用户界面和交互方式,特别是Windows 8,它引入了开始屏幕和Charm边栏等特性。然而,这些变化也引发了一些用户的争议和不满。随后推出的Windows 8.1对一些问题进行了修复和改进。
Windows 10 :该版本结合了Windows 7的经典元素和Windows 8的现代元素,成为了一款功能强大、易于使用的操作系统。它提供了许多新的功能和改进,如Cortana语音助手、Edge浏览器、虚拟桌面等。此外,Windows 10还支持跨平台同步和云服务等特性。
Windows 11 :作为Windows 10的继任者,Windows 11在界面设计、性能优化、安全性等方面都进行了全面升级。它采用了全新的用户界面和交互方式,提供了更好的视觉体验和操作便利性。此外,Windows 11还支持更多的硬件设备和应用程序,并加强了与微软其他产品和服务的集成。

3.2.2 macOS
macOS是由苹果公司开发的图形化操作系统,作为首个在商用领域成功的图形用户界面系统,专为Macintosh系列电脑设计,采用XNU混合内核架构并继承UNIX系统特性。该系统基于BSD Unix实现内存管理与多任务处理,原生支持命令行模式并通过兼容层运行旧版应用程序,一般情况下无法在普通PC上安装。凭借封闭生态与差异化架构,macOS较少受到病毒攻击,且逐步向ARM架构过渡。macOS主要经历了以下三个时期。
经典Mac OS时期(1984-2001):开创图形界面先河,1984年System 1首次采用桌面、窗口、图标设计。系统架构演进,逐步引入多任务处理(System 5)、彩色界面(System 7)。技术瓶颈期,面临内存保护和多用户功能缺失的挑战。
OS X革新纪元(2001-2016):2001年OS X 10.0 Cheetah,基于NeXTSTEP重构内核,引入Aqua界面。重大版本迭代,Tiger(2005)Spotlight搜索、Dashboard、Snow Leopard(2009)全面64位化、Mavericks(2013)免费升级模式开启。
macOS新时代(2016至今):2016年更名macOS,开启与iOS深度整合。里程碑更新,Catalina(2019):移除32位应用支持、Big Sur(2020):Apple Silicon芯片过渡、Monterey(2021):Universal Control跨设备协同、Ventura(2022):台前调度生产力革新。

3.2.3 Linux
Linux,一般指GNU/Linux(单独的Linux内核并不可直接使用,一般搭配GNU套件,故得此称呼),是一种免费使用和自由传播的类UNIX操作系统,其内核由林纳斯·本纳第克特·托瓦兹(Linus Benedict Torvalds)于1991年10月5日首次发布,它主要受到Minix和Unix思想的启发,是一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。它支持32位和64位硬件,能运行主要的Unix工具软件、应用程序和网络协议。
Linux继承了Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。Linux有上百种不同的发行版,如基于社区开发的Debian、Arch Linux,和基于商业开发的Red Hat Enterprise Linux、SUSE、Oracle Linux等。由于Linux发展历史较长且基本国内高校学习使用很少,这里仅仅介绍一下2023年之后的一些版本信息,更多详细资料希望读者自行查阅。
2023年1月9日消息,Linus Torvalds 推出了 Linux Kernel 6.2 的第 3 个候选版本更新。
2023年3月27日消息,Linus Torvalds 发布了 Linux Kernel 6.3 的第 4 个维护版本更新,这意味着 6.3 的开发周期已经走过了一半路程。
2023年5月3日,IT之家消息:Uri Herrera于4月底发布了 Nitrux 2.8 系统,这是基于 Debian 和 systemd-free 的 GNU / Linux 发行版,重点是 KDE 软件和 Plasma 桌面。
2023年5月29日,MX Linux 开发人员宣布,MX Linux 23"Libretto"版本 Beta 版公开测试已全面推出。
2023年6月26日,Linux 6.4 内核已正式发布,这次更新带来了许多改进,比如对苹果 M2 芯片的初步支持、存储性能的提升、传感器监控的改善,以及更多的 Rust 代码。
2024年2月3日消息,开源社区"Linux 中国"官方公众号发文宣布,该社区主网、公众号、视频号及下属的《硬核观察》栏目将无限期停止更新、运营。
2024年5月,Linux 6.9 内核的首个正式版发布,6.10 版本合并窗口开启。
2024年8月15日,深度社区正式对外发布开源操作系统deepin 23,deepin 23搭载Linux 6.6 LTS内核,从仓库到应用层,针对操作系统核心组件,采用了自研方案;8月,deepin 23的 WPS Office For Linux 个人版上线deepin应用商店。

3.2.4 HUAWEI HarmonyOS
HUAWEI HarmonyOS是华为技术有限公司自主研发的面向全场景的分布式操作系统,于2019年8月9日正式发布。该系统基于微内核架构设计,支持模块化弹性部署,可实现手机、电脑、智能家居、车载设备等多终端无缝协同,具备"一次开发、多端部署"的核心特性。截至2025年6月,鸿蒙生态设备总量超11.9亿台,覆盖智能手机、平板、PC等1200余类产品,吸引720万开发者,上架应用及元服务超2.5万个。
鸿蒙系统历经多次重大迭代:2020年发布的HarmonyOS 2.0实现分布式能力全面升级;2022年HarmonyOS 3进一步优化跨设备体验;2023年HarmonyOS 4强化交互设计与系统安全;2024年推出的原生鸿蒙星河版及HarmonyOS NEXT 5.0标志着全栈自研技术的突破。2025年鸿蒙电脑操作系统的发布,成为国产系统在PC领域的重要里程碑。目前,鸿蒙已形成包含开源鸿蒙(OpenHarmony)与商业版本的双生态体系,稳居全球第三大移动操作系统,正向万物智联时代持续拓展生态边界。由于目前华为鸿蒙生态系统使用的开发者较少且电脑操作系统尚不成熟,我们也简单介绍一下当前该系统的一些情况。
2025年5月8日,鸿蒙电脑技术与生态沟通会上,首款鸿蒙电脑正式亮相,而华为智慧办公将升级为鸿蒙办公。在鸿蒙电脑应用适配方面 ,头部150个应用已经启动开发,预计到年底将支持超过2000个应用。 鸿蒙电脑将在5月19日正式发布。业内人士称,鸿蒙电脑从内核开始重构操作系统,标志着中国在电脑操作系统领域迈出了关键一步,其不仅以系统级AI能力、分布式协同体验与全场景安全防护为技术亮点,更通过生态融合与产业协同,为电脑操作系统生态的繁荣发展注入新动能。 5月30日消息,鸿蒙版微博上线用户直播开播功能,并宣布微博智搜频道、群聊优化、"我的"页面完善、UI性能提升等五项功能更新,成为首批支持直播开播的鸿蒙应用。
2025年10月17日,华为终端官宣,于10月22日发布鸿蒙操作系统6。
2025年11月25日,鸿蒙5和鸿蒙6终端设备数突破2700万,应用市场可搜索应用及元服务突破30万。

3.2.5系统软件要求
当前电脑四大主流操作系统Windows、macOS、Linux和华为鸿蒙系统(HUAWEI HarmonyOS)都可以实践深度学习深层神经网络实验或项目。但建议相关系统均使用近3年新版本,例如Windows 10、Windows 11 。不建议使用Windows 7、Windows XP等老旧版本的操作系统。后续我们将在操作系统为64位Windows 11 家庭中文版且包含其他系统软件的笔记本上实践深度学习案例。
3.3 开发软件和相关工具介绍
对于大多数计算机科学与技术、数据科学与大数据技术、人工智能等其他相关专业的大学生来说,开发软件和开发工具是一定不会陌生。这里我们选择的使用Anaconda软件来进行开发环境的维护和管理;选择PyCharm软件来进行代码的编写和相关实验或项目的管理;选择的开发语言是Python;搭建神经网络的框架我们选择Pytorch;最后,我们还要使用CUDNN来进行基于CUDA平台优化神经网络核心计算,进而提升网络模型训练和推理效率(需要注意的是一般来说电脑配有NVIDIA的显卡相应的驱动程序通常也下载好了,如果没有的话我们也会简要介绍一下该部分驱动程序)。接下来我们将简要介绍一下上述选择的开发软件和相关工具。
3.3.1Anaconda
Anaconda是由Continuum Analytics开发的Python发行版本,2012年6月发布,支持Windows、macOS和Linux系统。该发行版集成conda包管理器及Python编程语言,提供包含180多个科学计算包的完整环境,其轻量级替代版本Miniconda仅包含python和conda基础组件。Anaconda通过conda实现包管理与虚拟环境隔离,支持多版本Python环境创建及切换,包含NumPy、Pandas、Matplotlib等数据科学工具。用户可通过修改.condarc配置文件实现清华镜像源加速,镜像站默认渠道涵盖main、r、msys2等仓库 。2023年发布的Anaconda Distribution 2023.07版本更新595个软件包,基础环境采用Python 3.11,内置Holoviz生态系统工具与优化后的conda 23.5.0组件。
这里简单描述一下Anaconda 基础操作。
1、查询 conda 版本
bash
conda --version
2、更新 conda
bash
conda update conda
3、查看conda环境详细信息
bash
conda info
4、查看当前有哪些虚拟环境
bash
conda env list
或者
bash
conda info --envs
5、创建一个新的虚拟环境
bash
conda create --name jupyter_venv python=3.10
其中,通过 -n或--name 来自定义的环境名称,如:jupyter_venv;同时,指定Python的版本。
6、激活虚拟环境
bash
conda activate jupyter_venv
7、退出当前虚拟环境
bash
conda deactivate
8、移除某个虚拟环境
bash
conda remove -n your_env_name --all
其中,-n与--name等价,表示虚拟环境名。
9、复制某个虚拟环境
bash
conda create --name new_env_name --clone old_env_name
10、复制某个虚拟环境
一个分享环境的快速方法就是给他一个你的环境的.yml文件。首先激活要分享的环境,在当前工作目录下生成一个environment.yml文件。
bash
conda env export > environment.yml
对方拿到environment.yml文件后,将该文件放在工作目录下,可以通过以下命令从该文件创建环境即可。
bash
conda env create -f environment.yml
11、安装包
bash
conda install [package]
如:conda install numpy,如果要指定安装版本的包则通过以下命令即可。
bash
conda install xlrd=1.2.0
注意是单等于号。或者通过pip命令也可。
bash
pip install xlrd==1.2.0
注意是双等于号。
如果需要批量安装,例如安装requirements.txt 文件中包含的组件依赖则通过以下命令即可。
bash
conda install --yes --file requirements.txt
12、删除当前环境中的某个包
bash
conda remove [package]
注意:这里并非conda uninstall,只有在pip指令下才有pip uninstal。
13、升级当前环境中的某个包
bash
conda update [package]
如果需要升级所有包,则执行以下命令。
bash
conda update --all
14、搜索某个包
bash
conda search [package]
14、快速统一删除不用的安装包
Conda安装的包都在目录Anaconda/pkgs下。随着使用,conda 安装的包也越来越多;有些包安装之后,从来没有使用过;有些安装包的tar包也保留在了计算机中;由于依赖或者环境等原因,也有些包的不同版本重复安装。这些情况使得Anaconda显得更加冗余,并且浪费储存;对于这些情况可以使用conda clean如下指令来清理Anaconda相关安装包。
bash
conda clean -p
或者
bash
conda clean --packages
使用conda clean如下指令来删除tar包。
bash
conda clean -t
或者
bash
conda clean --tarballs
使用conda clean如下指令来清除索引缓存,前提是镜像站提供的索引。
bash
conda clean -i
使用conda clean如下指令来删除所有的安装包及cache。
bash
conda clean -y --all
15、镜像源相关基本操作
查看镜像源指令如下。
bash
conda config --show channels
添加镜像源指令如下,如添加清华源。
bash
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
配置安装包时显示安装来源,通过下面的设置表示从channel中安装包时显示channel的url,这样就可以知道包的安装来源了。
bash
conda config --set show_channel_urls yes
切换回默认源指令如下。
bash
conda config --remove-key channels
移除某个镜像源指令如下,如移除清华源。
bash
conda config --remove channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
临时指定安装某个包使用的镜像源的指令如下。
bash
pip install [package] -i https://pypi.tuna.tsinghua.edu.cn/simple/
或者
bash
pip install [package] -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
3.3.2 PyCharm
PyCharm是一种Python IDE(Integrated Development Environment,集成开发环境),带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、项目管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发。PyCharm 提供免费版本(社区版),但专业版需付费。 社区版(Community Edition)永久免费,支持基础Python开发,适合个人学习和小型项目。专业版(Professional Edition)需付费购买,所有用户可免费试用专业版一个月,试用期后需购买。提供Web开发、数据库工具等高级功能。学生和教师可通过JetBrains Student Pack申请免费使用专业版。这里不过多介绍这个开发软件,简单介绍一下该软件的快捷键。
1、重新格式化代码
Ctrl + Alt + L(自动调整代码缩进、空格等)。
2、多行代码合并为一行
选中代码后按 Ctrl + Shift + J。
3、快速注释/取消注释
选中代码后按 Ctrl + /(行注释)或 Ctrl + Shift + /(块注释)。
4、包装代码
选中代码后按 Ctrl + Alt + T,可快速添加 if、try 等结构。
5、复制当前行
Ctrl + D。
6、撤回操作
Ctrl + Z。
7、全局搜索
双击 Shift 或按 Ctrl + Shift + F(跨文件搜索)。
8、查找类引用
按 Ctrl + N 输入类名,查看引用位置。
8、跳转到错误
按 F2 直接定位报错代码。
9、文件间切换
Ctrl + Tab 在打开的文件间跳转。
10、运行程序
Shift + F10。
11、调试程序
Shift + F9。
12、调试程序
查看断点:Ctrl + Shift + F8。
3.3.3Python
Python以其简洁的语法、易读性和可扩展性而闻名。支持多种编程 范式,包含了用于网络编程、数据库交互、文本处理、数学计算等多个方面的功能。自20世纪90年代初Python语言诞生至今,它已被逐渐广泛应用于系统管理任务的处理和Web编程。Python 是一种解释型、面向对象、动态数据类型的高级程序设计语言。这里简单介绍一下Python的发展历史,读者需要自行学会Python语言的核心用法。
1995年,Guido van Rossum在弗吉尼亚州的国家创新研究公司(CNRI)继续他在Python上的工作,并在那里发布了该软件的多个版本。
2000年5月,Guido van Rossum和Python核心开发团队转到BeOpen.com并组建了BeOpen PythonLabs团队。同年十月,BeOpen PythonLabs团队转到Digital Creations(现为Zope Corporation)。
2001年,Python软件基金会(PSF)成立,这是一个专为拥有Python相关知识产权而创建的非营利组织。Zope Corporation是PSF的赞助成员。
Python的创始人为荷兰人吉多·范罗苏姆(Guido van Rossum)。1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,作为ABC语言的一种继承。之所以选中单词Python(意为大蟒蛇)作为该编程语言的名字,是因为英国20世纪70年代首播的电视喜剧《蒙提·派森的飞行马戏团》(Monty Python's Flying Circus)。官方宣布,2020 年 1 月 1 日, 停止 Python 2 的更新。Python 2.7 被确定为最后一个 Python 2.x 版本。因此,我们在后续的内容讨论以及应用均是Python3.x的版本。

Python 3.x 版本的主要语法和基础知识教程和详细使用教程请读者参考官方文档。或者阅读博客自行学习,要求能够看懂Python代码以及会使用基本语法。学习跳转https://www.runoob.com/python3/python3-tutorial.html
3.3.4Pytorch
PyTorch是一个用于机器学习和深度学习的开源深度学习框架,由Facebook于2016年发布,其主要实现了自动微分功能,并引入动态计算图使模型建立更加灵活。Pytorch可分为前后端两个部分,前端是与用户直接交互的python API,后端是框架内部实现的部分,包括Autograd,它是一个自动微分引擎。
Pytorch基于已有的张量库Torch开发,在PyTorch的早期版本中,使用的是Torch7,后来随着PyTorch的发展,逐渐演变成了PyTorch所使用的张量库。
现如今,Pytorch已经成为开源机器学习系统中,在科研领域市场占有率最高的框架,其在AI顶会上的占比在2022年已达80% 。这里简单介绍一下PyTorch的发展历史,读者需要自行学会PyTorch框架的基本用法。
PyTorch,作为Torch的继承者,以其卓越的灵活性和对动态图的支持而闻名。它提供了一个以Python为核心的前端接口,使得深度学习模型的构建和训练更加便捷。PyTorch的诞生,可以追溯到2016年9月,由Adam Paszke、Sam Gross和Soumith Chintala等人共同开发出这一框架的初始版本。
紧接着在2017年1月,Facebook的人工智能研究院(FAIR)向世界推出了PyTorch。这个基于Torch的框架,以其Python语言作为前端,同时为深度学习研究者和开发者提供了两大核心优势:一是强大的GPU加速张量计算能力,其并行计算能力在当时与NumPy相媲美;二是内置的自动微分系统,使得构建深度神经网络变得更加直观和高效。
2018年10月,在NeurIPS 2018会议上,Facebook宣布了PyTorch 1.0的发布。这个版本的推出,标志着PyTorch在商业化进程中取得了重要进展。
随后在2022年9月,Facebook的创始人马克·扎克伯格宣布成立了PyTorch基金会 ,并将该基金会纳入Linux基金会的管理之下。这一决定有助于加强PyTorch在开源社区中的影响力,并为其未来的持续发展提供了支持。
PyTorch 以其灵活性和易用性而闻名,特别适合于深度学习研究和开发。读者可以自行进行网上相关课程学习,整个周期相对较长,且要求读者具有一定数理知识。以浅层神经网络为例,官网学习请跳转:
https://docs.pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html
其他学习资源:
https://www.runoob.com/pytorch/pytorch-neural-network.html

3.3.5CUDNN
CUDNN(CUDA Deep Neural Network Library)是 NVIDIA 开发的 GPU 加速库,专用于优化深度神经网络(DNN)的计算任务,如卷积、池化和归一化操作,显著提升训练和推理效率。深度神经网络
深度学习神经网络广泛应用于计算机视觉、对话式 AI 以及推荐系统,并推动了诸如智能驾驶与智能语音助手等突破性进展。NVIDIA 的 GPU 加速深度学习框架显著缩短了这些技术的训练时间,将数天的训练过程缩短到数小时。 CUDNN 为云端、嵌入式设备和智能驾驶汽车中的深度神经网络提供高性能、低延迟的推理基础库。它在深度学习领域体现主要特性有:
(1)加速 attention 训练/预填、卷积和矩阵乘法(matmul)等计算密集型操作
(2)优化如 attention 解码、池化、softmax、归一化、激活、逐点操作、张量变换等内存密集型操作
(3)支持计算密集型与内存密集型操作的融合
(4)提供运行时融合引擎,可为常见融合模式在运行时生成内核
(5)针对如融合 attention 等重要专用模式进行优化
另外CUDNN Graph API 设计用于表达深度学习中的常见计算模式。CUDNN 图将操作表示为节点、张量表示为边,这与典型深度学习框架中的数据流图类似。cuDNN 加速了广泛使用的深度学习框架,包括 PyTorch、JAX、Caffe2、Chainer、Keras、MATLAB、MxNet、PaddlePaddle 和 TensorFlow。
3.3.6英伟达显卡驱动程序
NVIDIA显卡驱动程序是管理NVIDIA GPU硬件与操作系统交互的核心软件,确保显卡正常运行并支持图形处理、游戏和创意应用。
驱动程序通常分为两种类型:Game Ready驱动针对新游戏发布进行优化,提升性能和稳定性;Studio驱动则为创意软件(如视频编辑或3D渲染工具)提供稳定性与兼容性增强。
驱动程序更新是保持显卡最佳状态的关键。 NVIDIA定期发布新版本以修复已知问题、提升性能或添加新功能,例如2025年12月发布的591.67和591.59版驱动修复了显示条纹、颜色错误及游戏兼容性问题。更新可通过NVIDIA官方网站或NVIDIA App自动完成,建议用户保持驱动程序最新以获得最佳体验。通常来说买了相关笔记本或者台式机含有NVIDIA显卡的电脑开机自带英伟达显卡驱动程序。如果没有可以自行前往官网下载安装。这里仅做简单介绍。
3.4 硬件的获取和软件的下载安装
回顾3.1小节的内容,本文将在处理器为英特尔 第十三代酷睿 i7-13650HX 十四核;内存为16GB DDR5 4800MHz;显卡为NVIDIA GeForce RTX 5060 Laptop GPU(8GB/华硕)且包含其他硬件的笔记本上实践深度学习案例。 这些硬件条件通常购买笔记本电脑或者台式机电脑就可以完成。那么操作系统本文选择的是Windows 11 通常来说这些我们默认读者均已经达到这样的前提条件。如果和上述前提条件不一样的,还请读者结合自身的情况进行选择和判断。整体来说,即使不同的硬件配置和软件系统条件稍有差异,但搭建自己的神经网络的基本原理和思路基本可以借鉴参考。接下来我们将会3.3小节介绍的开发软件和工具的下载和安装进行详细说明。(注意部分软件的下载和安装也是参考了同行的博客借鉴修改)
3.4.1英伟达显卡驱动程序的下载安装
1、检查并确认自己电脑显卡版本型号
步骤:此电脑右击-->管理-->设备管理器-->显示适配器 (图中显示NVIDIA GeForce RTX 5060 Laptop GPU )
操作如下图所示。


2、下载和自己硬件版本一致的英伟达显卡驱动程序
步骤:
(1)点击下载地址https://www.nvidia.cn/drivers/lookup/
(2)选择驱动(NVIDIA GeForce RTX 5060 Laptop GPU和Windows 11以及中文语言)
(3)选择NVIDIA Studio 驱动
(4)选择NVIDIA Studio 驱动的版本
(5)下载
(6)安装(过于简单不做图分析,双击运行下载好的文件,默认选择,一直下一步即可或者参考安装链接)
操作如下图所示。



3、校验安装是否完成以及核对版本信息
(1)按(win+r),输入cmd,点击确认(会出现命令窗口)

(2)命令窗口输入以下命令,得到如下图类似的结果即可。
python
nvidia-smi

(未完待续,持续编写中)
参考文献
1\]https://www.zhihu.com/tardis/bd/art/375543784 \[2\]https://www.zhihu.com/tardis/bd/art/375543784 \[3\]https://baijiahao.baidu.com/s?id=1806058925915423833\&wfr=spider\&for=pc \[4\]https://blog.csdn.net/z1134145881/article/details/147546680#22_macOS__11 \[5\]https://blog.csdn.net/2301_79455190/article/details/145919741 \[6\]https://www.caihongoffice.com/softs/python.html?ver=gjc-1\&bd_vid=10978249457426723907 \[7\]https://www.runoob.com/python3/python3-tutorial.html \[8\]https://www.runoob.com/pytorch/pytorch-neural-network.html \[9\]https://www.runoob.com/python3/python3-tutorial.html \[10\]https://blog.csdn.net/m0_73409404/article/details/130729867?ops_request_misc=elastic_search_misc\&request_id=8efd237bd59f5dc3567eb08261c79b1e\&biz_id=0\&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive\~default-1-130729867-null-null.142^v102^pc_search_result_base9\&utm_term=%E8%8B%B1%E4%BC%9F%E8%BE%BE%E9%A9%B1%E5%8A%A8%E5%AE%89%E8%A3%85\&spm=1018.2226.3001.4187