先说结论,可能有点得罪人:如果你现在还把西瓜书和花书当作从头啃到尾的入门主线教材,那你多半是走上了一条最正直、也最崎岖的弯路。
如果你是新手入门,我不推荐你把《西瓜书》和《花书》作为你的第一本主线学习教材。
别误会,我不是说这两本书不好,封神自然有封神的道理。周志华老师的《西瓜书》构建了非常完备的机器学习知识体系,我书架上现在还插着一本,时不时翻翻找找灵感。Goodfellow的《花书》在深度学习刚起飞的年代,那绝对是圣经一样的存在。
这两本书能封神,很大程度上是都吃到了各自时代的巨大红利 ,在那个深度学习野蛮生长,框架还不好用,大家普遍需要手搓反向传播、理解各种数学细节的年代,它们是市面上最系统、最权威的读物。它们教你如何从一块块砖,也就是数学原理开始,盖起一栋大楼,也就是模型。但技术迭代太快了,尤其是深度学习。更重要的是,它们的写法和定位,对于一个刚入门、希望能尽快动手实践的人来说,可能不是最平滑的学习曲线。
现在是2025年了。你打开电脑,PyTorch、TensorFlow这些框架已经把盖楼的活儿给干了,甚至连精装修都帮你搞得差不多了。更别提Hugging Face这种地方,直接把全世界最顶尖的预训练模型(比如各种版本的BERT、GPT、Stable Diffusion)做成了标准化的"模块",你拿过来稍微改改就能用。
现在学习的重点,已经从"如何从零实现一个反向传播 "变成了"如何快速利用现有工具解决一个实际问题,并深刻理解其原理和局限性"。
-
西瓜书:更像一本字典或者综述。公式推导非常精炼,如果你数学功底不够扎实,或者没有老师带着,很容易就卡住,然后从入门到放弃。它告诉你"是什么",但"怎么用代码实现"这块是缺失的。
-
花书:试图把所有东西都塞给你。从应用数学、机器学习基础,再到深度学习模型和前沿,体系太庞大了。新手一头扎进去,很容易迷失在各种数学细节里,还没摸到模型,热情先被劝退了。
你现在一头扎进花书里,花两个月时间去跟里面的流形、复杂的概率图模型死磕,等你磕明白了,感觉自己内力大增,结果一出门发现,你同学已经用Hugging Face上的模型fine-tune出了一个效果还不错的文本分类器,甚至还用Gradio或者Streamlit搭了个能在线展示的demo。你理论屠龙技练得再好,面试官问你做过什么项目,你总不能在白板上给他推一遍公式吧?
说白了,这两本书更适合在你已经入门之后,用来查漏补缺、构建知识体系、或者深入理解某个特定理论点时使用,而不是让你从零开始的"新手村教程"。
那么,一个更接地气的路线是啥样的?作为过来人,我给你规划一条路,不敢说最好,但绝对非常可行,能让你平稳地从入门到"感觉自己有点东西了"。
我会给你一套非常牛逼的组合拳,这套组合拳恰恰解决了"理论与实践脱节 "以及"学习曲线陡峭"这两个最大的坑。

