深度学习入门必看的书和论文?有哪些必备的技能需学习?

深度学习入门
关注者
10,598
被浏览
491,335
收录于知乎圆桌 ·

论文实在太多了,而且更新速度很快,对于入门来说,更多地需要系统性的学习为主,这需要依靠经典的书籍。而且,重要的论文在书中一般都有引用。所以,我就来推荐几本书吧。我这里将侧重基础技能和理论知识的学习,至于《几天精通Tensorflow》这一类的手册性书籍,我就不多介绍了。在我看来,一个深度学习领域深入钻研者的案头,下面几本书是必须要摆的,看得懂会大大受益,看不懂也能唬唬人:

1. Convex Optimization

对于机器学习从业者来说,最优化(Optimization)无疑是最重要的基础。对于模型相对统一的深度学习领域来说,尤其是如此。现代最优化的基础方法和理论,往往都以凸优化为基础。系统学习一下Stephen Boyd这本经典教科书,对于全面理解最优化的概念、思路和方法非常有必要,也使得你在面对新的模型时不至于无从下手。

2. Numerical Optimization

最优化除了理论,往往还涉及到很多很多工程实现的问题。将这本数值优化的书与上面介绍凸优化的理论书籍对照学习,可以迅速提高实战能力。另外,许多常用算法的伪代码在本书中都可以找到,这大大方便了学习者的使用。应该说,这是一本机器学习者都应该把在案头的工具书。

3. 矩阵分析与应用

这是清华大学自动化系张贤达老师的力作,是矩阵分析领域一本令人称奇的工具书。可以说,任何工程中用到的有关矩阵的理论与算法,在书中都有详实的介绍,建议读者粗读一遍,将来碰到相关的问题可以按图索骥。不过,这本书的风格过于面向专业读者,深入浅出的几何意义解释很少,初学者看起来颇有点一头雾水。

4. Pattern Recognition and Machine Learning

这本PRML是机器学习界最经典的书,或许没有之一,据说作者Christopher
Bishop因为此书赚了一大笔。这本书块头太大,很难突击读完,不过在看似庞杂的理论体系背后,作者实际上对各种方法的本质与联系的阐释非常深入精到,我当年被其中有关指数族分布和Evidence Framework的部分所深深吸引,欲罢不能。应该这么说,如果这本书你都认真读了,而且都读懂了,那么你的机器学习功底应该可以秒杀大多数专家了。这本书的问题,是立场过于倾向于Bayesian学派,形而上的理解高于实操性了。

5. 机器学习

周志华老师的机器学习,被大家亲切地称为西瓜书。与上面的PRML一书不同,周老师这本书全面、详实地介绍了机器学习领域各种常用的模型和方法,而且理论与实践兼顾,是初中级读者非常好的教科书。另外,这实际上也是机器学习领域第一本全面、高质量的中文教材,影响力和价值不言而喻。

6. Deep Learning

打好深度学习的基础,并不是仅仅了解神经网络和BP算法就可以,所以我推荐了上面那些书。或者说,如果上面那些书的内容您所知寥寥,对于深度学习理论与算法的掌握,也不可能多么精深,而仅仅靠“训模型、调参数”在行业立足的话,被淘汰的日子不会太远。在狭义的“深度学习”领域,我只推荐了这一本,这是因为读好这一本书就够了。这本书以比较严谨完备的体系,全面介绍了深度学习的本质、方法和在若干重要领域的经典模型;另外,考虑到深度学习的强工程性特点,书中对于深度学习模型优化的各种方法论和工程技巧的介绍也较为完备。不过,书中对于深度学习实操层面的介绍略少。


欢迎关注我的公众号“计算广告”(Comp_Ad),那里都是有趣的负能量。