- 机器学习公式详解(第2版)
- 谢文睿 秦州 贾彬彬
- 1010字
- 2023-12-21 17:27:33
前言
在撰写“南瓜书”第1版期间,笔者和秦州有幸结识同样在为“西瓜书”写注解的贾彬彬老师,由于当时第1版已定稿,未能合作,遂相约一起撰写“南瓜书”第2版。我们利用工作之余,历时两年,在第1版的基础上,延续之前的思路,以本科数学视角对“西瓜书”中的内容做了更进一步的解读。除了大幅扩充解读的公式数量以外,我们在部分章节开篇处加注了学习建议和些许见解,供读者参考。此外,为了照顾数学基础薄弱的读者,我们又增添了许多数学知识的解读,同时将其前置在所用到的章节处,不再以附录的形式给出,以便于查阅。
第2版的使用方法保持不变,仍然是“西瓜书”的教辅,读者在阅读“西瓜书”过程中如遇到难以理解的知识点或者公式,可查阅本书相应章节的解读,辅以理解,效果最佳。为了与“西瓜书”中的图表进行区分,本书中的图表序号格式为“章节号-图表序号”(例如“图2-1”),而“西瓜书”中的图表序号格式为“章节号. 图表序号”(例如“图2.1”)。
对于本书中的内容,需要掌握到何种程度?这是自本书第1版出版以来,笔者收到的最多的反馈。其实学习目的不同,需要掌握的程度也不同。学习机器学习的人群按照其学习目的可简单分为三类:期望从事机器学习理论研究的人,期望从事机器学习系统实现的人,以及期望将机器学习应用到具体场景的人。对于期望从事机器学习理论研究的读者,本书中的内容理应全部掌握,同时对本书所涉及数学知识的归属学科也理应系统性学习,诸如最优化、矩阵论和信息论。对于期望从事机器学习系统实现的读者,本书中的内容用于了解算法细节,以便进行工程化实现和性能优化,因此涉及算法原理的公式推导理应读懂。对于期望将机器学习应用到具体场景的读者,本书可以帮助其深入理解各个算法所适用的数据类型,因此其中的公式推导可以不深究。本书的编写初衷是希望分享过来人的经验,以期望帮助“西瓜书”的读者们在有限的时间成本下,踩更少的“坑”,学更多的知识。
本书由开源组织Datawhale的成员采用开源协作的方式完成,参与者包括3位主要作者(谢文睿、秦州和贾彬彬)、5位编委会成员(居凤霞、马晶敏、胡风范、周天烁和叶梁)、12位特别贡献成员(awyd234、feijuan、Ggmatch、Heitao5200、xhqing、LongJH、LilRachel、LeoLRH、Nono17、spareribs、sunchaothu和StevenLzq)。 本书的开源版本托管于GitHub,仓库名为“pumpkin-book”。
由于编者水平有限,书中难免有所纰漏和表述不当之处,还望各位读者批评指正。关注微信公众号“Datawhale”,回复“南瓜书”即可与我们取得联系,我们将尽力提供答疑和勘误。
谢文睿
2023年3月1日于后厂村