机器学习和算法交易(教材)

红色标记的内容是可选的,因为这些内容主要是对之前黑色文本部分的补充和扩展。这取决于你想学习的难度和速度!

你应该先完成第一本教材,然后再决定是先学习机器学习部分还是衍生品部分,当然你也可以同时学习这两部分。 这两个领域有一些交叉点,我个人更偏爱前者(机器学习),不过它们实际上是相互独立的,学习其中一个并不需要另一个领域的知识。

所有教材都提供了亚马逊链接,但要注意避免使用libgen,因为那里可以免费获取所有这些教材。

免责声明:

如果你进行盗版行为,我不承担任何责任,我也不建议你这样做,因为这是错误的。不过我听说有些人会用它来预先检查书的质量,确认内容是否值得购买。

另外,购买实体书可以让你拥有一个令人印象深刻的书架,有人认为阅读实体书更好。但我个人觉得PDF版本和实体书都很好。当然,说的是通过作者正当渠道购买的PDF…

  1. Quantitative Trading 2nd edition”
  2. Trading and Exchanges - This can be skipped if you are not interested in microstructure, but regardless is quite helpful to know as it can make sure you avoid some silly mistakes.

注意:关于Ernest Chan的书籍的简短说明。这些书的内容不算很深入,但作为入门材料比较容易理解, 所以可以快速浏览。特别是1) a和b(红色标注的部分)非常基础,如果你对量化交易已经有一定了解的话,可以直接跳过这些内容。

关于Ernest Chan的书籍的简短说明:

这些书的内容不是很深入,但作为入门材料比较容易理解,所以你可以快速浏览。特别是红色标记的1) a和b部分,内容非常基础,除非你是完全的量化交易新手,否则可以直接跳过。

简单来说:

  • Ernest Chan的书适合入门快速了解
  • 内容相对基础和浅显
  • 有经验的人可以选择性跳过最基础的章节
  • 主要面向完全的新手读者

ML (1/3) Machine Learning for Algorithmic Trading

机器学习和Python编程之间有很多重叠的内容…所以可以先读其中一本,然后阅读”Finding Alphas”(寻找阿尔法),之后再读另一本。这就是为什么在机器学习方面,这些书被标注为第一本或第三本推荐阅读的书籍。

《机器学习》和《精通Python》这两本书之间有很多内容重叠,所以你可以先选择其中一本开始读,然后阅读《寻找阿尔法》(Finding Alphas),之后再读另一本。

这也是为什么在机器学习领域的阅读顺序中,这两本书被标注为可以作为第一本或第三本来读的原因。

简单总结阅读建议:

  1. 先选择《机器学习》或《精通Python》中的一本
  2. 接着阅读《寻找阿尔法》
  3. 最后阅读之前没读过的那本书

这样的阅读顺序可以避免重复内容,更有效率地学习。

ML (1/3) Mastering Python for Finance

如果你选择”旁听”课程的方式,那么在阅读《寻找阿尔法》之前,你可以免费完成所有这些课程。

说明:

  • “旁听”(audit)模式让你可以免费访问课程内容
  • 建议先完成所有这些免费课程
  • 然后再开始阅读《寻找阿尔法》
  • 这样的学习顺序可以让你更好地理解后续的内容

这里强调的是充分利用免费的学习资源,在进入更深入的学习材料之前打好基础。

使用 Python 和机器学习进行投资管理 专项课程

关于这个4部分课程的重要说明:

主要优势:

  • 内容丰富全面(4个部分的完整课程)
  • 教学方法独特:
    • 先用传统模型建立直觉理解
    • 然后展示实际产业中使用的有效方法
  • 使用Python在Jupyter notebook环境中:
    • 这是进行研究的最佳方式
    • 便于实验和验证

替代选择:

  • Orange也是不错的选择
  • Jupyter中使用R内核也是很好的替代方案(后续会详细介绍)

虽然内容量很大,但这个课程的实用性和教学质量使它成为最好的学习资源之一,特别是对于想要深入量化领域的学习者来说。

ML (2) Finding Alphas: A Quantitative Approach (2nd edition)

ML (4) Advanced Algorithmic Trading

关于回测结果的重要提醒:

核心观点:

  • 展示的回测结果可能存在过度拟合
  • 结果看起来比实际效果要好看

但这些内容仍然有价值,主要用途是:

  • 熟悉不同的策略方法
  • 了解各种交易思路
  • 启发自己的创新思维
  • 改进个人的策略开发过程

建议态度:

  • 保持批判性思维
  • 不要盲目照搬回测结果
  • 将其作为学习和获取灵感的参考
  • 重点关注方法论和思维过程,而不是具体结果

ML (5) Advances in financial machine learning

关于MLDP(Machine Learning for Dynamic Programming)这本书的准确评价:

质量分布:

  • 开头几章:极其出色(必读)
  • 中间章节:质量尚可
  • 最后章节:质量很差

比喻:”Nicolas Cage式”的作者:

  • 要么极好要么极差
  • 没有中间地带
  • 作品质量两极分化

具体表现:

  • 好的部分:提出实用且出色的方法
  • 差的部分:过于偏门,缺乏实际赚钱价值

核心建议:

  • 无论如何,前几章是量化从业者必读内容
  • 选择性阅读其他部分
  • 保持批判性思维,取其精华

ML(6) The elements of statistical learning general ML knowledge – Less math heavy version

ML(7) Regression Analysis with Python

ML(8) Regression Modelling Strategies

关于回归模型的重要认识:

专业人士vs初学者的区别:

  • 初学者倾向使用复杂的机器学习模型
  • 专业量化交易者更偏好最简单的模型(如回归)

为什么回归如此重要:

  1. 数据特性决定:
    • 数据噪声大
    • 维度高
    • 极易过度拟合
  2. 常见误区:
    • 初学者往往高估了数据的可拟合程度
    • 实际可用的拟合空间很有限

推荐的回归方法:

  • 岭回归(Ridge)
  • 中值回归(Median)
  • MAD回归(Median Absolute Deviation)

补充建议: 建议学习Coursera上的机器学习课程:

  • 虽然不是专门针对金融
  • 但有助于建立对机器学习的基本认识
  • 了解各种方法的工作原理

核心启示: 简单模型往往比复杂模型更实用,这是经验的体现,而不是技术能力的限制。

Bonus Books:

4th Edition Extras:

5th Edition Extras:

Robert Carver Textbooks (These are an alternative to some of the initial textbooks):

关于教材顺序和额外推荐的说明:

Robert Carver的书籍特殊说明:

  • 可以替代Ernest Chan的书籍
  • 由读者自行决定是否替换
  • 当读者觉得Chan的书难以理解时可以转向Carver的书

教材排序原则:

  1. 基于附加价值进行排序
  2. 第一批推荐的额外教材是必要的补充
  3. 之后的教材逐渐变成可选性质

简单来说:

  • 核心教材是必读的
  • 第一批额外推荐的教材也很重要
  • 后续推荐的教材优先级逐渐降低
  • 读者可以根据需求选择性阅读后面的教材