Machine Learning And Algorithmic Trading(Textbook)
机器学习和算法交易(教材)
红色标记的内容是可选的,因为这些内容主要是对之前黑色文本部分的补充和扩展。这取决于你想学习的难度和速度!
你应该先完成第一本教材,然后再决定是先学习机器学习部分还是衍生品部分,当然你也可以同时学习这两部分。 这两个领域有一些交叉点,我个人更偏爱前者(机器学习),不过它们实际上是相互独立的,学习其中一个并不需要另一个领域的知识。
所有教材都提供了亚马逊链接,但要注意避免使用libgen,因为那里可以免费获取所有这些教材。
免责声明:
如果你进行盗版行为,我不承担任何责任,我也不建议你这样做,因为这是错误的。不过我听说有些人会用它来预先检查书的质量,确认内容是否值得购买。
另外,购买实体书可以让你拥有一个令人印象深刻的书架,有人认为阅读实体书更好。但我个人觉得PDF版本和实体书都很好。当然,说的是通过作者正当渠道购买的PDF…
- Quantitative Trading 2nd edition”
- Trading and Exchanges - This can be skipped if you are not interested in microstructure, but regardless is quite helpful to know as it can make sure you avoid some silly mistakes.
注意:关于Ernest Chan的书籍的简短说明。这些书的内容不算很深入,但作为入门材料比较容易理解, 所以可以快速浏览。特别是1) a和b(红色标注的部分)非常基础,如果你对量化交易已经有一定了解的话,可以直接跳过这些内容。
关于Ernest Chan的书籍的简短说明:
这些书的内容不是很深入,但作为入门材料比较容易理解,所以你可以快速浏览。特别是红色标记的1) a和b部分,内容非常基础,除非你是完全的量化交易新手,否则可以直接跳过。
简单来说:
- Ernest Chan的书适合入门快速了解
- 内容相对基础和浅显
- 有经验的人可以选择性跳过最基础的章节
- 主要面向完全的新手读者
ML (1/3) Machine Learning for Algorithmic Trading
机器学习和Python编程之间有很多重叠的内容…所以可以先读其中一本,然后阅读”Finding Alphas”(寻找阿尔法),之后再读另一本。这就是为什么在机器学习方面,这些书被标注为第一本或第三本推荐阅读的书籍。
《机器学习》和《精通Python》这两本书之间有很多内容重叠,所以你可以先选择其中一本开始读,然后阅读《寻找阿尔法》(Finding Alphas),之后再读另一本。
这也是为什么在机器学习领域的阅读顺序中,这两本书被标注为可以作为第一本或第三本来读的原因。
简单总结阅读建议:
- 先选择《机器学习》或《精通Python》中的一本
- 接着阅读《寻找阿尔法》
- 最后阅读之前没读过的那本书
这样的阅读顺序可以避免重复内容,更有效率地学习。
ML (1/3) Mastering Python for Finance
如果你选择”旁听”课程的方式,那么在阅读《寻找阿尔法》之前,你可以免费完成所有这些课程。
说明:
- “旁听”(audit)模式让你可以免费访问课程内容
- 建议先完成所有这些免费课程
- 然后再开始阅读《寻找阿尔法》
- 这样的学习顺序可以让你更好地理解后续的内容
这里强调的是充分利用免费的学习资源,在进入更深入的学习材料之前打好基础。
关于这个4部分课程的重要说明:
主要优势:
- 内容丰富全面(4个部分的完整课程)
- 教学方法独特:
- 先用传统模型建立直觉理解
- 然后展示实际产业中使用的有效方法
- 使用Python在Jupyter notebook环境中:
- 这是进行研究的最佳方式
- 便于实验和验证
替代选择:
- Orange也是不错的选择
- Jupyter中使用R内核也是很好的替代方案(后续会详细介绍)
虽然内容量很大,但这个课程的实用性和教学质量使它成为最好的学习资源之一,特别是对于想要深入量化领域的学习者来说。
ML (2) Finding Alphas: A Quantitative Approach (2nd edition)
ML (4) Advanced Algorithmic Trading
关于回测结果的重要提醒:
核心观点:
- 展示的回测结果可能存在过度拟合
- 结果看起来比实际效果要好看
但这些内容仍然有价值,主要用途是:
- 熟悉不同的策略方法
- 了解各种交易思路
- 启发自己的创新思维
- 改进个人的策略开发过程
建议态度:
- 保持批判性思维
- 不要盲目照搬回测结果
- 将其作为学习和获取灵感的参考
- 重点关注方法论和思维过程,而不是具体结果
ML (5) Advances in financial machine learning
关于MLDP(Machine Learning for Dynamic Programming)这本书的准确评价:
质量分布:
- 开头几章:极其出色(必读)
- 中间章节:质量尚可
- 最后章节:质量很差
比喻:”Nicolas Cage式”的作者:
- 要么极好要么极差
- 没有中间地带
- 作品质量两极分化
具体表现:
- 好的部分:提出实用且出色的方法
- 差的部分:过于偏门,缺乏实际赚钱价值
核心建议:
- 无论如何,前几章是量化从业者必读内容
- 选择性阅读其他部分
- 保持批判性思维,取其精华
ML(6) The elements of statistical learning general ML knowledge – Less math heavy version
ML(7) Regression Analysis with Python
ML(8) Regression Modelling Strategies
关于回归模型的重要认识:
专业人士vs初学者的区别:
- 初学者倾向使用复杂的机器学习模型
- 专业量化交易者更偏好最简单的模型(如回归)
为什么回归如此重要:
- 数据特性决定:
- 数据噪声大
- 维度高
- 极易过度拟合
- 常见误区:
- 初学者往往高估了数据的可拟合程度
- 实际可用的拟合空间很有限
推荐的回归方法:
- 岭回归(Ridge)
- 中值回归(Median)
- MAD回归(Median Absolute Deviation)
补充建议: 建议学习Coursera上的机器学习课程:
- 虽然不是专门针对金融
- 但有助于建立对机器学习的基本认识
- 了解各种方法的工作原理
核心启示: 简单模型往往比复杂模型更实用,这是经验的体现,而不是技术能力的限制。
Bonus Books:
- Elements of Quantitative Investing Draft this is a book written by @__paleologo on Twitter, and is in draft form but is incredibly good so well worth the read)
- Quantitative Portfolio Management
- Advanced Portfolio Management
- Trader Construction Kit
- Optimal Trading Strategies
- Advanced Futures Trading Strategies
4th Edition Extras:
- Algorithmic Trading Methods Goes through some models
- Trades Quotes and Prices Microstructure textbook
- Machine Learning in Finance More rigorous for ML in Finance
- Data Driven Science and Engineering Not specifically quant, but there is huge alpha from engineering/ signal processing
5th Edition Extras:
- Analysis of Financial Time Series
- Bayesian Data Analysis
- Digital Signal Analysis: An Introduction (R. Anand) Not specifically quant, but alike ‘Data Driven Science and Engineering’ it presents a lot of opportunities to find interesting methods that can be applied to quant
Robert Carver Textbooks (These are an alternative to some of the initial textbooks):
关于教材顺序和额外推荐的说明:
Robert Carver的书籍特殊说明:
- 可以替代Ernest Chan的书籍
- 由读者自行决定是否替换
- 当读者觉得Chan的书难以理解时可以转向Carver的书
教材排序原则:
- 基于附加价值进行排序
- 第一批推荐的额外教材是必要的补充
- 之后的教材逐渐变成可选性质
简单来说:
- 核心教材是必读的
- 第一批额外推荐的教材也很重要
- 后续推荐的教材优先级逐渐降低
- 读者可以根据需求选择性阅读后面的教材