学习机器学习时常常会用到蒙特卡洛方法和时序差分学习,所以对它们有一个直观的理解还是很重要的。本文通过举一个实际的例子来帮助理解。
假如要训练一个预估开车从成都到北京需要耗时多久的模型(Model),那么如何训练呢?
1. 蒙特卡洛方法
2020-12-18