云迹

学习dueling DQN有感：往往很有效的办法的核心思想是最简单的，dueling DQN其实就是一点概率上的想法，把要估计的Q拆成了均值V和优势函数，但是带来的效果却非常好，该作者也获得了ICML best student paper。

这个思想大家一看都懂了QAQ可是自己就没办法写出来，数学还是很重要啊！！resnet也是，要说这东西很难吗？但是怎么才能从曾经学过的东西运用出来实在是太难了，大部分知识学完就忘了QAQ，而且对从事的应用的理解也没有很深，也不会提关键的问题，dueling DQN是觉得好多动作没必要更新才想出个这么个东西，“很多动作没必要更新”这个问题，也是很难提出来的。

太菜了哈哈哈