【CUDA】利用GPU加速矩阵加法
And ye shall know the truth, and the truth shall make you free.
引子
在实验失败的一周之后,我在游戏中放松紧张的神经,这个时候我突然发现,GPU真是一个神奇的设备,能够以如此快的速度进行运算。
And ye shall know the truth, and the truth shall make you free.
在实验失败的一周之后,我在游戏中放松紧张的神经,这个时候我突然发现,GPU真是一个神奇的设备,能够以如此快的速度进行运算。
贝尔曼方程的艺术。
上一篇文章主要讲了贝尔曼方程、TRPO和PPO算法。TRPO和PPO都是「基于信号进行优化的算法」。但是信号哪里给出?我们并不知道。也就是说,我们现在再假设存在打分机制的情况下,知道了如何优化。这篇文章讲一讲信号是如何得来的。