MENU

寒夜雨

汀苇乱摇寒夜雨,沙鸥闲弄夕阳天。

【嵌入式】从UART到I2C

一个不会硬件的机器学习研究者,不是一个好的软件工程师。

引子

我最近在学习STM32,正好学习到了通讯这一步,这一部分有一些很有意思的概念,抽象总结出来做个小记。

阅读全文

【AI】强化学习常用算法小记(下)

贝尔曼方程的艺术。

引子

上一篇文章主要讲了贝尔曼方程、TRPO和PPO算法。TRPO和PPO都是「基于信号进行优化的算法」。但是信号哪里给出?我们并不知道。也就是说,我们现在再假设存在打分机制的情况下,知道了如何优化。这篇文章讲一讲信号是如何得来的。

阅读全文