五步解析机器学习难点—梯度下降

当我第一次尝试学习机器学习算法时,我发现理解一个算法在干什么真的非常难。 第一步:随机将比重(a,b)赋值并计算误差平方和(SSE) 第二步:计算出梯度,即通过微调比重(a,b)从而改变差平方和(SSE)。这样做可以使得a,b值可以向SSE最小化的方向靠拢 第三步:用梯度调整a,b从而达到最优结果,即SSE最小 第四步:用新的a,b来做预测,即得到最优的Ypred(红线)并且计算新的SSE 第五步:重复三四步直到调整a,b不会明显的影响SSE

DQN 从入门到放弃1 DQN与增强学习 - 知乎专栏

深度增强学习Deep Reinforcement Learning是将深度学习与增强学习结合起来从而实现从Perception感知到Action动作的端对端学习End-to-End Learning的一种全新的算法。简单的说,就是和人类一样,输入感知信息比如视觉,然后通过深度神经网络,直接输出动作,中间没有hand-crafted engineering的工作。深度增强学习具备使机器人实现真正完全自主的学习一种甚至多种技能的潜力。