登录

强化学习


分类

过程

这里的“事实强化”可以理解为基于环境反馈的客观数据驱动的强化学习过程:智能体(agent)在环境中采取行动,环境会根据当前状态和行动返回一个奖励信号和新的状态。
文章

模型

如在医疗决策中,强化学习模型不仅需要考虑治疗效果(事实),还需要考虑患者的舒适度、治疗的可接受性(价值)。
文章

强化学习

五、当机器的强化学习能够产生价值性的强化之际,真正的颠覆或许就开始了。
文章

当机器的强化学习能够产生价值性的强化之际,颠覆就会开始了。
文章

总而言之,当机器的强化学习能够产生价值性的强化时,确实可能引发一系列颠覆性的变化。
文章

效果

如在医疗决策中,强化学习模型不仅需要考虑治疗效果(事实),还需要考虑患者的舒适度、治疗的可接受性(价值)。
文章