强化学习就是用多次的尝试, 不断更新自己的经验库
Q learning 就是强化学习中的一种更新经验库的方法。
把一个事件细分成多个状态, 每个状态会有不同的对应动作, 不同的动作对应不同的奖励。 目的就是使奖励最大化。
注意名词:
state, action, learning rate, discount ratio.
Q learning 就是强化学习中的一种更新经验库的方法。
把一个事件细分成多个状态, 每个状态会有不同的对应动作, 不同的动作对应不同的奖励。 目的就是使奖励最大化。
注意名词:
state, action, learning rate, discount ratio.
本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。
怀疑对方AI换脸可以让对方摁鼻子 真人摁下去鼻子会变形
女子野生动物园下车狼悄悄靠近 后车司机按喇叭提醒
睡前玩8分钟手机身体兴奋1小时 还可能让你“变丑”
惊蛰为啥吃梨?倒春寒来不来就看惊蛰
男子高速犯困开智能驾驶出事故 60万刚买的奔驰严重损毁
Copyright © 2019-2025 how234.cn 版权所有 赣ICP备2023008801号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务