于正龍(Ricky)的沙龍
強化學習
1
免費公開
房間資訊
強化學習
全部
全部
全部類型
免費與付費
最新發佈
最新發佈
Vedanta
2025/12/03
如何定義RL的STATE
我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就
#
程式
#
觀察
#
資訊
2
Vedanta
2025/12/03
如何定義RL的STATE
我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就
#
程式
#
觀察
#
資訊
2
加入
全部
全部
全部類型
免費與付費
最新發佈
最新發佈
Vedanta
2025/12/03
如何定義RL的STATE
我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就
#
程式
#
觀察
#
資訊
2
Vedanta
2025/12/03
如何定義RL的STATE
我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就
#
程式
#
觀察
#
資訊
2