強化學習

1免費公開
強化學習
全部類型
免費與付費
最新發佈
最新發佈
avatar-avatar
Vedanta
2025/12/03
我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就
avatar-avatar
Vedanta
2025/12/03
我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就
全部類型
免費與付費
最新發佈
最新發佈
avatar-avatar
Vedanta
2025/12/03
我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就
avatar-avatar
Vedanta
2025/12/03
我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就