我看RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning他說state=f(H)其中H是歷史 歷史包含觀察動作獎勵三個 所以STATE要包含這三樣? 可是我看有些算法STATE只要用觀察做一些轉換就

軟體開發

強化學習

于正龍（Ricky）的沙龍

如何定義RL的STATE

投資理財

leetcode

python網頁設計

Flutter APP開發

PINE腳本策略乾貨

rust

人工智能

hummingbot

綜合

python程式自動化交易

資訊安全自學日記

用python學數學

python自動化