強(qiáng)化學(xué)習(xí)基礎(chǔ)概念之智能體的種類
2023-03-29 17:27 作者:下輩子也不會(huì)早起 | 我要投稿
強(qiáng)化學(xué)習(xí)智能體分類:
(1)基于模型的強(qiáng)化學(xué)習(xí)。策略(和/或)價(jià)值函數(shù),環(huán)境模型。如:迷宮游戲、迷宮、圍棋、迷宮、象棋等這類規(guī)則明確,且可以枚舉下一個(gè)狀態(tài)的所有可能(比如象棋黑方走了一步后,可以列舉此時(shí)紅方可能要走的棋子和要走的方式)。
(2)模型無關(guān)的強(qiáng)化學(xué)習(xí)。策略(和/或)價(jià)值函數(shù),沒有環(huán)境模型,環(huán)境是黑箱,比如Atari游戲、王者榮耀游戲,其需要大量的采樣。
標(biāo)簽: