国产精品天干天干,亚洲毛片在线,日韩gay小鲜肉啪啪18禁,女同Gay自慰喷水

歡迎光臨散文網 會員登陸 & 注冊

北大公開課-人工智能基礎 49 決策理論規(guī)劃

2023-04-02 22:58 作者:朝朝暮暮1895  | 我要投稿


決策規(guī)劃,從初始狀態(tài),經過一系列動作,達到目標狀態(tài)

決策理論規(guī)劃,用最小代價,從初始狀態(tài),到達目標狀態(tài)

最小代價,相當于最大期望效應 MEU (一系列效用函數值最大化的節(jié)點集合)

馬爾可夫模型

離散時間,隨機控制,但是最終動作的結果,僅僅取決于當前狀態(tài)(定向擴散)

經典規(guī)劃的核心要素

環(huán)境確定,狀態(tài)完全可知,求解是找到一個從初始狀態(tài)出發(fā)到達目標狀態(tài)的解


馬爾可夫決策

智能體處于的環(huán)境是隨機的,時間是離散的;求解的目的是找到一個控制其(擴散)的過程

馬爾可夫決策的核心問題不在于找到策略和解,核心問題在于找到效用函數

效用值迭代等式

策略迭代

U效用相當于每一個步驟的相對最大值MEU的集合。




北大公開課-人工智能基礎 49 決策理論規(guī)劃的評論 (共 條)

分享到微博請遵守國家法律
阿坝| 五河县| 葵青区| 吉林省| 连城县| 桐庐县| 兰溪市| 连江县| 同江市| 呼和浩特市| 德阳市| 托克逊县| 辽阳县| 铁力市| 正镶白旗| 北川| 垫江县| 菏泽市| 敦化市| 保亭| 双鸭山市| 伊宁县| 宣恩县| 苏尼特左旗| 饶阳县| 鲁甸县| 扬州市| 思茅市| 克拉玛依市| 重庆市| 莱芜市| 桃园市| 郯城县| 灵寿县| 万源市| 介休市| 武陟县| 永宁县| 芜湖县| 康马县| 建平县|