A.智能體可以隨時選擇任何動作B.環(huán)境的動態(tài)會隨時間改變C.下一個狀態(tài)只取決于當前狀態(tài)和采取的動作D.智能體可以看到完整的狀態(tài)空間
A.圖像與圖像疊加B.樣本與樣本疊加C.特征與特征疊加D.標簽與標簽疊加
A.監(jiān)督學習B.無監(jiān)督學習C.半監(jiān)督學習D.策略梯度