昨日から今日にかけて強化学習のシミュレータを作りました.
まだ,基本的なところしかできていませんが,一応,衝突回避を達成することができました.
(動画を上げたかったのですが,面倒だったのでキャプチャを・・・)
以前,研究活動で製作したシミュレータの基礎部分に強化学習用のアルゴリズムを導入した結果うまくいきました.
使ったモデルはQ学習で,障害物認識,Q学習開始,衝突回避,前進,障害物認識,Q学習開始・・・というルーチンで動くので,放っておくだけで学習できます.
上の環境でだいたい600回ほどで達成することができました.
次は障害物を配置してやりたいです.
では.
コメント
コメントを投稿