また、エージェントの観察と行動は以下のように行われます。
オブジェクト名 | 仕様 |
---|---|
Field | AgentやExit、Obstacleが生成される。広さは縦20マス、横30マス。 |
Agent | フィールドの白いマス(Empty)にランダムな位置で10体生成される。移動は5フレームごとに行われ、複数のエージェントが同じマスに移動することも可能。移動するごとに-0.001の罰が与えられる。 |
Obstacle | 位置は固定。Agentはこのマスに移動することはできない。 |
Exit | 位置は固定。Agentがこのマスに移動すると、そのAgentは避難完了となる。全てのAgentが避難完了すると1.0 の報酬が与えられ、次のエピソードが開始する。 |