コンテンツにスキップ

利用者:D-Sashimi/Stochastic game

ゲーム理論では、1950年代初頭にロイドシャプリーによって導入された確率ゲームは、1人以上のプレーヤーが確率的な遷移を行う動的ゲームです。ゲームは一連の段階でプレイされます。各ステージの開始時に、ゲームはある状態にあります。プレイヤーはアクションを選択し、各プレイヤーは現在の状態と選択されたアクションに応じてペイオフを受け取ります。その後、ゲームは新しいランダム状態に移行します。その分布は、前の状態とプレーヤーが選択したアクションによって異なります。この手順は新しい状態で繰り返され、プレイは有限または無限のステージ数の間継続されます。プレーヤーへの合計ペイオフは、多くの場合、ステージペイオフの割引合計、またはステージペイオフの平均よりも低い制限と見なされます。

確率ゲーム(: stochastic game)は,1人以上のプレイヤーによって行われる確率的な遷移を伴う動的ゲームの一種である。アメリカの経済学者であるロイド・シャープレーによって1950年代前半に導入された。1つのゲームはステージゲームの系列としてプレイされる。

各ステージゲームの開始時において,ゲームはある状態にあるとする。

各プレイヤーが行動を選択し,現在の状態と各プレイヤーによって選択された行動に応じた利得を受け取る。


確率ゲームは、マルコフ決定過程を複数の相互作用する意思決定者に一般化し、戦略形式のゲームは、プレーヤーの選択に応じて環境が変化する動的な状況に一般化します。 [1]

確率ゲームは,マルコフ決定過程を,複数の意思決定主体が相互作用する状況に一般化したものであり,展開型ゲーム(標準型ゲーム)と同様に,各プレイヤーの選択によって環境が変化する動的な状況にも適用される。

2人ゲーム[編集]

関連項目[編集]

[[Category:ゲーム理論]]

  1. ^