ゲーム理論:自然とのゲーム

画像



ゲーム理論に関する一連の記事の長期にわたる継続。







練習に近い



ゲーム理論に関する以前の記事では、2人のプレイヤーの行動の論理が想定され、それぞれが自分のために最大限の利益を得たい状況が考慮されました。 次の段階は、いわゆる自然とのゲームです。 正式には、戦略ゲームと同様に自然とのゲームの研究は、支払いマトリックスの構築から始まります。これは、本質的に、意思決定を準備する上で最も時間のかかるステップです。 支払いマトリックスのエラーは、いかなる計算方法でも補償することはできず、誤った最終結果につながります。



自然とのゲームの際立った特徴は、ほとんどの場合、1人のプレイヤーと呼ばれる参加者の1人だけを意識的に行動させることです。 プレイヤー2(自然)は結果を気にしないか、意味のある決定ができ​​ません。 または、おそらく、条件はプレーヤーの行動に依存するのではなく、外部要因によって決定されます。市場の反応は、特定のプレーヤー、州の政策、現実を害しません。



タスクの種類と選択基準



自然を使用したゲームには、2つのタイプのタスクがあります。







たとえば、実際の状況に近づくには、比較的現実的な状況を取ります。 決定を下す最初のプレーヤーは、SamsungのGalaxy S5です。 「自然」をプレイする2番目のプレーヤーは、AppleとそのiPhone 6です。



新しいスマートフォンのリリースの時期が近づいており、プレゼンテーションが終了し、専門家が意見を表明しており、プレーヤーだけが製品をリリースする重要な決定を下す必要がありますか? 状況を簡素化して、3つのオプションがあります。競技者の前(A 1 )、競技者と一緒(A 2 )、または競技者の後(A 3 )です。 当然のことながら、新しいiPhoneが発売されるまで、それが私たちのものよりもはるかに優れているか(B 1 )、同じか(B 3 )、品質がはるかに劣っている(B 3 )かはわかりません。 すべてのケースで利益を計算すると、最終的にマトリックスが得られます。



1 2 3で
A 1 5 5 7
A 2 3 4 6
A 3 2 4 8




さて、決定を下すために、いくつかの基準があります。



1. Waldの基準(最大値)。 プレーヤーは、自然が彼にとって最悪の道をたどることを期待しているため、最悪の結果を得るには最大の利益を得るオプションを選択する必要があるため、この基準は悲観的と見なされます。 max(min i)という形式で想像できます。



この基準では:



A 1の場合最小利益(5)は、自然B 1およびB 2のアクションになります。

アクションB 1の後のA 2最低利益3

A 3アクションB 1後の最小利益2



したがって、5、3、2のうち、最大の利益(5)はオプションA 1を与えます。



2.最大基準(maximax)は楽観的です。つまり、 私たちにとって最も好ましい結果を期待しています。それは、max(max i)として示されています。



A 1最大利益7

A 2最大利益6

A 3の最大利益は8



7、6、8のうち、最大の利益はオプションA 3をもたらします



3. Hurwitz基準は、式max(A * max i +(1-A)* min i)で定義された戦略を推奨します。ここで、Aは楽観的な度合いであり、0から1まで変化します。そして自然の最高の行動。 A = 1では、この基準は最大基準に、A = 0ではWald基準に置き換えることができます。 Aの値は、プレーヤーの責任の程度によって異なります。1つ:値が大きいほど、Aは団結に近くなります。 この例では、A = 0.4を取ります。



A 1の場合、利益は0.4 * 7 + 0.6 * 5 = 5.8です

A 2の場合、利益は0.4 * 6 + 0.6 * 3 = 4.2です

A 3の場合、利益は0.4 * 8 + 0.6 * 2 = 4.4です



受信した応答のうち、最大近似はA 1のアクションによってもたらされます。



4.野avな基準(ミニマックス)。 その本質は、高すぎる損失を許さない戦略を選択することにあります。 このため、リスクマトリックスが使用されます。リスクマトリックスでは、プレーヤーのアクションのバリエーションごとに最大利益が計算され、結果の中から最小の利益が選択されます。 彼の式はmin(max i)のように見える



この基準では:



A 1の場合最大利益(7)は自然の作用B 3

アクションB 3後のA 2最大利益6

アクションB 3後のA 3最大利益8



したがって、7、6、8から、最小利益(6)はオプションA 2を与えます。



5.ベイズの基準によれば、検討中のすべての戦略に等しい確率を与え、その後、期待されるゲインが最大になる戦略を受け入れることが提案されています。 この基準には1つの欠点があります。自然の側面からイベントの確率を正確に決定することが常に可能であるとは限りません。 その式は最大(Σq * i)です。



まず、自然の各イベントの発生確率を0.33に設定し、受信しました



A 1の場合 5 * 0.33 + 5 * 0.33 + 7 * 0.33 = 5.61

A 2 3 * 0.33 + 4 * 0.33 + 6 * 0.33 = 4.29の場合

A 3 2 * 0.33 + 4 * 0.33 + 8 * 0.33 = 7.63の場合



明らかに、オプションA 3から最大の利益を得ることができます。 しかし、専門家に目を向けると、自然0.5のイベントの確率が得られました。 0.4; 0.1; それに応じて。 このように



A 1 5 * 0.5 + 5 * 0.4 + 7 * 0.1 = 5.2の場合

A 2 3 * 0.5 + 4 * 0.4 + 6 * 0.1 = 3.7の場合

A 3 2 * 0.5 + 4 * 0.4 + 8 * 0.1 = 3.4の場合



コメントの結果は無意味だと思います。



主なタスクは、特定の外部条件下でシステムを目標に導く最適な(または少なくとも合理的な)戦略を見つけることです。 不確実性の条件で戦略を選択するには、任意の基準を適用できますが、リスクの条件では、ベイズ基準がより効果的です。 ただし、基準自体の選択は通常、意思決定者の性質(特に、リスク選好度)に応じて、直感に基づいています。



不確実な条件で決定を下す場合、いくつかの基準を使用する方が適切です。 推奨事項が同じ場合、自信を持って最適なソリューションを選択できます。 推奨事項が矛盾している場合、長所と短所を考慮して、より慎重に決定する必要があります。



All Articles