てきとー趣味おたく

ソシャゲ、ポムポムプリン、コーヒー・紅茶、ジャグリングなど、オタク女の日常と思いついたことをつらつらと気まぐれに。

オペレーションズ・リサーチ 意思決定について

お久しぶりです。死の淵から蘇りました。十日近く死んでたらしい。

あと薬が増えてメンヘラ度が加速しました。これでも健常者らしいって怖いですね。

 

そんなことはおいといて、授業で「オペレーションズ・リサーチ基礎」という科目があるのですが、それの演習問題を解いていて「あっこれの内容ブログにまとめとけばよくね?」と思ったのでおいておきます。

この記事は意思決定について。ゲーム理論の一歩手前くらいの話です。

 

 

 

意思決定とは

そもそも意思決定っていうけど何よ?っていうことで、ざっくりと前提知識を。

意思決定を考えるにあたって決定分析の概念について説明します。

行動

意思決定において、「具体的にどういった選択をするか」という決定のことを「行動」と呼びます。

例えば、「製品をいくらで売るか」、「投資の方法の選択肢」などが当てはまります。

結果

意思決定を行った結果、得られる利益や支払うべき費用についてを「結果」と呼びます。

例えば、「製品の売上高や利益率」、「投資の収益やリスク」など。

状態

意思決定を行う際、意思決定者がコントロールできない外的要因についてを「状態」と呼びます。

例えば「景気の良し悪し」「製品需要の程度」など。

 

以上3つが意思決定を考えるにあたる基本的な概念です。表にするとこんな感じ。

 

利得表の例
行動\状態 状態X 状態Y 状態Z
行動A 結果1 結果2 結果3
行動B 結果4 結果5 結果6
行動C 結果7 結果8 結果9

 

縦横の個数は場合によって変わりますが、3×3の例だとこうなります。

 

 

意思決定の種類

意思決定と一口に言っても様々な考え方があります。

大きくジャンル分けすると4種類。

確実性の下での意思決定

実現する将来の状態があらかじめ完全にわかり切っている場合、「確実性の下での意思決定」というジャンル分けになります。

行動を一つ選択すれば、それに対応して一意に結果が決まる、ということです。

例えば、「来年の景気がわかり切っている」「製品の需要が既知である」など。


リスクの下での意思決定

もし、実現する将来の状態の確率が既知ならば、「リスクの下での意思決定」というジャンル分けになります。

例えば「翌日に雨が降る確率が50%」など。


不確実性の下での意思決定

もし、実現する将来の状態の確率が未知ならば、「不確実性の下での意思決定」というジャンル分けになります。

例えば、「初めて市場に回る製品の需要がわからない」「競争相手がおり、将来の予測が全く不可能」など。


競争の下での意思決定

 もし、将来実現する状態の確率が競争相手(対抗相手)に依存して決まり、競争相手の行動選択が予見できないのであれば、「競争の下での意思決定」というジャンル分けになります。ここに関しての解説はゲーム理論の話をするときがあれば。

 

 意思決定基準

大まかなジャンル分けがわかったところで、細かい意思決定基準についての解説を書いていこうと思います。

例に挙げる利得表はこちら。

 

利得表1(OR入門 意思決定の基礎 P83より数値を引用)
行動\状態 A B C D
d 2 3 4 8
b 3 5 4 2
s 8 5 2 0
c 10 3 1 2

 

確実性の下での意思決定

確実性の下では、将来実現する状態が(この表では)A~Dのどれなのかわかっているので、その状態のうち最良の結果となる行動を選択します。

例えば、

  • 「状態Bが起こる」とわかっているなら最適な行動はbまたはsで、得られる利得は5
  • 「状態Dが起こる」とわかっているなら最良の選択はdで、得られる利得は8

といったように選択します。

 

リスクの下での意思決定

例の表に少し情報を加えます。

 

確率つき利得表(OR入門 意思決定の基礎P85より数値を引用)
行動\状態・確率

A

0.3

B

0.2

C

0.4

D

0.1

d 2 3 4 8
b 3 5 4 2
s 8 5 2 0
c 10 3 1 2

 

状態の起こる確率をそれぞれ割り当てました。

 

期待値基準

最もポピュラーな意思決定の方法です。

各行動から得られる利得の期待値を計算し、期待値が最も大きくなる行動を選択します。

上の表から、

行動dの期待値は

2×0.3 + 3×0.2 + 4×0.4 + 8×0.1 = 3.6

行動bの期待値は

3×0.3 + 5×0.2 + 4×0.4 + 2×0.1 = 3.7

行動sの期待値は

8×0.3 + 5×0.2 + 2×0.4 + 0×0.1 = 4.2 ←最大値

行動cの期待値は

10×0.3 + 3×0.2 + 1×0.4 + 1×0.1 = 4.1

 

となり、行動sが最も期待値が高くなるので、この基準の下での最適な行動は行動sとなります。

 

満足度基準

ある一定水準以上の利得(または一定水準以下の費用)が実現する確率を満足度と呼びます。

この満足度を最大にするような行動を選択する基準が満足度基準。

基準をSとおくと、Sを上回る確率(費用の場合は下回る確率)が最も大きくなるものを選びます。

S=5、確率をPで表すと

P{ ( 行動dの利得 ) ≧ 5 } = 0.1

P{ ( 行動bの利得 ) ≧ 5 } = 0.2

P{ ( 行動dの利得 ) ≧ 5 } = 0.5 ←最大値

P{ ( 行動dの利得 ) ≧ 5 } = 0.3

より、この基準の下での最適な行動は行動dとなります。

 

不確実性の下での意思決定

確実性の下では起こりうる状態が、リスク基準の下では起こる状態の確率がわかっていましたが、この場合は「状態が起こる場合が未知」です。

改めて利得表を持ってきます。

この条件では、 状態A~Dが起こる確率は全くわからないものとします。

 

利得表(OR入門 意思決定の基礎 P83より数値を引用)
行動\状態 A B C D
d 2 3 4 8
b 3 5 4 2
s 8 5 2 0
c 10 3 1 2

 

ラプラス基準

「どの状態も同じ確率で起こる」と仮定して期待値を求め、意思決定を行う基準です。

この例の場合は状態が4つあるので、全ての状態が4分の1で起こると仮定します。

あとは期待値基準と計算方法は同様です。

 

行動dについて、

( 2 + 3 + 4 + 8 ) / 4 = 17 / 4 ←最大値

行動bについて、

( 3 + 5 + 4 + 2 ) / 4 = 14 / 4

行動sについて、

( 8 + 5 + 2 + 0 ) / 4 = 15 / 4

行動cについて、

( 10 + 3 + 1 + 1 ) / 4 = 15 / 4

 

以上より、この基準の下での最適な行動は行動dです。

 

ミニ・マックス(マックス・ミニ)基準

結果が費用で表されているなら、起こりうる最大(max)の損失を最小(min)にしようとする選択基準です。

逆に、結果が利得で表されている場合は最小(min)の利得を最大(max)にするように選択します。

選択基準の中でも非常に悲観的な基準で、とにかく安全策を取って損失を最低限にしたいだとか、ある程度の利得は保証できる選択をしたい、というような場合に有効な選択と言えます。

 

例の利得表で考えると、

行動dの利得の最小値は 2 ←最大値

行動bの利得の最小値は 2 ←最大値

行動sの利得の最小値は 0

行動cの利得の最小値は 1

以上より、この基準での(利得に関する)最適な行動は行動d,行動bとなります。

 

マックス・マックス(ミニ・ミニ)基準

ミニ・マックス(マックス・ミニ)基準の下での意思決定とは逆に、非常にポジティブな意思決定の方法です。

意思決定者にとって最良の状態が実現すると仮定して意思決定を行います。

利得を考えるなら利得の最大値が最も大きくなる行動を、費用であれば損失の最小値が最も小さくなる行動を選択します。

 

例の利得表では、

行動dの利得の最大値は 8

行動bの利得の最大値は 5

行動sの利得の最大値は 8

行動cの利得の最大値は 10 ←最大値

以上より、利得についてこの基準の下での最適な行動は行動cとなります。

 

ハーウィツ基準

ミニ・マックス基準とマックス・マックス基準との折衷案にあたる意思決定の方法です。

この2つの基準に相対的な重み α (0 ≦ α ≦ 1) を加えて、その和を最大にするような行動を選択します。

このαの値は意思決定者が自ら決めます。αの値は意思決定者の悲観度合い(楽観度合い)を示す指標とも言えます。

式で表すとこんな感じ。

α × ( [利得の最小値] ) + (1 - α) × ( [利得の最大値] )

これの値が最も大きくなる行動を選択する、ということです。費用・損失の場合はその逆。

αの値が0ならマックス・マックス(ミニ・ミニ)基準と一致し、1であればミニ・マックス基準と一致します。

 

α=0.7として、最適行動を考えると

行動dについて

0.7 × 2 + 0.3 × 8 = 3.8 ←最大値

行動bについて

0.7 × 2 + 0.3 × 5 = 2.9

行動sについて

0.7 × 0 + 0.3 × 8 = 2.4

行動cについて

0.7 × 1 + 0.3 × 10 = 3.7

 

以上より、この基準での最適な行動は行動dとなります。

 

サベージュのミニ・マックス落胆基準

各状態から得られる最良の結果と、実現した結果の差落胆(regret)と定義します。

この落胆を結果(費用)とみなして、ミニ・マックス基準で行動を選択する基準をサベージュのミニ・マックス落胆基準と呼びます。

落胆の値は、誤った結果を取ったことの費用と考えることができます。

各状態をi,各行動をaとして、元の表の結果が

  • 利得ならば R(a,i) =( [ 結果(a,i)の最大値 ] ) - ( [ 各結果(a,i) ] )
  • 損失ならば R(a,i) = ( [ 各結果(a,i) ] ) - ( [ 結果(a,i)の最小値] )

を落胆と定義します。

R(a,i)が元の表からそれぞれ求められるので、この値からミニ・マックス基準での最適な

行動を選択します。

例の表から落胆をそれぞれ求めた表は次の通り。

落胆表(OR入門 意思決定の基礎 P89より数値を引用、若干改変)
行動\状態 A B C D R(a,i)の最大値
d 8 (=10-2) 2 (=5-3) 0 (=4-4) 0 (=8-8) 8
b 7 (=10 -3) 0 (=5-5) 0 (=4-4) 6 (=8-2) 7
s 2 (=10-8) 0 (=5-5) 2 (=4-2) 8 (=8-0) 8
c 0 (=10-10) 2 (=5-3) 3 (=4-1) 7 (=8-1) 7

 

説明だけではわかりにくいと思うので、それぞれの値の計算式を添えました。

R(a,i)の最大値が最小になるように行動の選択を行うので、この基準の下での最適な行動は、行動bまたは行動cとなります。

 

意思決定の基準で最適行動が変わる

これまでの例で見てきた通り、それぞれの意思決定の基準で最適な行動が変わります。

どの基準を設定するのかは、意思決定者の好みや価値観、置かれている環境により変化します。

なので、実際に活用する際は意思決定者が自ら「どの基準を採用するか」を判断しなければなりません。

 

参考文献

OR入門 意思決定の基礎

OR入門 意思決定の基礎

 

大体これに書いてあることと一緒です。ちょっとはわかりやすく書けてるといいな。

 

あとシンプレックス法がちんぷんかんぷんなので誰か助けてください。1000円以内ならご飯おごります。