メタ認知の感受性:meta-d’

投稿者: | 2017年7月18日

概要

  • 自分の判断を自分はどれだけ正しいと思っているか
  • メタ認知の感受性の指標meta-d’についての紹介
  • 前提知識となる信号検出理論のアイデアも含めてイラストで簡単に説明

メタ認知:自分で自分の正しさが分かるか?

認知とは、知覚から周囲の状況を把握することです。

例えば木の下にリンゴが転がっていることを見て、

「木からリンゴが落ちた」と分かることを言います。

 

メタ認知は認知の認知です。

なので、『「木からリンゴが落ちた」と分かったと自分は思っている』ことが分かります。

すると、自然に『自分は思っている』けど、これは正しいのか?という疑問がわきます。

このように、メタ認知は、自分の判断自身が正しいのかどうかに疑問を持つために必要な機能だと分かります。

 

面白いのは、

「木からリンゴが落ちた」のは本当か?

『「木からリンゴが落ちた」と分かったと自分は思っている』けど本当か?

はよく似ているようで、何か違いそうということです。

今回のお話は、まさに、この違いに注目していきます。

 

AかBか?

次のような簡単な設定を考えてみます。

Xさんの血液型はA型かB型である。

Xさんの掃除の頻度を聞いて、XさんがA型かB型かを当てたい。

周辺のA型の人、B型の人の掃除の頻度の分布は下の図のように表される。

図では、A型の人の方が掃除の頻度が高い人が多く、

B型の人の方が掃除の頻度が低い人が多いことを表しています。

例えば、毎日掃除をする人に注目すると、

A型の人は大勢の人が毎日掃除するのに対して、

B型の人で毎日掃除をする人はほとんどいません。

もちろん、これは説明のために用意した例なので、

実際の状況とは大きく異るかもしれません。

 

ともかく、上のような分布が与えられた時に、

Xさんは毎日掃除をする人だと分かると、

XさんはA型だと思うと当たってそうな気がします。

一方で、Xさんは月に1回しか掃除をしない人だと分かると、

逆にXさんはB型だという方が当たってそうです。

 

◯  妥当な答えは?

では、どこにA型とB型の堺があるのでしょうか。

つまり、Xさんがどの程度掃除をしていれば、

A型だと推定して良いのでしょうか。

 

一つの方法としては、確率の大きい方を選択するというものです。

これは、A型とB型の堺が下の図のようになります。

掃除の頻度が「週1」あたりでA型とB型の山がクロスしていて、

それより右の「毎日」などでは、A型の方が人数が多いので、

A型だと推定しておけば外れる確率よりは当たる確率の方が高くなります。

逆に、緑の破線より左の「月1」などでは、B型の方が人数が多くなり、

B型だと推定しておけば当たる確率の方が高くなります。

 

では、境界の決め方はこれでいいのでしょうか?

 

この決め方だとXさんが「週2」で掃除をすると聞くと、

「XさんはB型なんだね」と推定することになります。

それを聞いたXさんが実はA型だとすると、

もしかすると、気を悪くするかもしれません。

逆に、Xさんが実はB型で、週2で掃除をしていたとして、

「XさんはA型なんだね」と言われても、そんなに気を悪くしないかもしれません。

だとすると、境界はもう少し左に寄せていたほうがいいでしょう。

 

もちろん、逆に境界を右に寄せたほうがいい状況もあるかもしれません。

ここで大事なのは、どこに境界を置いたとしても間違うことは有り得て、

「B型をA型と推定する」間違いと、「A型をB型と推定する」間違いの

どちらを嫌うかで、境界は左右に動くということです。

 

◯ ROC 曲線:あちらをたてればこちらがたたず

上のようにA型とB型の境界は一つに決めることができません。

境界をずらすことで、間違えやすさが変わってきます。

 

この間違えやすさの違いをグラフで描くと下の図のようになります。

「B型をA型と間違えて推定する確率」が増えるに従って、

「A型をB型と間違えない確率」が増えます。

つまり、どちらかの間違えを抑えようとすると、

逆の間違えが増えるという関係にあります。

 

このグラフは ROC (Receiver Operator Characteristic) 曲線と呼ばれ、

判断の材料(ここでは掃除の頻度)から、

実際に判断を行うときの精度を表すために用いられます。

 

◯ d’ : 判断の容易さ

以上までの話から、単純に間違えを減らすことは難しいことが分かると思います。

なぜなら、「B型をA型と推定する」間違いは減らそうとすると、

「A型をB型と推定する」間違いが増えるように、

片方を減らすと、もう片方が増えるからです。

 

では、仮に両方の間違いが減るとしたら、

それはどのような状況でしょうか?

 

ROC曲線を描くと下の図ような状況になります。

つまり、「B型をA型と間違って推定する確率」が減り(グラフが左側へ)、

「A型をA型と正しく推定する確率」が増える(グラフが上側へ)というものです。

 

しかし、ROC曲線はどうすれば左上に動いてくれるのでしょうか。

ROC曲線は境界線をずらして描かれるものなので、

ROC曲線自体を動かすには、境界線で分断される分布自体が動かないといけません。

つまり、A型の分布の山とB型の分布の山が動かないといけないということです。

 

分布の山が動くと、山の重なり具合が変わってきます。

この時、山と山の距離 d’ に注目します。

このd’が大きいと、山は離れており、

A型とB型で掃除の頻度の違いが明確になります。

逆にd’が小さいと、山が重なってしまい、

掃除の頻度ではA型とB型の見分けがつかなくなります。

 

このようにd’は判断の容易さを表す値だと考えることができます。

つまり、間違いが少ない状況とはd’が大きい状況ということになります。

 

meta-d’:どのくらい自分で判断が正しいと思っているか?

判断が正しく行えるかどうかは、d’の大きさで分かります。

ところが、このd’はA型とB型の分布が分かっているからこそ計算できる値です。

実際に人が判断する時には、正確な分布が分かっているとは思えません。

それでは、メタ認知機能はどのように自分の判断が正しそうなのかを決めているのでしょうか?

 

◯ 頭の中の分布

A型、B型の正確な分布は分からないにしても、

これまでの経験から、おそらく分布はこうなっているだろうというイメージを持っていると考えられます。

これを、図で描くと下のようになります。

真の分布(青い靄をかけたもの)がどんなものか人は分かりませんが、

それまでに見てきた人の傾向から頭の中に思い描いたA型とB型の分布があると考えられます。

すると、この分布の距離d’に対応するものが、

その人が思っている自分の判断の正しさを表していると考えることができそうです。

 

ところが、いくつか課題があります。

まず頭の中で思い描いてる分布はきれいな山ではないかもしれません。

すると、山の頂点間の距離d’のような決め方ができないかもしれません。

また、そもそも、端から見ている人には、その人の頭の中で思い描いている分布は分かりません。

なのでその人の頭の中のd’のようなものがどうなっているかを算出しようにも、

そのままではできません。

 

◯ 頭の中の分布の推定

頭の中でA型とB型の分布がどうなっているかが分かれば、

その分布間の距離がその人が思っている自分の判断の正しさに対応していると考えられます。

実際に頭の中の分布を見ることはできないので、その人の行動から推定することが必要になります。

 

この時、推定された分布間の距離を「meta-d’」といい、

その人が自身の判断に対して思っている正確性の指標となります。

つまり、メタ認知の感受性の指標と言えます。

 

◯算出方法

それでは、どうやって頭の中の分布を推定するのでしょうか。

 

まず、頭の中の分布はきれいな山の形をしていない可能性があるのですが、

仮にきれいな山の形をしていたとしてどれが一番近いかで推定します。

 

下の図に、算出の概要を示します。

まず、対象となる人に、Xさん、Yさん、・・・について、A型かどうかの判断をしてもらいます。

その時、自分の判断についてどの程度確信を持っているかも答えてもらいます。

仮に、強く確信している時だけA型、そうでない時はB型と判断したとすると、

その正答率と、誤り率で左下の図に一つ点が打てます。

同じように、中くらいの確信を持ってればA型、それ以下ならB型と判断したとすると別の点が打てます。

このように、報告してもらった確信度で区切って判断を決めると、

正答率と誤り率のグラフ上に点が複数個打てます。

この点を使うと ROC 曲線が書けます。

 

次は、仮に分布が正規分布(分散は固定)だったとして、この ROC 曲線を描くためには、

正規分布間の距離はいくらならいいのかを推定します。

正確には、上で得られた複数個の点のもとで、正規分布間の距離のもっともらしさ(尤度)を計算し、

尤度が最大となるような正規分布間の距離がいくらなのかを推定します。

そして、この推定値をmeta-d’とするのです。

 

◯meta-d’の特徴

meta-d’はその人が頭の中で思っている分布間の距離なので、

実際の分布間の距離d’とは異なる可能性があります。

 

つまり、大きく分けて次の 3 つの状況が有り得ます。

  • meta-d’ = d’
  • meta-d’ < d’
  • meta-d’ > d’

 

meta-d’=d’ の状況は、実際の分布と同じ分布を頭の中に持っていると考えられるので、

判断に必要な情報を十分揃えた状態と言えます。

 

meta-d’ < d’ の状況は、実際の分布を知っていれば、より容易に判断ができるのに、

頭の中ではそこまでうまく判断できないと状況だと考えられます。

つまり、判断に必要な情報が十分に与えられていない状況だと言えます。

 

meta-d’ > d’ の状況は、実際の分布を知っている以上に、

正確な判断ができている状況だと考えられます。

そのため、「掃除の頻度」のような与えられた情報以上の情報を

活用して判断の正確性を向上させているなどの状況が考えられます。

参考

http://www.columbia.edu/~bsm2105/type2sdt/ (英語サイト)

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です