#8's notebook

適当めも

機会を逃すことのコスト、不利な機会であっても回避したくないときもある

'Subjective costs drive overly patient foraging strategies in rats on an intertemporal foraging task' Wikenheiser AM et al., PNAS 2013

 

ラットが円形の回廊型チャンバーを同じ方向に回りながら、目の前のオプションを消費するか通過するか意思決定していく。オプションはShort, medium, longの3種類で、それぞれペレット(2粒)が出てくるまでの遅延時間が異なる。セッション内では各オプションのdelayは同じだが、どれも長めのセッション、どれも短めのセッションもあり、どれも短いときは得られる報酬の最大値も大きくなる(環境がRichである)。

一定のセッション時間内で得られるペレットを最大化するには、ラットはShortだけ消費して他は全部スルーするべきなのだが、実際の行動をみるとmediumもかなりの割合で消費し、longですらそこそこ受け入れている。これは得られる報酬を最大化するRate maximization戦略では説明不可能な結果であった。ではラットはどのような理論に基づいた戦略をとっていたのか?

この行動結果、既存のmatching lawやhyperbolic model (temporal discounting)では説明できない。なので、稼いだペレットの量そのものだけで行動の理由を説明するのは難しそう。

そこで、Rate maxmization戦略に加えて、目の前のオプションを消費せず通過するリジェクトコストを考え、リジェクト回避傾向を示す係数'A'を含む項を導入したところ、Aを0より大きくすることで実際の行動を説明可能となった。つまり、いくら待ち時間の長い不利なオプションといえ、通過してしまうのはためらわれるという気持ちがあり(A>0)、それなりにアクセプトしてしまうのだ。

これは恐らく、自然界的な逐次選択課題だからこそ強く起こることである。目の前のオプションは不利なものだけど、さっきもスルーしちゃったし…という気持ちになるからである。頼み事をされて、あまり乗り気じゃなくても、何度も断るのは悪いと思って引き受ける心理も似ているかもしれない。

この、リジェクト回避係数Aは、機会コストと正の相関を示す。すなわち、環境がRichであるとき(オプションが全部短めで、得られるペレットの最大値が大きいとき)には、リジェクトが少なく、不利なオプションも消費する確率が高い(=獲得する報酬量の獲得可能な報酬の最大値に対する割合Rは低い)。遅延が短いオプションばかりのセッションで、ゆとりがあると判断すると、ラットは不利なオプションも消費する。これは、経済的に余裕のある人は遊び心があり、余裕のない人がカツカツしていることにも通じるのかもしれない。余裕のない人はとりあえず必要最低限を満たす必要があるため、経済的に不合理なオプションはガンガン拒否し、Rate maximizationにより近づくとも言える。

環境のRichnessがリジェクト回避傾向に影響するというのは、その環境(セッション)における経験、すなわち行動と報酬獲得の履歴が、リジェクト回避傾向に影響しているとも言えそうだ。ぽんぽんと順調にペレットを獲得しているときはリジェクト回避せず、長い遅延を待ってやっとペレットを得るということを繰り返すとリジェクト回避するようになる。つらみが蓄積してもういやだという感じになるようでもあるし、貧乏人が細かい時間や時給を気にするのにも似てる。ともかく、環境はリジェクト回避傾向に影響するのは確かなようだ。先に挙げた例のように、環境というのを、貧乏or金持ちのような状態stateと考えても良いのかもしれない。

逐次的な選択で不利な選択を行うということでいうと、サンクコスト効果なども関連があるかもしれない。不利な投資とわかっていても、リジェクト回避傾向Aが十分に大きいと、投資を行ってしまう。

環境がAに影響することはわかったが、どのようなformulationでAが計算されるかは不明だ。先に挙げたように、行動および報酬獲得の履歴がどのようにAに影響するのか。

 

まとまらない。この話は、たぶんいろいろと考えるべきことがある。

例えば、同じ装置を使って、各オプションをギャンブルオプションにしたら、どうなるだろう。確実なオプション以外はスルーすべきように設定しても、やはりラットはリスキーなオプションにもトライするかもしれない。そもそも、リスキーであるということは、たとえば10%のオプションであれば、100%のオプションと比べれば、10倍の時間をかけてやっと1つ報酬を得られるわけだから、報酬遅延時間と同様のスキームで考えてもよいかもしれない。となれば、このリジェクト回避傾向Aはリスク選択の傾向とも関連があるかもしれない。ゆとりがある人はちょっとリスキーであってもやってみるし、カツカツな人はリスクを避ける。これは別の記事で話題にした社会経済の論文の内容とも合致する。

 

 

 

 

 

 

 

 

 

貧困の心理

'Some Consequences of Having Too Little' Shah AK et al., Science, 2012

'On the psychology of poverty' Haushofer J et al., Science, 2014

サイエンス誌の貧困に関する社会心理スタディーから。これまで貧困というのは社会制度の問題でしょう、と捉えられることが多く、また貧困から抜け出せないのは本人のやる気の問題でしょう、と切り捨てられることが多かったのだけど、必ずしもそれだけではないという考えが少しずつ出てきている。なぜ貧困に陥るのか、なぜ社会制度を充実させることがすべての人を救えないのか、そして何をすべきなのか、ここに挙げたような心理学的側面に加え、今後は神経科学的な側面、つまり脳内情報処理機構の変容や神経伝達物質動態なども含めて検討が進められるべきだろう。

まず一本目、これは貧困に伴うScarcityという状態そのものが注意のアロケーションを変化させる可能性を検討したもの。貧困から抜けられない理由として、一般的な考えとしてはそもそもアタマの悪い(不合理な傾向のある)人が貧困に陥るのだとか、情報へのアクセスが制限されてしまうことなどが挙げられるが、そうではない純粋な環境による影響を検討したものである。

貧乏な人は、日々の食費、家賃などを重視せざるを得ない。遠い将来のことを考える余裕はなく、利率が悪くても手続きが楽なローン(Short-term, high-interest)を組みがちである。これは貧乏人に限った話ではなく、今週いっぱいの締切に原稿を間に合わせるために来週のレクチャーの準備をおろそかにしてしまうようなものだ。実際、この研究では被験者をランダムに貧乏人群と金持ち群に振り分け、仮想のお金を渡し、それでやりくりする中でのお金の使い方、借金の様子を調べており、これらの事象をまさに再現している。

続いて2本目であるが、こちらも同様に貧困による心理学的変化が経済行動を変化させ、貧困からの脱出を困難にしている可能性を検討している。1本目とは少し違う観点から、貧困によるストレス、マイナス思考が注意力の減衰、目標指向的な行動の低下、近視眼的(Short-sighted)行動、リスク回避行動などに繋がると結論している。ストレスが影響因子である証拠として、コルチゾル投与における時間割引課題の成績変化を検討している。

貧困の問題は従来言われてきた通り社会的側面が非常に強く、また個々の教育歴や知的水準に問題がある場合も多い。一方で、貧困という環境へ身体が順応してしまうことそのものが問題となっていることも、事実としてあるだろう。

以前コンビニで買った本で、日雇い労働を1か月体験してみたという潜入ルポものがあった。そこで著者は、わずか数週間の間に、今日や明日の泊まるところはどうするか、どれだけ安く食べるかなど注意するべき方向性が変わり、外見などの体裁は徐々に気にならなくなるような注意のアロケーションの変化を体験したようである。また、同じ人と継続的に働くわけではないので熟慮的なコミュニケーションが減少し、相手を見下したり乱暴な言葉を吐くことも増えたようだった。建設的な人間関係を構築することは不可能で、当然ストレスも蓄積される。こういった変化は、まさに社会的に不可逆な変容を起こし、たとえば行政に頼る、職業訓練を自発的に受けるといったことを難しくしてしまう。 

何もしないことの苦痛

'Just think: The challenges of the disengaged mind' Wilson TD et al., Science, 2014

「何もしないでただ考え事をしていて」と言って静かな部屋に1人放置。後でこれがどれだけ苦痛だったか点数をつけてもらうと、電気ショックを受けたりするようなときより苦痛が強かった、という研究。

放置は苦痛。ドMが放置プレイを好むのと同じことだ。

これまでの報酬系の実験では、「何もしない条件」はニュートラル条件であったのだけど、それがある程度の長さであれば、じつは被験者はかなり苦痛を感じている。ということは、そういう実験はじつは主観的にはきちんとコントロールできてなくて、結果も鵜呑みにすべきではないのかもしれない。

そして、「何も刺激がない」ことが主観的な苦痛を「生み出す」仕組みは、一体何なんだろう??

シンプルだけど示唆深い。

 

 

将来の世代に協力するゲーム理論課題

'Cooperating with the future' Hauser OP et al., Nature, 2014

この研究では新しいゲーム課題であるIntergenerational Goods Game (IGG)を用いた実験が紹介されている。このゲームの最大の特徴は、自分の振る舞いが次の世代への更新、すなわちゲームの持続性に影響するということである。

IGGでは5人1組のグループ(generation)が形成され、各々が100ユニット入りのプールから自分が欲しい分を同時にリクエストする。5人のリクエストの合計がプールから差し引かれるが、ここで引かれる分が予め参加者に伝えられている基準(T)を超えなければ、プールは再び満タン(100ユニット)に戻され、更新率(δ)に基づいて新しいgenerationに移行する。たとえば、プールがはじめ100ユニットで、T=50%、δ=0.8であった場合、各generationの取り分が1人あたり10ユニット以下であれば、80%の確率でgenerationが更新され続ける。しかし、利己的なエージェントが自分だけ20ユニット取る、などすれば、そこでgenerationの更新はストップする。実際、特に制約のない条件(unregulated)では、generationの更新はほとんど起こらない。

この"generation"は、まさに世代を意味する。次の世代に自分が含まれる確率というのは、たとえば10年後に生きているかどうかというようなことに対応すると考えられる。

ここで、民主主義的な選挙(voting)を取り入れ、generationのメンバー5人の提案した値の中央値を全員の取り分とするというルールを導入する。すると、世代の更新はほぼ完璧に起こることとなる。

このvotingが有効な理由の1つは、次の世代を考えるpro-socialなエージェントが多数派であれば利己的なエージェントをマスクしてしまうことが出来るためであり、個々が独立して意思決定を行う場合に比べてより少ない協力的エージェント数でゲームの持続性を高められるということである。そしてもう1つは、中央値ルールによって他を出し抜く必要がなくなり、そういう人がいるのでは、という懐疑的、競争的な心理を抑制することである。これにより、協力的なメンバー(仕方なく?)の人数そのものが増加する。

メンバー5人のうち3人だけにvotingを行わせ、他2人は独立に配分を決めるpartial-votingでは、持続性は極めて低くなった。これは京都議定書などの効力の弱さを説明する可能性があり、包括的な仕組みが必要であることを支持する。

現行generationにおける協力コストとなるTの値、そして世代更新率のδの値をそれぞれ低くすると、限定的ではあるがvoting ruleがあっても持続性は低下した。著者らはこの効果についてはあまり多くを述べていないが、これらは貧しい社会、将来に希望を持てない社会に於いては民主主義的な決定が必ずしも持続性を高める決定をしないことを示唆している。

反社会的傾向の人格障害などでこれらのパラメータを操作した場合のゲーム成績、神経活動相関などを調べるような仕事も出てくるかもしれない。

 

 

時間のイリュージョン


Dan Gilbert: The psychology of your future self ...

これおもしろかった。「過去」と「将来」のイリュージョン。

「過去10年で考え方や価値観が変わったか?」と聞かれれば、みんな「大きく変わった」と答える。でも、「今から10年後に価値観は変わると思うか?」と聞かれると、「それほど変わらない」と答える。

将来のことはわからないのが当たり前なのだが、どうも「わからない」と答えるのではなく、「変わらないと予想」するらしい。そしてもちろんこれは間違いで、その証拠に10歳年上の人たちはみんな「大きく変わった」と答えているのである。

言われてみれば確かに、そういうこともあるのかもしれない。現在の自分は今まで紆余曲折を経て辿り着いた最終形で、大きくは変わらないのだと信じてしまいがちである。

10年前の自分が今の自分の考え、価値観、人間関係などを予測できなかったのと同様に、恐らく今の自分も10年後の自分を予測できないし、変わらないことはほとんど有り得ない。

しかしもしかしたら、こうして変わらないと信じてしまうイリュージョンによって、今この瞬間の出来事にしっかり向き合えるのかもしれないな。

 

 

はじめてみる

ここ数年、ツイッターばかりやっていたせいで長文を書くのがかなり苦手になってきた気がする。なのでまたブログでも書いてみる。

 

<方針>

メイン用途は、自分のための勉強したこと気付いたことメモ。特別ウケは狙わず、余計な時間をかけず。

なにかと面倒だから匿名で。

飽きたら放置するたぶん。

 

こんな感じかしらね。