統合情報理論実装 (cause の MIP まで) part1

Dec. 18, 2017, 3:12 p.m. edited Sept. 15, 2018, 4:50 p.m.

#情報理論  #意識 

twitter でも日常でもよく「統合情報理論だと...」とか言っているのにもかかわらず,どうやって \(\Phi\) が計算されているのか知らなかった.
そこで,まずは調べてみた.

元論文と統合情報理論(Integrated Information Theory; IIT)の批評の 2 つを主に参考にした.論文を読んでみると,現象的意識を対象にしている感じがした.最近は自分としても現象的意識は物理世界に影響しているように思えるようになってきたので,確かに IIT で扱えるのかもしれないとか考えながら読み進める.

公理とか出てきて納得したりしなかったりしながら,今回の目的は計算することであるので,まずはそこまで行って図が出てきた.


(出典: http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003588#pcbi-1003588-g006 の Figure 1. からの引用)

まあこれは納得できる.2 つの時刻の間の状態遷移を列挙しただけ.問題は Figure 3. であった.


(出典: http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003588#pcbi-1003588-g006 の Figure 3. からの引用)

これはどうやって計算するんだ.Google 電卓と格闘してようやく気づいた.距離が KL Divergence ではなくなっていた.どうやら 3.0 以前では KL Divergence を使っていたようだが 3.0 からは Earth Mover's Distance (EMD) を使うようになったそうで...ナニコレ.

ググる.というか批評の 3.0 以降の項と論文の Supporting Information の 1 つにあった.こうして例えば (B) は上の 111 から 0.125 をそれぞれの所に流すので,

$$\begin{eqnarray} ci(BCD^p|A^c=1)=0.125\times3+0.125\times2+0.125\times2+0.125\times1+0.125\times2+0.125\times1+0.125\times1+0.125\times0 \\ =0.125\times12=1.5\end{eqnarray}$$

となる.同様に,(C) でも下の 111 から 0.125/7 を流すので,

$$ci(BCD^p|A^c=0)=\frac{0.125}{7}\times3+...=\frac{0.125}{7}\times12=0.2142...\approx0.21$$

となる.あと,\(A^c\) の \(c\) は current を表していて,\(p\) は past,\(f\) は future を表す.加えて, \(ABC=100\) といった場合は A, B, C についてその条件を満たしていなければならないが,\(A=1\) であれば A のみその条件を満たしていれば他はどうでも良いということになる.

さて,さらに論文を進めるとついにネットワークの切断が出てくる.この概念によってどこが意識の単位であるべきかを議論できるようになる(と思っている)ので,読んでみた.


(出典: http://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003588#pcbi-1003588-g006 の Figure 6. からの引用)

なぜ,000 が成り立つんだ??? ということになった.このことはこの前の KCS の LT 会でも挙がったものだったが,これは中央下の図がわかりやすく,A, B から C へ向かうだけのネットワークでは 000 でも成り立つので,結果的に 2 つのネットワークを掛け合わせたもの(この表現がわからない.掛けるとゼロになりそうなのに...ゆえに実装したときは切断してできた 2 つのネットワークからそれぞれ得られた cause repertoire を足して,再び合計が 1 になるように正規化してみた)では 000 が成り立つようになる.そしてこの EMD が \(\varphi^{\rm MIP}_{\rm cause}\) となる.

続きはまた今度.