Thursday, September 27, 2012

マルコフ行列の中の著者達: どの著者がもっとも人々に影響を与えたのか? (5)

グラフとは何か

グラフとは複数の点を複数の辺で接続したものである.辺で接続された点間には何らかの関係があるとする.いくつかの点がある場合のグラフの例を図 4 に示した.図 4 では,点1(\(N_1\)) と 点2(\(N_2\))を結ぶ辺を\(E_{1,2}\)と書いた.グラフは点の接続関係のみを気にするので,どのように描かれているかには関係がない.図 5 は全て同じグラフを示している.

Figure 4. Edges connect nodes.

Figure 5. The same graphs. Graph only cares the connections between nodes.

次回はグラフの例を示そう.

Monday, September 24, 2012

マルコフ行列の中の著者達: どの著者がもっとも人々に影響を与えたのか? (4)


グラフ理論入門

数学には多数の object 間の関係を扱うグラフ理論という分野がある.私はこのグラフ理論を著者間の関係を示す方法として利用することを考えた.この方法そのものは別に新しい方法ではなく,様々な分野で用いられている.今回ここでやってみようと思ったのはその対象,著者間の関係,というものがどういうことになっているか趣味として個人的な興味で知りたかったからである.

グラフの基本 Object

グラフ理論には2つの基本的なオブジェクトが登場する.「点」と「辺」である.点が辺でつながっているものをグラフと呼ぶ.2つの点が辺でつながるということはそれらの点が関係しているという意味である.

図 1 にこのオブジェクトを図示する.グラフ理論ではこの二つのものを考える.この2つしかないと思うと簡単なように見えるかもしれないが,なかなかそうではない.

Figure 1. Node and Edge

通常,点は複数存在する.複数の点を区別するために図2のように番号をつけることが多い.しかし実際は区別さえつけばよいので番号でなくてもかまわない.しかし番号はものごとを区別するのに便利なので良く利用される.
Figure 2. To distinguish different nodes, put the numbers on them.
ところで図3 に示すように辺には有向辺と無向辺がある.これは向きが有るか無いかの区別である.関係には一方向的なものもあれば双方向のものもあるからである.たとえば,過去の人物は現在の人物に影響を与えることはできるが,現在の人物が今から過去の人物に影響を与えることはできないので,そのような関係は一方向的である.
Figure 3. Directed and undirected edge.
今回はグラフ理論の登場人物を紹介した.それは点と線である.ここまでは簡単だと思う.次回はグラフとは何か示そう.

Sunday, September 23, 2012

何々に「等しい」と言ってもらえる?


まず子供にお願いしているのは,
Kannst du ,,gleich'' sagen?
(何々に「等しい」と言ってもらえるかな?)
である.これは,
 Eins plus zwei ist drei.
 (一足す二は三.)
と言う子供が多いからである.もちろんわかっていれば問題ないのだが,この言い方では 1 + 2 = 3 をわかっているのかどうか不明だからである.そこで,
Eins plus zwei (ist) gleich drei.
(一足す二は三に等しい.)
と言うようにお願いしている.でも強制すると子供達は算数が嫌いになってしまう.だから時々お願いするだけである.算数が嫌いになってしまっては正しいも間違いも意味がない.

ところで,この違いをどれだけの大人がわかっているのかふと考えてみて同僚に尋ねてみたが,同僚は数学を使って生計をたてているような人達だから皆知っている.

私はこれを次のように説明している.この説明で子供達は納得しているようなのだが,それでも gleich を忘れる子供は多いので確信はない.
7 は 2 + 5 に等しいです.
2 + 5 は 7 に等しいです.これはどちらも正しい.
私は日本人です.
でも日本人は私だけではありません.
ですから,「私は日本人に等しい.」ではありませんし,「日本人は私に等しい.」でもありません.
私は 160 cm です.
でも 160 cm は私ではありません.
ですから,「私は160 cm に等しい.」でも「160cm は私に等しい.」ではありません.
等しいものは交換できます.
ist (は)と gleich (に等しい)は同じではありません.
今のところ,等しい(gleich)という概念を私は交換できる(austauschbar)というふうに説明している.数やお金,長さではこの説明でもなんとかなるが,二次式(面積など)がでてきたら困ったことになる.実際,(確か)ギリシャでは x * x = x は不可能な計算として考えられていた.なぜなら左辺は正方形の面積を示し,右辺は長さを示すと考えられていたからである.どうしたら面積と長さを交換できるのだろうか? そう考えると等しいという概念を教えるのも難しい.しかし最初のステップとしては時が来るまでこのモデルで良いだろう.

私の場合,先生(私が)が正しいドイツ語を話せないのだから,先生がいつも正しいということは思わないと期待しよう.先生がいつも正しい思うのはちょっと問題である.先生はだいたい正しいが,時々間違う,位に思ってもらえれば嬉しい.

どうやって子供の学びを助けられるのか


私は数学や計算機を面白いものと思っている.しかし何故それが面白いのかとなると考えてしまう.個々に面白い例は思いつくが,どうしてそれらが面白いのだろうか.子供達は数学をどう考えているのだろうか.もしそれらの一部でも理解できれば,子供達を助けることができるのではないだろうかと考えている.したがって,私はこのクラスで教えるというよりも,子供達がどう考えるかについて学びたいと思っている.人は数学をどう考えているのかを学んでいるようなものである.

人工知能は私の興味を持っているテーマの一つである.したがって,人間の知能というものがどのように発達するのかに私は興味を持っている.子供達は言葉を覚え,数を覚え,論理的な思考を学び,知能を発展させていく.私もその過程を経たはずなのだが,いったいどうやって数というものを学んだのか,いったいどうやって言葉を最初に学んだのか忘れてしまった.

そこで子供達に教えてもらおうと思っているのだが,子供達にどう考えているのかを教えてもらうのは簡単ではない.子供達自身にもわかっているのかどうかわからないのかもしれない.

私はまずは子供達が様々な入力にどう反応するかを観察している.あまり良い例えが見当たらないのだが,ある意味,子供が頭の内に持っているモデルのバグをみつけるようなものである.たとえば,特定の入力に対して答えられない子供や,特定のパターンの間違いをする子供というものに出会う.すると私は考える.どのような理解の方法がこのような間違いを生みだすのだろうか? と.これは思ったよりも簡単なことではない.しかしとても面白い.これは私の仮説にすぎないのだが,私自身の理解の方法でもあるので,上手くいって欲しいと思っている.つまり私が教室でやっているのは次のようなループ: 子供を観察する,子供の考えを学ぶ,どんなモデルか考える,教えてみる,教えることに失敗する,再び子供を観察する,の繰り返しである.

ここではそういう例をいくつか記録していこうと思う.

Hasenschule の算数お助け人


最近 Hasenschule (http://www.hasenschule.de/) という学校で子供達に算数を教えることを学びはじめた.週に二度から四度,それぞれ一時間のレッスンである.ボランティア活動であり,無給である.(ただし,ときどきお菓子をもらえる.)ここで私が学んだ興味あることを時々 Blog として書いておこうと思う.

Hasenschule は端的に言えば,通常の学校の授業にはついていけない子供達に読み書き算数を教える学校の一つである.私は子供達に算数や理科を教えることに興味を持っており,友人の助けを借りて以下のような page を探しているうちにこの学校の活動に興味を持ち,gute-tat を通じて Mathe-Helfer として参加させてもらうことになった.このような活動は Berlin にはいくつもあるので興味ある方は以下の Page から探してみられるのが良いだろう.私の授業はドイツ語であるが,私は正しいドイツ語を話すことができないのが問題である.Hasenschule では 8 歳から 10 歳の子供に読み書きを教えているので,そのコースを取るべきかもしれない.

Wednesday, September 19, 2012

マルコフ行列の中の著者達: どの著者がもっとも人々に影響を与えたのか? (3)


問題: 著者の影響を解析する (2)

私は影響の大きさや内容ということはとりあえず忘れ,関係のあるなしから全体への影響の大きさを考えるという方法から始めることにする.幸い,このような関係のあるなしを基礎にしている数学の理論や,実際に利用されてきた方法がある.その方法とはグラフ理論と線形代数という数学を使うものである.この方法は長年の間多岐に渡って利用されてきた.Web の時代になり,Web page間の関係を知るためにも用いられている.影響力の大きなPage は興味ある Pageであるだろうから,サーチの結果の上位に示せば探している Page をみつけやすいだろうということで,どのように影響力の大きな Pageを求めるかが考えられてきた.

おそらく現在最も利用されている手法は,Web page の影響力を,Web page 間が関係しているかいないか,つまりリンクは張られているかいないか,だけをもとにして計算する方法であろう.この方法は Web page の内容はまったく理解せずに影響力を考えることができる方法であり,画期的であった.この方法はGoogleという会社が初めて Web page のサーチの基準として用いたことで有名である[bib:pagerank].内容を理解しなくても良いということで,どの言語でも,どの分野でも利用可能であり,自動化が可能である.人間が内容を元にランクをつけた方が精度は良い可能性は高いが,何千,何万という計算機を使って自動で行えるという方法は人間よりも高速で安価であり,人間がランクを決めていた方式にたちまちとってかわった.

Web に応用する手法は特に PageRankと呼ばれているが,その基礎には線形代数の固有値問題がある.

ここではまずグラフ理論を概観し,それを実際の著者間の影響を計算する方法として応用してみる.

というわけで次回はグラフ理論入門である.

Monday, September 17, 2012

マルコフ行列の中の著者達: どの著者がもっとも人々に影響を与えたのか? (2)


問題: 著者の影響を解析する (1)

まずは問題は何かについて考えてみたい.

私の友人がある著者が他の著者に与えた影響を解析する方法はあるかと私に尋ねた.たとえば,「Shakespeare が他の英文学の著者の与えた影響の大きさを数値化することはできるだろうか.」という疑問である.

どの著作が正統であるか,というようなものに関しては昔から議論がなされてきたそうである.たとえば,http://en.wikipedia.org/wiki/Western_canon を参照されたい.しかし,これはある特定の人物なり団体がこれらの著作が正統であると定めたものであり,様々な議論の対象となってきた.正統なものの中での何らかの順位付けということになるとますます議論は複雑になり,結果として「何が芸術か」という問題になるととても私の手には負えない.

何が正しいのかわからないのであれば,最初の取りかかりとして,私がこうであると定義してしまってもかまわないかもしれない.しかし,それは私個人の好みを示しているに過ぎない.もう少し一般化して多数の人間の好みを調査することでどの著作が影響力が強いかということを示すことはできるかもしれない.人に好まれる本というものは,本が出版された数に関係すると仮定すれば最も多数出版された本が最も影響力の強い本ということになるだろう.ただし,私の聞いたところによると最も多く出版されてきた本は IKEAのカタログ (http://en.wikipedia.org/wiki/Ikea_catalogue) か Bible かという話であり,IKEA のカタログが文学に最も影響を与えたというのはどうも直感に合わないような気がする.IKEA のカタログは文学ではないというかもしれないが,どこから文学でどこから文学ではないというのも考えていくと難しい.出版数ではなく,売れた数を考えるという方法もあるが,新聞や雑誌の売上と影響力は関係はあるかもしれないが,それを基準に使えるかは難しい議論になる.

問題は簡単ではなさそうだ.どこから手をつけようか迷う.

Thursday, September 13, 2012

マルコフ行列の中の著者達: どの著者がもっとも人々に影響を与えたのか? (1)

はじめに

文学に関して研究している私の友人が私に著者間の関係を解析するにはどうするのかと尋ねた.私は著者間の関係をグラフで示すことができれば,eigenanalysis が行なえると答えた.この手法は,Google が Web page 間の関係を 解析するのに利用している PageRank という手法と同じである.私はこの問題を Computational literature の問題としてしてとらえ,興味を持ったので,これに関していくつかの実験をしてみた.

しばらくこの blog ではこのテーマについて書いてみたいと思う.