Friday, December 28, 2012

マルコフ行列の中の著者達 Part 2 (2): どの著者がもっとも人々に影響を与えたのか? 実験編


実験

実験に用いたデータを表 1 に示す.幸い,どの Wikipedia にも各言語の作家のリストが存在したので,そのリストを Root page として直接リンクされている作家の page を download した.Download に際しては 15 秒に 1 pageのスピードで download し,サーバへの負担にならないように注意した.ここで利用したWikipedia のページのうち,日本語の「石原慎太郎」は例外的にファイルが圧縮されていたため,実験においては展開して利用した.Root page に関しては,他にも候補はあったが,表 1 にあるものを利用した.例えば,ドイツ語 Wikipedia におけ英語の著者として,Liste_englischsprachiger_Schriftsteller ではなく,Liste_britischer_Schriftsteller を利用している.これは私が任意に選んだだけであって,こちらでなくてはいけないという理由はない.なお,実験に使用したファイルは全て 2012-5-30 に download したものである.

Table 1: Experimental data set.

No comments:

Post a Comment