クロールすべし - PageRank計算
RubyのMechanize、Hpricotを使ってクローラを書いている。とりあえず1000とか10000オーダーのデータを、Schemeで書いたPageRank計算のプログラムに入れるとどうなるか、どのくらいの時間がかかるのかを見るのが目的。
クローラのバックエンドにgdbmを使って書いたけど、どうもそこがボトルネックになっている?時々動作が非常に遅くなることがある。MySQLは今回のクローラにはオーバースペックだし。TokyoCabinetが軽量でいいらしいが、明日TokyoCabinetを使ってみようか。