2008-04-15から1日間の記事一覧

クロールすべし - PageRank計算

RubyのMechanize、Hpricotを使ってクローラを書いている。とりあえず1000とか10000オーダーのデータを、Schemeで書いたPageRank計算のプログラムに入れるとどうなるか、どのくらいの時間がかかるのかを見るのが目的。クローラのバックエンドにgdbmを使って書…

Dangling Linksを除去すべし - PageRank計算

研究室のプログラミング課題で、PageRankの計算をやっている。最終的には、研究室にある分散環境を使ってそれなりの量のWebページのデータを使ったPageRankを計算することが目標だけど、とりあえずはPageRankのアルゴリズムをちゃんと実装できていることを確…