Dangling Linksを除去すべし - PageRank計算
研究室のプログラミング課題で、PageRankの計算をやっている。
最終的には、研究室にある分散環境を使ってそれなりの量のWebページのデータを使ったPageRankを計算することが目標だけど、とりあえずはPageRankのアルゴリズムをちゃんと実装できていることを確かめるためにSchemeで書いたプロトタイプで実験中。その課程で、dangling links(リンクが1つもないページへのリンク)を除去すると論文に書いてあってなんでだろと思っていた謎がとけた。PageRankを計算するiterationの中で、リンクが1つも出てないページに伝播したPageRankの値はどこにも伝播されずに失われてしまうのであった。