リファラーランキングとエントリーのアクセスランキング
2007年8月4日追記:
現在、エントリーランキングのみの運営となっております。
このエントリーランキングは、トップページやエントリー一覧、月別日別アーカイブを除いた純然たるパーマネントリンクへのアクセスのみ、カウントしておりますので、厳密に言えば正確なランキングではありません。
また、当サイトはトップページやRSS系ファイルへのアクセスが高比率である事も付記します。
更に、携帯コンテンツでは同一エントリーでも別URLとなっておりますので、正確さを尚一層妨げているところなんでもありまする♪ てへ。
先日来、公開したままで放置していたランキングものは、幾つかの保留点を残したままですが一応は完成しましたのでこのエントリーをもって発表と申しますか、ご説明エントリーをしますです。
■リファラーランキング(画像右)
当サイトはMovableTypeのトラックバック機能を削除しております。 それほどトラックバックがあるとも思えないサイトではありますが、それよりも(蹴られるものですが)スパム的なトラックバックがありまして、取り敢えず該当cgiにアクセスされますとサーバに負荷が掛かります。 そこで当該cgiを削除し、代わりに設置したのがこのランキングです。
これはAWStatのログを流用し、再構成したもので、リファラー(アクセス元)のランキングです。
出来る限りサーバへの負荷を軽減させるべく、アクセスの多いリファラーは予めHoF(殿堂入り)と称してカウントの対象外にしてます。 また、ランキングされる事の多いだろうアクセス元に関しては、「偽キャッシュ」をしております。 数週間このスクリプトを回した結果、リストされる対象が判りましたので、本来であればアクセス元からページタイトルを取得するところを無視して当方で勝手に決定しておりますので、ローテーションで必ずしもアクセス元にアクセスし直してページタイトルを取得するような事はしておりません。 この件、本来であればしっかりとしたキャッシュをするべきなんでしょうけれど、スクリプトの公開を断念しましたので結構安易なやり取りとなってます。 これは今後、ちゃんとスクリプトを書いてキャッシュさせたいと考えてます。
蛇足ですが、下のスクリプトに対してこのスクリプトは4倍位リスト生成に時間が掛かります。 ベンチマークで調べてみたら、原因が判りましたんで、早急に対処します。
■エントリーランキング(左)
当サイトでアクセスの多いエントリーのランキングを上記スクリプトのオマケとして作りました。 が、その後上記スクリプトであれこれ変更をしましたんで、結局設計的な部分では別モノになってしまったです。
これも元ネタはAWStatのログであります。 当サイトではAWstatのログ書き出しを1時間毎にしておりまして、そのログを元にこれら2つのスクリプトを出力させているのですが、上のスクリプトよりかはフォーマットは安定しておりますのでシンプルな内容になってます。 且つ、差別化を図る為に、上位10エントリー限定としてます。 いやぁ、こういうループって逆にスクリプトを書くのが大変なんだな、って思いました。




