楽しいログウォッチ

何回見られたのかが非常に気になるのか、多くのホームページには訪問回数を示すアクセスカウンターがついている。あ、わしのとこもやんけ。
カウンターにもいろんなのがあって、同じページを同じ人が何回のぞいても数字が変わらない物もあれば、ページが表示されるたびに数字が増えていったり、ひどい物ではカウンターが回りっぱなしで止まらない物や、「戻る」ボタンを使っても脱出不可能になっていてカウンターの数字だけが増えていくものもある。得てしてこういったページは中身が乏しい。


でも、カウンターだけではそれが設置されているページを見に来た回数しかわからない。アクセスカウンターは、意外にもか~なりいい加減なものだった。
現在、研究室のサーバーを間借りして動いているこのWebサイトだが、HTTPデーモンというものによって動いている。そこいら辺に無料で出回っているものだそうだが、アクセスカウンターよりは格段と正確な情報を4つのファイルに分けて残してくれている。
・何処から来た人が、どのページを見たかを記録する「access_log」
・ページのアドレスの入力間違いなどのエラーを記録する「error_log」
・見に来た人が使っているブラウザーの種類や、サーチエンジンの情報収集ロボットの種類を記録する「agent_log」
・どのページにあるリンクをたどって来たかを記録する「refferer_log」
これらのログは、Webサイトを見に来た側のコンピューターと、見られるWebサイトの置いてあるサーバーの間で、必ずやりとりする事になっている「コンピューター同士の会話(交渉)」をそれが行われた時刻と共に記録したものである。コンピューター同士の交渉が成立して初めてホームページを覗けるようになっている。
やっていることは、はがきを出す際に送り先と送り主の住所氏名をかいて、ポストに入れるのと同じようなもんなんです。
こうしてできていくログファイルは、ページが見られるごとにどんどん増えて行く。よーく見られるホームページになると、1日で何メガ・何十メガバイトというように楽々と増えていく。てなわけで研究室のサーバーでは、ある程度日数が経過したログをディスクスペース確保のため捨てている。
私のWebサイトも、アクセスがある度に記録が残るのだが、私自身このことを知ったのはつい最近だったりする(あれれ?去年まで1年間ほどどっかのWebサイトの管理人をやっていたのにな~)。世の中の大多数の人は、ホームページを見に来る度に詳細な記録が残されていることを知らないだろう。
とはいえ、これは決して「とんでもないこと・恐ろしいこと」では全然なくて、普段はWebサーバーの管理人が、コンピューターを犯罪などに悪用されないための対策を立てる資料として使っているくらいだ。アクセスログから個人の思想信条なども大まかに見当がつくそうなのだが、それを悪用するような人は、まず管理人の仕事をやらせてもらえない。せいぜいでどっかの大手ソフト企業に就職できるくらいか?
しかし、アクセスログをのぞいてみると、実にいろんなことがわかる。どのコーナーがよく見られているかといったことから、見に来た人のおおまかな職種までわかってしまう。まさに宝箱だ。
というわけで私も研究室のサーバーの管理人に頼み込んで、自分のサイトのアクセス情報を取っておいてもらうようにしてもらった。
しかし、本格的に「こんぴうたぁ」を触り初めて間もないわたしのことなので、できることはたかが知れて・・・知られてしまっている。ハッカーのみなさんがやっているよ~なことをするだけの技術も知識もありませ~ん♪
とりあえず大ざっぱではありますが、できる範囲内で自分のWebサイトについて分かったことを御報告いたしマスです。はい。
『アクセス総数』
サイト内の各コーナーについて、1週間のアクセスは合計で約30000弱ほどあった。これはHTMLファイルのみの数字なので、GIF等の画像ファイルも含めると、約1.5倍になりそうだ。以下に出てくるアクセス数も、HTMLファイルのみの数である。
『乱筆御免のアクセス状況』
一番見に来る人が多いかな~と思っていたこの「乱筆御免」だが、アクセスはそれほど多くもなくて、週に300ほど。見に来る人は常連さんが多いようで、新着ページの登場直後のアクセスが多い。全コーナーの中で2番目の多さだった。
『プロフィールへのアクセス』
ついこの間始めたばかりで、扱いも小さい「いい加減なプロフィール」のコーナーだが、意外にも他のコーナーに負けず劣らず多い。そんなに私のことを知ってどうするつもりなのだろう?
『最多アクセスのコーナー』
最もアクセスの多かったコーナーは、意外にも「CDMAうわっ!!」であった。アクセス数も、ダントツの3000強である。このコーナーを見に来る人は、コーナーの中のすべてのページを残さずみーんな見ていく人が多いようだ。もうすぐ始まる「cdmaOne(新型携帯電話)」の影響かもしれない。大したことは書いていないのになぁ~。
ということで「CDMAうわっ!!」へのアクセス記録を詳しく見てみると・・・
・大学・企業などで通信分野の研究に携わっていると思われる人たち(ac.jpドメインや、NEC、富士通、Densoなど)
・CDMA方式に手を伸ばしている電話会社の社員とおぼしき人たち(○○-cellular.co.jp、docomo-○○.co.jpなど)
がアクセスの大黒柱の一部となっていることが分かった。なぜ「一部」なのかというと、もう一つアクセスの大黒柱となっていた人たちがいたのだ。
自らを「電話廃人」と呼ぶ、携帯電話マニアのみなさんである。こんな人たちもいたのか~ってことに最近気づき、驚いている。試しに「CDMA」をキーに検索をかけてみたら、「電話廃人」といった言葉を冠したホームページがかなり釣り上がった。
そういえば、ここんとこ「CDMAうわっ!!」への問い合わせがよく来るようになったなどと感じていたのだが、そのことをアクセスログはきっちり知っていたのである。
アクセスログ一つでわたしのような初心者にもここまでわかってしまうんだから、恐ろしい。
アクセスログがある程度たまってきたら、どのコーナーがよく見られているかなどを集計してみようかなどと考えている。どのページがよく見られているかがある程度わかれば、ホームページ造りの際の大まかな参考にはなるだろう。たぶん。
モテる秘訣もこのようにして手に入ればいいんだけどな~。
Rec/Mix:1999-2-4