更新内容: Googleによる当サイトへの推定巡回日のデータを追加 -2001/9/8-10/30
コンテンツが増えすぎてサイト内を探し回るのに時間がかかるようになったときに便利なのがサイト内検索です。当サイトも本日よりこのサイト内検索機能を追加しました。そのついでに利用する際に気がついた点をまとめたのがこのコラムです。
- どのような方法があるのか?
- 専用の検索エンジンを利用する方法
お金に余裕のあるサイトなら専用の検索エンジンを使う方法があります。検索開始と同時にリンクをたどると時間がかかるためあらかじめリストを作っておけば検索する時間は短くなるようですが、個人のサイトの場合はここまでやる人はいないと思います。
- CGIを使う方法
掲示板やいろいろな双方向的なコンテンツを作ることが出来るCGIですが、残念ながら当サイトでは使えません。これからプロバイダーを探す人はプロバイダーエクスプローラーなどで、CGIが使用可能かどうかあらかじめ確認して置いた方が良さそうです。
- Javaスクリプトを利用する方法
Javaであればブラウザが古くなければ利用できます。そこで、このJavaを使ったサイト内検索を利用することにしました。
- Javaを使ったサイト内検索のしくみ
Javaを使ったサイト内検索と言っても実際やっていることはそのサイトにしか無いキーワードを追加してAND検索をしているだけです。当サイトではそのキーワードとしてURLの一部を利用しています。Googleで”愛情”というキーワードで検索すると78万8千件のページが引っかかります。この言葉とさっきの当サイトのキーワードにあたる”geocities
Bookend-Kenji/7219/"の両方を含むサイトを検索すると12件に絞られます。残った12件はすべて当サイト内のページになります。
Javaを使えばあらかじめそのキーワード”geocities Bookend-Kenji/7219/
"を用意して置くことが出来ます。そして最後にスペースを置くことでアンド検索(両方のキーワードを含むページを検索)することができるようになります。
- なぜGoogleを利用するのか?
検索エンジンであればGoogleでなくてもgooでもinfoseekでもそれ以外のサイトで利用している検索エンジンでも良さそうですが理由は単純です。Googleがもっとも多く拾ってくれるからです。当サイトの殆どのページに使われている”xsunx”というキーワードを使って各検索サイトで検索を行うと検索サイト毎の検索ページ数は以下のような結果になります。(2001/8/1現在) リンクをクリックすると実際にその検索結果を確認することができます。
- HTMLへの貼り付け方
- ヘッダー部分
<HEAD>と</HEAD>の間に以下のスクリプトを挿入します
<SCRIPT>
<!--
function addstring() {
document.forms[0].q.value = 'geocities Bookend-Kenji/7219/ ' + document.forms[0].q.value;
return true;
}
// -->
</SCRIPT>
geocities Bookend-Kenji/7219/の部分にサイトに共通なキーワードを入れます。末尾にスペースを入れるのはAND検索を行うためです。
- 本文
<BODY>と</BODY>の間の置きたいところに挿入します。ページ作成ソフトなどではあらかじめ置きたい場所に★などを置き、HTMLソースの画面に切り替えてその★の代わりに以下のタグを置くようにすると便利です。
<FORM onsubmit="addstring()" action="http://www.google.com/search">
<INPUT type="hidden" name="hl" value="ja"><FONT
size="-1"><B>Googleを使ったサイト内検索</B></FONT><BR>
<INPUT type="text" name="q" size="31"
maxlength="256" value="">
<INPUT type="submit" name="btnG" value="検索">
</FORM>
- できあがり
- この方法の欠点と注意点など
- ロボット型検索エンジンの巡回周期
Googleに限らずロボット型検索エンジンはその巡回周期として1,2ヶ月かかるようです。従って最近更新した内容が検索されないことが多くなります。
- 本文のタイトルとヘッダーのタイトル
このページの場合、タイトルは”Googleを使ったサイト内検索の紹介”ですが、このタイトルはページ内のトップに太字で書いていますが、ブラウザの上部にも表示されています。ところがこの二つは別々にHTMLソースのなかに書かれています。この二つが食い違ってしまうことがよくあります。(当サイトの場合) この違いは検索エンジンで検索して、そのページを訪問した場合にすぐに分ってしまうためあまりスマートとは言えません。
■データ
- Googleによる当サイト推定巡回日と公開日
- 2001/08/06
- 2001/09/12(推定公開日09月29日)
- 2001/10/05(推定公開日10月30日)
■参考リンク
-2001/08/02 初版
-2001/09/08 更新
-2001/10/30 更新
■当サイトは全ページリンク・フリーです。連絡も要りません。
copyright(C) 2000-2001 xSUNx(サン) All rights reserved