過去ログ検索の技術的なメモ
【経緯】
2020年1月25日 過去ログ検索を復活(Unicode版msearchを導入)
2019年4月20日 サイトの標準的な文字コードを「Shift_JIS」から「UTF-8」形式に変更。古いCGIで実行されていた検索フォームで文字化けが発生するようになり、結果的に過去ログ検索フォームの運用を休止。
【メリット】
・これまでのGrep検索(都度全文ソート)から、インデックス検索(すでにインデックス化されたテキストデータをGrep検索)に移行したため、検索スピードが大幅に向上した。
【デメリット】
・検索結果が常に最新の情報である保証はない。管理者がインデックスを更新しない場合、利用者は新しく追加されたページや変更された記述を検索することができない(原理的にはGoogle検索と同じ)。
【免責事項】
・管理者は不定期にインデックスを更新するよう努めるが、常に最新の情報をインデックスする義務は負わない。
その2:「Grep型」に変更
【経緯】
2022年1月14日 過去ログ検索をGrep型に再度変更(UTF-8に対応したWwwSearch 4.0を導入)
【メリット】
・検索結果が常に最新。インデックス更新の手間がかからない。
【デメリット】
・特になし(数万ページあるわけではなく、「過去ログ」だけの検索のため。またサーバーが高速化しているため)
【免責事項】
・検索機能を使用するにあたっての責は負わない。