過去ログ検索の技術的なメモ

▲過去ログ


その1:「インデックス型」の導入

【経緯】
2020年1月25日 過去ログ検索を復活(Unicode版msearchを導入)
2019年4月20日 サイトの標準的な文字コードを「Shift_JIS」から「UTF-8」形式に変更。古いCGIで実行されていた検索フォームで文字化けが発生するようになり、結果的に過去ログ検索フォームの運用を休止。

【メリット】
・これまでのGrep検索(都度全文ソート)から、インデックス検索(すでにインデックス化されたテキストデータをGrep検索)に移行したため、検索スピードが大幅に向上した。

【デメリット】
・検索結果が常に最新の情報である保証はない。管理者がインデックスを更新しない場合、利用者は新しく追加されたページや変更された記述を検索することができない(原理的にはGoogle検索と同じ)。

【免責事項】
・管理者は不定期にインデックスを更新するよう努めるが、常に最新の情報をインデックスする義務は負わない。

その2:「Grep型」に変更

【経緯】

2022年1月14日 過去ログ検索をGrep型に再度変更(UTF-8に対応したWwwSearch 4.0を導入)

【メリット】
・検索結果が常に最新。インデックス更新の手間がかからない。

【デメリット】
・特になし(数万ページあるわけではなく、「過去ログ」だけの検索のため。またサーバーが高速化しているため)

【免責事項】
・検索機能を使用するにあたっての責は負わない。


▲過去ログ