namazuのオプション

2.0.6あたりから、mknmzで環境変数LANGまたはオプションに文字コードを指定しないと分かち書きがまともに認識されないとのこと。

http://www.namazu.org/doc/tutorial.html#japanese

#!/bin/sh
/usr/local/namazu/bin/mknmz \
--indexing-lang=ja_JP.SJIS \
--robots \
--allow='.*.html|.*.htm|.*.pdf' \
--deny='.*test.*' \
--exclude="/home/foobar/public_html/test/.*" \
--output-dir=/home/foobar/namazu \
/home/foobar/public_html

その後、以下のようにすること。

  1. 一度mknmzしてしまったのならデータベースをすべて削除。
  2. 上記スクリプトで再度作成。
  3. 検索のテスト