Fess の設定で気付いたこと
私は複数所持する自分のウェブサイトを横断検索したり、ローカルファイルの検索で Fess を使っている。
オープンソース全文検索サーバー
Fess
https://fess.codelibs.org/ja/
最近、検索対象のウェブサイトをいくつか Fess に追加登録した。その際に気付いたことをメモしておく。
環境:macOS Catalina Version 10.15.6(英語環境)
(1)「Fess の管理画面>ウェブクロール設定>クロール対象とする URL 」は、リンクとしてたどれる URL を記入する。
対象ページのディレクトリ構造は関係ない。
検索対象に入れたいページは、そのリンク元ページを「クロール対象とする URL」に書かなければいけないということだ。
(2)「Fess の管理画面>ウェブクロール設定」に書く URL は // は NG。
URL のパスは、/ のところを // としてもサイト自体にはアクセスできる。しかし、Fess に登録する URL は正しく / でなければいけない。
(3)ディレクトリ名に半角スペースが含まれる場合、インデックスが作成されなかった。
URL の指定で半角スペース部分を %20 としたり、あるいはそのまま半角スペースにしたりしてもダメだった。
Fess の管理画面で「クローラー>パスマッピング」で、\u0020 -> %20 のように登録してもうまくいかず。
これに関して解決策は見つけていない。
参考:
パスマッピング
https://fess.codelibs.org/ja/13.12/admin/pathmap-guide.html
パスマッピングで文字をエスケープさせる方法 - Japanese:Fess - CodeLIbs Forum
https://discuss.codelibs.org/t/topic/338