Newsgroups: mail-lists.freyasx
[FreyaSX] link: 検索機能の追加
観測史上最高の猛暑!みたいなのでうだり気味です。
freyasx@delegate.org への投稿テストも兼ねて。
--
さて、昨日、今年に入ってからの http://www.delegate.org のアクセスログ
から、Referer の URL を抜き出してみたところ、5,000件ほどありました
(自分自身や検索エンジンからのものは除いて)。
これをDeleGate経由でダウンロードしてキャッシュに入れて、メモ(5)で書い
た方法で索引にして検索してみたりしたのですが。どうもRefererのわりには
DeleGateに関係のないものが結構あります。(意図的に、ログ荒らし?とでも
いうのか、実際にはReferもしてないんだけど、エッチ系のページとかを
Refererとしてリクエスト送りまくってくるサイトがあって、それは予め除いて
はいるんですが)
そんなわけで、やっぱり「link:URL」による検索も欲しいなぁと思い、拡張
工事することにしました。オリジナルFreyaで「url:」や「author:」を実装
しているコードを探して何ヶ所か変更。
any2fdif も拡張して <LINKS>...</LINKS> というのを導入。
今回も楽勝かなぁとおもったらそうもいきませんでした。
fsearch で検索してみるとエラーが出て、検索が途中で失敗。。。どうも
テキスト位置からドキュメント番号へのマッピングがおかしいようで。。。
と思ったら、どうも fsearch をリコンパイルせずに試した模様。たぶん
make findex だけやったんでしょう。で、ちゃんとコンパイルしたら
fsearch -i cache link:delegate で、ちゃんと動いている模様。
さて次は fsearch.cgi だと思ったら、なんかものすごい勢いでエラーが。。。
なんだろうと思ったら、link: を拡張する前のプログラムだった(^^;
うだってました。結局楽勝でした。
ちょっとした変更なので、これを 0.96.2 としようかと思います。
--
今後「link:」の他にも拡張したくなったときのために、予備のフィールド
を作っておくべきか?それとも使わないフィールドのためにファイルが
大きくなるのはいかがなものか?使ってるフィールドだけ保存するように
できるか?もしそうなら、プログラムを書き換えずに自由に拡張できるような
仕組みを入れておきたい。
D G
┌─┐┬┌──┬┐ //\^^ ( - ); {Do the more with the less -- B. Fuller}
├─┤│└─┐│ / 877m\_< >_ <URL:http://www.delegate.org/delegate/>
┴ └┴──┘┴──────────────────────────────
佐藤豊@情報技術研究部門.産業技術総合研究所(独立行政法人)
|