[Reference:<_A88@freyasx.ML_>]
Newsgroups: mail-lists.freyasx
[FreyaSX] Re: FreyaSX action=URL
ysato> | 見た感じなので申し訳無いのですが、<form action="..."> 形式の
ysato> |URL にも GET に行っているような感じで、これが不必要なデータを作り出し
ysato> |ているようです(見間違えだったらすみません)。
ysato> そうですね。メソッドはGETになっています。これはオリジナルFreyaのものを
ysato> 受け継いでいるわけですが、HTTPのログとして検索条件が残るという点で
ysato> 良いと思っています。また、CGIとして動作するfreyasx.cgi でも、GETしか
ysato> 実装してありません(POSTを実装するのは簡単ではありますが)
ysato> ところで、作り出される、不必要なデータとは何でしょうか?
ysato> メソッドがGETであるとことと、関係があるのでしょうか?
(内部使用なもので)あまり良い cgi ではないのですが、その form
で入力された情報をファイルか DB に記録しているようです。で、変数の情報
が無く、起動だけされているので、空情報を追加したようです。ですので、検
索と言うよりは、情報入力用の form です。
メソッドは、本来 POST のようなので、cgi で判定してエラーにすれ
ば良いのかもしれませんが、古いシステムもあったりしますので。
ysato> | これは、そういう仕様でしょうか。仕様だとすると、逆にこれを禁止
ysato> |する方法はありますでしょうか。例えば *.cgi や /cgi-bin/... へのアクセ
ysato> |スは禁止するというようなものでも構わないのですが。
ysato> これは、fsearch.cgi 以外へのアクセスを禁止、という意味でしょうか?
ysato> これと、メソッドがGETであることとの関係は、あるのでしょうか?
言葉足らずですみません。
今回の場合、FreyaSX は他機に置いています。
何らかの実行をするような cgi は起動したくないのです。とは言え、
普通に Link しているものは仕方無いのですが、form の action を追うのは
禁止できないかと。
また、今回の場合は、なんらかの実行をするような cgi の出力は、
は検索対象から外しても良いかと思えます。
検索をかけたいサーバが古いものなので、メソッド GET なら無視し
ろと言う話は、今更、ちょっと言えない状態です(GET で動かしている form
もあるかもしれません)。
ysato> | それと、数台の機器に跨って href で Link しているような部分もあ
ysato> |り、範囲を限定して、その先までデータを取りたいのです。
ysato> |REACHABLE="*.domain" みたいな設定は可能でしょうか。その場合、どこに、
ysato> |どのように書くのが正しい作法でしょうか。
ysato> any2fdif で、指定されたURLの下位から外へのリンクをたどるオプションと
ysato> しては、実験的に、ホップ数を指定する -hN というのがあり、たとえば -h1
ysato> とすると、一段階たどります。でも、非常に実験的なもので、自分では
ysato> 実用には使っていません。
了解です。ありがとうございます。試してみます。
# action=URL の件を何とかしないと、また苦情が出るので駄目なので
# すが…
できたら、「特定ドメイン範囲のみ」という REACHABLE を指定した
いのですが。
ysato> あらかじめ索引化する対象のURLが決まっているならば、
ysato>
ysato> any2fdif idxname -r URL1 URL2 URL3 ...
ysato>
ysato> のように明示的に指定するのが、今のところの方法かなと思います。
URL1 は決まっているのですが、そこから他機に Link する際、トッ
プには行っておらず、特定のディレクトリ下を指しています。それを抜き出し
て行くのも大変なので、せっかく再帰的(?)に渡り歩いてくれるなら、任せた
いのです。
--
Yes, I'm in panic.
Shinichi Maruyama (pc4aabth4-fsnuzucmistw.ml@delegate.org)
|