[in English]
全文テキスト検索エンジン
フレイヤ
SX
{
}
Full Text Search Engine
[
ダウンロード
] [
インストール
] [
利用例
] [
意見交換
] [
開発メモ
]
Freya
SX
は Freya をベースに開発された検索エンジンです。
Freya
は、
原田昌紀さん
がその昔開発された全文テキスト検索エンジンです。
Freya
SX
は
産業技術総合研究所
において、
DeleGate
の作者が開発しています。
主に以下のような特徴があります:
C++ だけで実装されていて、索引ファイルの作成が高速です
Unix でも Windowsでも動作し、索引ファイルはポータブルです
N-gram 方式に基づいていて、(原理的には) 検索洩れがありません
文書データの収集・抽出・文字コード変換は、DeleGateで実現しています
ウェブブラウザ向けの(標準)インターフェイスは以下のような感じです↓
(「検索」ボタンを押してみて下さい)
English
使い方
admin
AND検索
OR検索
[
FreyaSX sx
|
選択
]
[
新しい順
|
スコア順
|
選択
] [
10
|
5
|
20
|
選択
] [
小
大
]
一行
リリース
ダウンロード
インストール手順と簡単な使用例
2006-07-18
FreyaSX-0.99.16
-- '_'で始まる語を索引化, 索引語の最短語長指定機能追加
2006-01-17
FreyaSX-0.99.15
-- 移植性関連バグフィックス
2006-01-15
FreyaSX-0.99.14
-- 日本語1文字の検索機能を追加
2005-10-11
FreyaSX-0.99.13
-- 複数検索語ハイライト,形態素辞書廃止,「^カタカナ」検索導入
2005-10-07
FreyaSX-0.99.12
-- 2ギガバイト超の索引を可能に
2004-09-18
FreyaSX-0.99.10
-- findexを日本語辞書無しでも実行可能に
2004-09-10
FreyaSX-0.99.9
-- any2fdifの拡張(URLダウンロード機能,変換フィルタ,ディレクトリ探索)
2004-09-05
FreyaSX-0.99.8
-- Windowsに移植
2004-09-02
FreyaSX-0.99.7
-- 文字化け等のバグ修正
2004-08-31
FreyaSX-0.99.6
-- 索引・文書詳細情報表示モード、索引ファイルのポータブル化 [索引ファイル非互換]
2004-08-28
FreyaSX-0.99.5
-- 選択計数機能、重複削除機能の追加 [索引ファイル非互換]
2004-08-22
FreyaSX-0.99.4
-- 投票機能、削除機能の追加 [索引ファイル非互換]
2004-08-21
FreyaSX-0.99.3
-- CGI検索出力の改良
2004-08-20
FreyaSX-0.99.2
-- 索引の作成・併合の高速化 [索引ファイル非互換]
2004-08-15
FreyaSX-0.99.1
-- CGI検索インターフェイスの改良
2004-08-12
FreyaSX-0.99.0
-- 検索結果の文脈表示の導入 [索引ファイル非互換]
2004-08-06
FreyaSX-0.98.2 -- ワイルドカード検索導入,フレーズ検索修理,他 [索引ファイル非互換]
2004-08-04
FreyaSX-0.98.1 -- 0.98.0でfmergeが動かなくなってたので直しました。
2004-08-03
FreyaSX-0.98.0
-- 索引ファイル大改造 [索引ファイル非互換]
2004-07-26
FreyaSX-0.97.1 -- ポインタの64ビット化 [索引ファイル非互換]
2004-07-24
FreyaSX-0.97
-- link:URL 検索の導入,他 [注意:これまでの版とは索引ファイルが非互換です]
2004-07-17 FreyaSX-0.96.1 -- ちょっと修正 (0.96配布直前のちょこっとした変更で混入したエラーを修正)
2004-07-16
FreyaSX-0.96
-- FreyaSX本体はちょっと修正・拡張。any2fdif は大幅に改良
2004-07-07
FreyaSX-0.95
-- とりあえず公開の初版
2004-06-23
FreyaSX-0.94
-- 公開以前、日付でのソート等の拡張後の状態
2004-06-17
FreyaSX-0.93
-- 公開以前、移植のみの状態(オリジナルインターフェイス)
意見交換
御意見箱
FreyaSXに関する情報を交換・公開するための場です。 freyasx@delegate.org へメールを送るとこの御意見箱に送られます。 Subject または本文に、Freya あるいは FreyaSX を含むようにして下さい。
(もし内容的に不適切と思われるものがあれば削除します)
御意見箱検索
(FreySXで御意見箱を検索します。 御意見箱に到着後一分以内に検索可能になります)
利用例
1. 以下の例では FreyaSX を使って、 DeleGateの2つのメーリングリストにまたがる検索を行っています。
English
使い方
admin
AND検索
OR検索
[
日英ML全体
|
選択
]
[
新しい順
|
スコア順
|
選択
] [
10
|
5
|
20
|
選択
] [
小
大
]
一行
"dgmlEn"は
英語版DeleGate-ML
(約2750件)の、 "dgmlJa"は
日本語版DeleGate-ML
(約12500件)の、 それぞれの索引です。 "dgmlEn+dgmlJa"を選んで検索すると、これら2つの索引をそれぞれに検索し、 併合してソートした結果を表示します。
これらメーリングリストへ新着記事が到着し次第(1分以内に)、 索引に加えられ検索可能になります。
2.
RFCの検索
はじめました (Aug.13)
拡張点
これまでのところ、FreyaSX では以下の変更・機能拡張・高速化を行いました。
イマドキのGcc(3.X)やVC++、マシン(MacOSX, Windows, ARM-Linux等)に対応
イマフウの検索に対応 (複数の索引の併合検索, 日付順表示, AND 検索をデフォルトに, リンク検索, 検索結果の文脈表示)
索引の作成・検索を、それぞれひとケタ高速化
カスタマイズ支援機能 (検索出力のテンプレート化、索引バンク)
形態素辞書を用いない、N-gram のみによる索引
開発メモ
(1) 2004年 7月
ことのなりゆき
(2) 2004年 7月
索引作成ひとケタ高速化達成(^_^)
(3) 2004年 7月
移植作業
(4) 2004年 7月
なんちゃって機能拡張
(5) 2004年 7月
利用例 -- プロキシのキャッシュ検索
(6) 2004年 8月
大改造 -- インデックス圧縮法の簡素化
(7) 2005年10月
独立行政法人問題でさらばパトリシア
(X) のべたんサーチ。をプロデュース(予定)
Yutaka Sato <y DOT sato AT delegate DOT org>