PostgreSQL用の全文検索エンジン 「Ludia」
※技術的な話です。
NTTデータがPostgreSQL用の、高速かつ高精度な全文検索機能を提供する
オープンソースな検索エンジン
「Ludia」
を10/11に公開したようです。
Ludiaは、オープンソースソフトウェア(OSS)のDBMSであるPostgreSQLに、高速かつ高精度な全文検索機能を提供するソフトウェアです。
LudiaはPostgreSQLのテーブル内のテキストデータに対する全文検索インデックスを作成し、高速かつ高精度な全文検索機能を、PostgreSQLの通常のインデックスと共通のインタフェースから利用できるようにします。
特徴は、
(1)PostgreSQLに完全に統合:
PostgreSQLの既存のインデックス機能と同等のインタフェースで全文検索が可能です。テーブルにレコードの追加、更新、削除を行った際は、インデックス側の情報も自動的に更新されますので、全文検索インデックスの存在を意識する必要はありません。
(2)非常に高速な全文検索を実現:
LIKE文と異なり前方一致以外での検索の場合でもインデックスを利用した高速な検索を行うことができます。
(3)高い検索品質を実現:
与えられた文章と似た内容の文章の検索(類似文書検索)や、文字列に含まれる複数の語が、近傍に含まれる文書の検索(近傍位置検索)を可能とします。
(4)フルオープンソースによる導入コストの削減:
Ludiaは、必要とするライブラリの全てがOSSで構成される、フルOSSの全文検索機能です。そのため、導入にあたってはライセンスコストを必要としません。
(5)スコアを利用したクエリ文:
全文検索エンジンの検索スコア(検索内容との合致度)をクエリ中で取得し、フィルタ条件やソート条件として使用することができます。
全文検索のインデックス作成には、MySQL用の全文検索エンジンとして有名な、「Senna」が利用されているようです。

これは、結構人気でそうですね。
日本人は、PostgreSQL好き多いからなぁーーー(俺も)
時間があったら早速試しに使ってみたい!!
About this entry
You’re currently reading “PostgreSQL用の全文検索エンジン 「Ludia」,” an entry on Mj-site Blog
- Published:
- 10.12.06 / 12pm
- Category:
- Ludia, PostgreSQL
No comments
Jump to comment form | comments rss [?]