Ludia,Postgresql

来源:互联网 发布:比特币 编程语言 编辑:程序博客网 时间:2024/06/01 09:08
Ludia

PostgreSQLに高速・高精度な全文検索機能を追加

  • PostgreSQLに完全に統合
  • 非常に高速、かつ高品質な全文検索を実現
  • ミッションクリティカルな文書管理を提供
  • フルオープンソースによるTOC削減の達成
【図】サービスイメージ

■サービスイメージ

本ソフトウェアはPostgresForest Suiteの構成要素となっています。 PostgresForest Suiteに関する詳しい内容は下記サイトをご覧下さい。 PostgresForest Suite紹介ページ

概要

Ludiaは、オープンソースソフトウェア(OSS)のDBMSであるPostgreSQLに、高速かつ高精度な全文検索機能を提供するソフトウェアです。 LudiaはPostgreSQLのテーブル内のテキストデータに対する全文検索インデックスを作成し、高速かつ高精度な全文検索機能を、PostgreSQLの通常のインデックスと共通のインタフェースから利用できるようにします。

【図】概要図

■概要図

特徴

Ludiaは以下のような特徴をもっています。

(1)PostgreSQLに完全に統合:
PostgreSQLの既存のインデックス機能と同等のインタフェースで全文検索が可能です。テーブルにレコードの追加、更新、削除を行った際は、インデックス側の情報も自動的に更新されますので、全文検索インデックスの存在を意識する必要はありません。
(2)非常に高速な全文検索を実現:
LIKE文と異なり前方一致以外での検索の場合でもインデックスを利用した高速な検索を行うことができます。
(3)高い検索品質を実現:
与えられた文章と似た内容の文章の検索(類似文書検索)や、文字列に含まれる複数の語が、近傍に含まれる文書の検索(近傍位置検索)を可能とします。
(4)フルオープンソースによる導入コストの削減:
Ludiaは、必要とするライブラリの全てがOSSで構成される、フルOSSの全文検索機能です。そのため、導入にあたってはライセンスコストを必要としません。
(5)スコアを利用したクエリ文:
全文検索エンジンの検索スコア(検索内容との合致度)をクエリ中で取得し、フィルタ条件やソート条件として使用することができます。

ダウンロード

ダウンロード手順:
Ludiaの依存モジュールを含むアーカイブと、 含まないアーカイブの二種類を用意しております。 (注) ダウンロードし解凍後、READMEをまずお読みください。
アーカイブは下記URLからダウンロードしてください。
  • http://sourceforge.jp/projects/ludia/外部サイトを別ウインドウで開きます
動作環境:
以下の環境で動作確認をしています。
  • OS:RedHat Enterprise Linux AS[ES] 4
  • データベースサーバ:PostgreSQL 8.2.3 (8.1.8)
  • Senna:1.0.1
  • MeCab:0.93

(注) Linuxは、Linus Torvalds氏の米国およびその他の国における登録商標または商標 です。 その他、記載されている会社名、製品名は、各社の登録商標または商標です。

******************************************************************************

词素解析引擎: http://mecab.sourceforge.net/

MeCabは 京都大学情報学研究科−日本電信電話株式会社コミュニケーション科学基礎研究所 共同研究ユニットプロジェクトを通じて開発されたオープンソース 形態素解析エンジンです

******************************************************************************

最好的方法是参考官方文档:

下面的这些地址也不错:
PostGres 全文检索
    多个列,能够分辨词语的全文检索包Ludia(日语)     Ludia
 1 )C#から形態素解析器のMeCabを呼び出してみた  2   http://mitc.xrea.jp/diary/044  3   http://d.hatena.ne.jp/Syo-Takasaki/searchdiary?word=*%5BDebian%5D  4   http://plot.cocolog-nifty.com/plotless/2006/06/utf8postgresql__5f3a.html  5   http://chasen.org/~taku/blog/archives/2007/06/yahoomecab.html  6   7 http://ludia.sourceforge.jp/cgi-bin/moin.cgi/BuildOnWindows  8 http://ludia.sourceforge.jp/moin.cgi/  9 https://sourceforge.jp/projects/ludia/files/ 10  11 ludia blog 12 http://www.doblog.com/weblog/myblog/74336 13 確認 14 http://blog.mj-site.net/2006/10/ludia.html 15  16 高性能なオープンソース全文検索システム「Ludia」 17 [ThinkIT] 第1回:蓄積したデータを徹底活用~全文検索 (1/3) 18 http://www.thinkit.co.jp/free/article/0612/8/1/ 19  20 http://d.hatena.ne.jp/tasukuchan/20061016 21  22 http://d.hatena.ne.jp/tasukuchan/searchdiary?word=%2a%5bSenna%5d 23  24 Ludia 簡易テスト 25 http://blog.mj-site.net/2006/10/ludia.html 26  27 ludia + postgresql で全文検索! 28 http://blog.bbtune.com/items/0000987.html 29  30 uchiuchiyamaのブックマーク / postgresql 31 http://b.hatena.ne.jp/uchiuchiyama/postgresql/?mode=detail 32  33 ■■■Ludiaの多彩な検索機能の秘密 QUERYの書き方 34 http://www.thinkit.co.jp/free/article/0612/8/5/ 35   SELECT txt FROM tbl WHERE txt @@ 'こんにちは さようなら'; 36   SELECT txt FROM tbl WHERE txt @@ 'こんにちは OR さようなら'37   SELECT txt FROM tbl WHERE txt @@ 'こんにちは + さようなら'; 38   SELECT txt FROM tbl WHERE txt @@ 'こんにちは - さようなら'; 39  40   「こんにちは + さようなら」での場合  41   「こんにちは」で検索して得られた結果から「さようなら」を含まないものを除外す る。  42   「こんにちは - さようなら」の場合  43   「こんにちは」で検索して得られた結果から「さようなら」を含むものを除外する。  44  45 ■■■PostgreSQL/Ludia/Senna の全文検索インデックスとクエリプラン  46 http://kawa.at.webry.info/200610/article_9.html 47  48 ■■■★★★★★2007-11-08 配列型インデックス 49 http://d.hatena.ne.jp/ludia/
<script type="text/javascript"><!--google_ad_client = "pub-5873492303276472";/* 728x15, 创建于 08-7-29 */google_ad_slot = "7630759450";google_ad_width = 728;google_ad_height = 15;//--></script><script type="text/javascript"src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script><script type="text/javascript"><!--google_ad_client = "pub-5873492303276472";/* 728x90, 创建于 08-7-29 */google_ad_slot = "7502041044";google_ad_width = 728;google_ad_height = 90;//--></script><script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>