INFORMATION
テクノロジ

Apache Lucene Eurocon 2011に参加しました

Apache Lucene Eurocon 2011に参加してきました。

Apache Lucene Eurocon はLucene/Solrのカンファレンスです。
今回はバルセロナで開かれ、10/19-10/20と2日間にわたり様々なセッションが行われました。

■Apache Lucene Eurocon 2011

各国からおよそ300人が集まり、3つの会議場でLucene/Solrの開発者やLucene/Solrを利用する企業ユーザによるセッションがそれぞれ行われました。
Lucene/Solrに関しては、開発者から次バージョンの4.0の新機能に関する説明が行われました。 全般的には4.0の機能として、Flexible indexingとNear Realtime Searchがキーワードでした。今後使用してみたい機能が多く紹介されていたと思います。以下、主なセッションをご紹介します。(クリックするとスライドを見ることができます。)

Luceneに関しては、インデクシングやサーチでの改良点があげられています。
共通してFlexAPIおよびCodecレイヤの紹介がありました。
■Improved Search with Lucene 4
■Lucene Today, Tomorrow & Beyond
■Heavy Committing: Flexible Indexing in Lucene 4

Solrに関しては、新機能として新しいスペルチェッカーのDirectSpellChecker、 ニアリアルタイムサーチを実現するNRT、新しい分散機能を実現するSolrCloudの紹介がありました。
■Solr 4 Highlights
■The Many Facets of Apache Solr

企業ユーザ事例のセッションに関しては、Solr+hadoop事例、SolrCloud事例、twitter(Lucene)事例などがありました。 会場ではどれも満席で立ち見が発生し多くの人が興味を持っていることがわかります。
■Scaling Search at Trovit with Solr & Hadoop
■Using Solr Cloud, For Real!
■Realtime Search at Twitter

ManifoldCFに関しては、Solrと連携してセキュリティを考慮した検索に関する説明が行われました。 ■Securing Documents in Solr with Manifold CF

私としては、Lucene/Solrの近い将来実現される新しい機能が魅力的であることを実感したのはもちろんですが、一方でManifoldCFの主要開発者のKarl Wright氏に初めてお会いし、 ManifoldCFの細い仕様の話や現在の状況を聞くことができ大変役立ちました。 普段はメーリングリストでやりとりしますが、 直接会って話を聞くとだいぶ違いがありました。 途中、私の環境でのテストを依頼される機会があり、セッションを聞きながらテストしたりといったどたばたがありましたが面白かったです。
またKarl氏経由でLucene/Solr開発者とも会うことができ、Lucene/Solrの理解をより一層深めていきたいと思いました。(ロンウイット 阿部)


KandaSearch

KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。

  • セマンティックサーチ

    人間が理解するように検索エンジンがテキストや画像を理解して検索できます。

  • クローラー

    検索対象文書を収集するWebクローラーが使えます。

  • 簡単操作のUIと豊富なライブラリー

    検索や辞書UIに加え、定義済み専門用語辞書/類義語辞書やプラグインがあります。

  • ローコードで低コスト導入

    検索UIで使い勝手を調整した後、Webアプリケーションを自動生成できます。

セミナー

企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!