INFORMATION
テクノロジ

Apache Lucene 7.0.0 が公開されました!

Apache Lucene 7.0.0 が 2017 年 9 月 20 日に公開されました。

Apache Lucene は完全に Java で書かれたハイパフォーマンスな全文検索エンジンです。今回行われた主なアップデート内容を以下に記します。

主なアップデート – バグ修正,最適化,機能強化

  • インデクシング時にSegmentInfosにLuceneのメジャーバージョンを記録するよう改善されました
  • LeafReader.getMetaDataでインデックス作成時のLuceneのバージョンを取得できるように改善されました
  • マルチスレッドでドキュメントの削除、docValuesの更新が可能になりました
  • 疎なdocValuesフィールド保存時のストレージ効率が向上しました
  • index-timeブーストの廃止に伴い、高精度なノルム値(length normalization factor)を実現しました(くわしくはhttp://lucene.jugem.jp/?eid=485を参照)
  • Automatonで正規表現の再帰処理を行う場合の上限を設定可能になりました
  • ICUNormalizer2CharFilterに存在したstack overflowを起こしうる箇所を修正しました
  • IndexWriterに不正なtoken offsetをセットできないように修正しました

リリースの詳細と Lucene ダウンロードについて

すべての新機能および変更点に関しては CHANGES.txt を参照してください。 https://lucene.apache.org/core/7_0_0/changes/Changes.html

現在の最新の Lucene ダウンロードについては下記 URL を参照して下さい。 http://lucene.apache.org/core/mirrors-core-latest-redir.html


KandaSearch

KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。

  • セマンティックサーチ

    人間が理解するように検索エンジンがテキストや画像を理解して検索できます。

  • クローラー

    検索対象文書を収集するWebクローラーが使えます。

  • 簡単操作のUIと豊富なライブラリー

    検索や辞書UIに加え、定義済み専門用語辞書/類義語辞書やプラグインがあります。

  • ローコードで低コスト導入

    検索UIで使い勝手を調整した後、Webアプリケーションを自動生成できます。

セミナー

企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!