INFORMATION
テクノロジ

Apache Lucene 8.10.0 が公開されました!

Apache Lucene 8.10.0 が 2021 年 9 月 29 日に公開されました。

Apache Lucene は完全に Java で書かれたハイパフォーマンスな全文検索エンジンです。
今回行われた主なアップデート内容を以下に記します。

主なアップデート – 新機能

  • Multi-valuedフィールドで数値範囲のファセットカウントがサポートされました。
  • Telugu語のAnalyzerが追加されました。
  • IndexCommitからオープンされたNRT Readerがその葉でソート可能になりました。
  • SimpleTextコーデックはそのPostingsリストでスキッピングをサポートしました。

主なアップデート – 最適化

  • ファセットの性能改善を行いました。
  • RegexpQueryのReDos攻撃の発見を改善しました。以前まで発見できなかった風変わりな表現も発見できるようになり、その場合はTooComplexToDeterminizeException例外をスローします。
  • 接頭辞や接尾辞のオートマトン計算の性能を改善しました。
  • フィールドのストアデータの取得性能を改善しました。
  • 多くのユニークフィールドがある場合の、IndexWriterのメモリ消費を改善しました。
  • forceMergeがどんなセグメント数でも一度にマージできるようになりました。これにより、多くのケースでマージが速くなります。
  • docvaluesストレージの圧縮を改善しました。

リリースの詳細と Lucene ダウンロードについて

すべての新機能および変更点に関しては CHANGES.txt を参照してください。 https://lucene.apache.org/core/8_10_0/changes/Changes.html

現在の最新の Lucene ダウンロードについては下記 URL を参照して下さい。 https://lucene.apache.org/core/downloads.html


KandaSearch

KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。

  • セマンティックサーチ

    人間が理解するように検索エンジンがテキストや画像を理解して検索できます。

  • クローラー

    検索対象文書を収集するWebクローラーが使えます。

  • 簡単操作のUIと豊富なライブラリー

    検索や辞書UIに加え、定義済み専門用語辞書/類義語辞書やプラグインがあります。

  • ローコードで低コスト導入

    検索UIで使い勝手を調整した後、Webアプリケーションを自動生成できます。

セミナー

企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!