INFORMATION
サブスクリプション
NLP4L 0.6.0 リリースのお知らせ
お客様各位
平素はお引き立てを賜り、ありがとうございます。
NLP4L 0.6.0 をリリースしましたのでお知らせします。
NLP4LはNatural Language Processing for Luceneの頭文字をとって命名された、Lucene/Solrのための自然言語処理パッケージです。
NLP4LはLuceneインデックスのデータを単語単位で整理されたコーパスとみなして活用することで、次のねらいを達成いたします。
- Lucene/Solrの基本検索のF値(精度と再現率を同時に評価する指標)を向上します。
- Lucene/Solrの応用検索(もしかして、サジェスト、レコメンド、クラスタリング等)の精度や利便性を向上します。
- Lucene/Solrの運用コストを低減します。
- Luceneインデックスのデータをコーパスとみなすので、追加投資が不要です。お客様が現在保有している文書データの能力を最大限引き出します。
NLP4Lの今回のリリースでは、過去のリリースの不具合修正に加え、弊社が独自に収集したコーパスを学習したモデルファイルとそのモデルを使った絞り込み検索軸の検出機能をご提供します。この機能を用いることで絞り込み検索軸に乏しいWordやPDFファイルなどの非構造化データを擬似的に構造化できるようになり、Solrのファセット/絞り込み検索の機能をよりいっそう活用できるようになります。
この機能についての詳しい説明は、今後公開するWeb記事またはマニュアルをご覧ください。
NLP4Lがお客様の文書データの能力を引き出し、検索精度の向上やお客様のWebサイトの利便性向上に役立てば幸いです。
今後ともよろしくお願い申し上げます。
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!