INFORMATION
サブスクリプション

NLP4L 0.5.0 リリースのお知らせ

お客様各位

平素はお引き立てを賜り、ありがとうございます。

この度、弊社サブスクリプション・パッケージの機能拡張として、NLP4L 0.5.0 をリリースしましたのでお知らせします。

NLP4LはNatural Language Processing for Luceneの頭文字をとって命名された、Lucene/Solrのための自然言語処理パッケージです。

NLP4LはLuceneインデックスのデータを単語単位で整理されたコーパスとみなして活用することで、次のねらいを達成いたします。

  • Lucene/Solrの基本検索のF値(精度と再現率を同時に評価する指標)を向上します。
  • Lucene/Solrの応用検索(もしかして、サジェスト、レコメンド、クラスタリング等)の精度や利便性を向上します。
  • Lucene/Solrの運用コストを低減します。
  • Luceneインデックスのデータをコーパスとみなすので、追加投資が不要です。お客様が現在保有している文書データの能力を最大限引き出します。

NLP4Lの最初のリリースでは、次の機能をご提供いたします。

関連語ネットワークの抽出と可視化
辞書型コーパスからの類義語知識の自動獲得
日本語単語分割の多義性に対応した形態素解析器
Luceneインデックスからの専門用語抽出
Luceneインデックスからの共起単語の抽出と検索
系列パターンマイニングを用いたLuceneインデックスにおける単語出現パターン学習
HTMLページからのノイズの削減
類義語に対応した文字N-gramトークナイザー

それぞれの機能についての詳しい説明は、今後公開するWeb記事またはマニュアルをご覧ください。

更に、弊社コンサルティング・サービスを組み合わせてご活用いただくことで、お客様の高度な検索課題を解決できると思っております。

NLP4Lがお客様の文書データの能力を引き出し、検索精度の向上やお客様のWebサイトの利便性向上に役立てば幸いです。

今後ともよろしくお願い申し上げます。


KandaSearch

KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。

  • セマンティックサーチ

    人間が理解するように検索エンジンがテキストや画像を理解して検索できます。

  • クローラー

    検索対象文書を収集するWebクローラーが使えます。

  • 簡単操作のUIと豊富なライブラリー

    検索や辞書UIに加え、定義済み専門用語辞書/類義語辞書やプラグインがあります。

  • ローコードで低コスト導入

    検索UIで使い勝手を調整した後、Webアプリケーションを自動生成できます。

セミナー

企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!