INFORMATION
サブスクリプション
NLP4L 0.5.0 リリースのお知らせ
お客様各位
平素はお引き立てを賜り、ありがとうございます。
この度、弊社サブスクリプション・パッケージの機能拡張として、NLP4L 0.5.0 をリリースしましたのでお知らせします。
NLP4LはNatural Language Processing for Luceneの頭文字をとって命名された、Lucene/Solrのための自然言語処理パッケージです。
NLP4LはLuceneインデックスのデータを単語単位で整理されたコーパスとみなして活用することで、次のねらいを達成いたします。
- Lucene/Solrの基本検索のF値(精度と再現率を同時に評価する指標)を向上します。
- Lucene/Solrの応用検索(もしかして、サジェスト、レコメンド、クラスタリング等)の精度や利便性を向上します。
- Lucene/Solrの運用コストを低減します。
- Luceneインデックスのデータをコーパスとみなすので、追加投資が不要です。お客様が現在保有している文書データの能力を最大限引き出します。
NLP4Lの最初のリリースでは、次の機能をご提供いたします。
関連語ネットワークの抽出と可視化 |
辞書型コーパスからの類義語知識の自動獲得 |
日本語単語分割の多義性に対応した形態素解析器 |
Luceneインデックスからの専門用語抽出 |
Luceneインデックスからの共起単語の抽出と検索 |
系列パターンマイニングを用いたLuceneインデックスにおける単語出現パターン学習 |
HTMLページからのノイズの削減 |
類義語に対応した文字N-gramトークナイザー |
それぞれの機能についての詳しい説明は、今後公開するWeb記事またはマニュアルをご覧ください。
更に、弊社コンサルティング・サービスを組み合わせてご活用いただくことで、お客様の高度な検索課題を解決できると思っております。
NLP4Lがお客様の文書データの能力を引き出し、検索精度の向上やお客様のWebサイトの利便性向上に役立てば幸いです。
今後ともよろしくお願い申し上げます。
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!