INFORMATION
サービス
Apache OpenNLP 1.9.0 がリリースされました!
Apache OpenNLP チームはバージョン 1.9.0 のリリースをアナウンスいたします。Apache OpenNLP ライブラリは自然言語テキストを処理するための機械学習ベースのツールキットです。多くの一般的な NLP タスクをサポートします。たとえば、トークナイズ、文セグメント化、品詞タグ付け、固有表現抽出、チャンク化、構文解析などです。
OpenNLP 1.9.0 のバイナリおよびソースは私どものダウンロードページより配布されます:https://opennlp.apache.org/download.html
OpenNLP ライブラリは Maven Central からも配布されます。詳しくは Maven 依存ページをご覧ください:http://opennlp.apache.org/maven-dependency.html
このバージョンでの変更点
- Brat 文書パーサーが名前タイプフィルターをサポートしました。
- Brat フォーマットが複数フラグメントアノテーションを正しくサポートするようになりました。
- リリースプロセスから MD5 ハッシュを削除しました。
- LanguageModel API にて StringList の代わりに String[] を使うようになりました。
- Brat アノテーションサービスが正しく起動するようになりました。
- トークンモデル生成にて
タグが1つもないときは不正終了するようになりました。 - Penn Treebank URL を新しくしました。
- Feature Generator XML のフォーマットが新しくなり、ドキュメントにも記載されました。
- 入力 context feature のコードを一体化しました。
- FeatureGeneratorUtil が日本語のひらがなとカタカナ文字を認識するようになりました。
その他の詳しい不具合修正と改善内容については、配布パッケージに含まれるリリースノートを参照してください。
Apache OpenNLP チーム
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!