RONDHUIT Components, Solr and Support
RCSS

RCSS

2022年4月1日より、旧称「Solrサブスクリプション・パッケージ」からRCSSへ名称が変わりました。

RONDHUIT Components, Solr and Support

より良い検索システムを目指して

2006年の創業以来、ロンウイットは情報検索の専門企業として、「より良い検索システムを提供する」ことを目指して活動してまいりました。では私たちの考える「良い検索システム」とは何でしょうか。それは「欲しいものが早く見つかるシステム」です。ではどうすれば欲しいものが早く見つけられるのか?それは、「ユーザーの欲しいものだけを漏れなく返す」ことです。これを実現するため、ロンウイットでは Apache Solr にさまざまな機能を追加しています。

検索を改善するためにはコツがあります!

検索システムが、「ユーザーの欲しいものだけを漏れなく返す」ために必要なこと。
それは「辞書」「キーワード抽出」「分類」そして「ランキングチューニング」です。

辞書

辞書

検索の網羅性を高め、検索漏れを低減させるために必要です。RCSSを使えば、お客様が保有するコーパス(Word や PDF、RDB などに保存されているテキスト情報)から「辞書」を自動生成できます。

キーワード抽出/分類

キーワード抽出/分類

「辞書」を使って検索の網羅性が高まると、不要な文書まで返ってきてしまうという事象に悩まされます。そこで検索精度を高めるために「キーワード抽出」や「分類」の機能を使います。RCSSで提供されているモデルファイルを適用して、自然言語処理(NLP)機能の固有表現抽出がすぐお試しいただけます。お客様の業務内容に合った教師データをご用意いただくことで、さらに抽出の精度を高められます。

ランキングチューニング

ランキングチューニング

「検索結果の表示順」を意味する「ランキング」。これを適切に調整しようという「ランキングチューニング」は検索精度を高めるための補完機能です。たとえば、あるクエリを発行したときにランキング下位の文書が上位の文書より多くクリックを集めていたら、現在のランキングは適切ではありません。
RCSSでは、クリックログやユーザー行動履歴からクリックモデルを作成し、ランキング学習により Apache Solr のランキングをより適切になるように自動チューニングします。

検索機能/検索支援機能

RCSSのその他の検索機能や検索を支援する
周辺機能について紹介します。

簡単なセットアップ

簡単なセットアップ

パッケージは日本語対応を施した安定稼働版Solrを含んでいるので、インストールスクリプトを実行するだけで簡単に使い始めることができます。また、さまざまな利用状況に応じたサンプル環境とサンプルデータが同梱されますので、付属の日本語マニュアルを読みながら最新の検索技術に触れることができます。

きめ細かな日本語処理プラグイン

日本語の文章には独特の「表記揺れ」があり、これらをきちんと処理しないと、「検索漏れ」が発生してしまいます。 「検索漏れ」はお客様の業務によっては、深刻な事態を招いてしまうことがあります。たとえば、ECサイトなどのWebサイト内検索では「検索漏れ」の発生が潜在顧客を逃してしまうことになり、将来利益を逸失することにつながります。ロンウイットの日本語処理プラグインは、以下のような日本語独特の表記揺れを吸収し、検索漏れの事故を未然に防止します。

半角/全角
アイウ123⇔アイウ123
新旧漢字
慶應大学⇔慶応大学
踊り字
時々⇔時時、
部分々々⇔部分部分、
いすゞ自動車⇔いすず自動車
漢数字と
算用数字
四七/四十七/四拾七⇔47
読み
かたかな⇔カタカナ⇔katakana、
日本語⇔にほんご
外来複合語
オープンソース・ソフトウェア
⇔オープンソースソフトウェア
地名/漢字送りがな
旭が丘⇔旭丘/卸売り⇔卸売/
下請け⇔下請/垂れ幕⇔垂幕
貴社業務の専門用語を抽出し徹底活用

貴社業務の専門用語を
抽出し徹底活用

WordやPDFなど、「自然文」を多く含むドキュメントを検索するシステムを構築する場合、ドキュメントのメタデータが不足しているために、Solrの特徴であるファセット/クラスタリング/類似文書検索などが困難になります。 パッケージに含まれる専門用語抽出機能を用いて文章から「特徴語」すなわち「メタデータ」を引き出してドキュメントにフィードバックし、ドキュメント本来の情報能力をフル活用しましょう。これにより、ファセット/クラスタリング/類似文書検索機能やサジェスチョン(右図)を十分に活用できるようになります。

日本語対応「もしかして検索」

日本語対応「もしかして検索」

キーボードのタイプミスやかな漢字変換のし損じによる検索語エラーに対し、近い検索語を推定して「もしかして○○」のようにユーザに提示できます。リンクとともに正解キーワードが表示され、ユーザはリンクをクリックするだけで再検索できるので、省力化に役立ちます。

サポートサービス

RCSSを用いて検索システムを開発・運用するお客様に対し、バグフィックスパッチのご提供や回避策のご提示など、お客様の状況に応じて最適な解決策をご提供します。ご提供したバグフィックスパッチは、基本的に Apache Lucene/Solr コミュニティにフィードバックし、コミットまで行います。これにより、将来バージョンにて同様の不具合が発生しないように事前に予防することができます。Apache Lucene/Solr のコミッターをチームメンバーに擁する弊社ならではのサポートサービスです。

サービスレベル契約

受付時間 平日 9:00 〜 17:00
応答時間(一次回答) 6営業時間以内(*1
コミュニケーション サポート用メールアドレスへのメールまたは電話
インシデント数 Solr:年間12件 ManifoldCF:年間6件(追加オプション契約)
登録質問者 2名(まで)(*2
サポートバージョン リリース日より2年間
単位 5 Solrインスタンス毎

RCSS規約
(クリックしてご確認下さい)
*1:一次回答には、ご質問に対する回答の他、お問い合わせの内容により、「お問い合わせの受け付け」「お問い合わせ内容の詳細確認」「現象の再現作業中」「現象の再現作業の完了」などの作業状況連絡も含みます。 *2:1インシデントの範囲は半日以内の調査を基準として弊社が決定します。 *3:ご質問対応をさせていただく登録技術者の方には、あらかじめ弊社の開催する「Solr 基礎」および「Solr 応用」のトレーニングコースの受講をお願いします。 *4:サポート対象範囲は以下となります。 製品の使用方法に関するサポート 製品の互換性や操作性に関するサポート 製品ドキュメントの解釈に関するご質問 障害に対するサポート(製品のプログラム・コード調査) *5:以下の内容はコンサルティングサービスにて対応致します 導入に関してのコンサルティング(システム構築)に関する問い合わせ プランニングに関する問い合わせ アプリケーション開発、カスタマイズ方法およびデバッグなど 他社製品を含むお客様固有の環境で問題が発生した場合の解析 製品パッケージ及び同梱製品に起因しないと思われる問題の資料解析 お客様の要望によるサンプルの作成 パフォーマンスの分析やチューニング 日本語 (翻訳を含む) の手順書の作成 お客様障害に直接関連しない各種情報リストの提供

KandaSearch

KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。

  • セマンティックサーチ

    人間が理解するように検索エンジンがテキストや画像を理解して検索できます。

  • クローラー

    検索対象文書を収集するWebクローラーが使えます。

  • 簡単操作のUIと豊富なライブラリー

    検索や辞書UIに加え、定義済み専門用語辞書/類義語辞書やプラグインがあります。

  • ローコードで低コスト導入

    検索UIで使い勝手を調整した後、Webアプリケーションを自動生成できます。

セミナー

企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!