INFORMATION
サービス
[インタビュー] Apache Mahout & Spark ではじめる機械学習トレーニングコース受講者 ネットアドバンス野口様
Apache Mahout & Spark ではじめる機械学習トレーニングコースを受講されました、株式会社ネットアドバンス(本社:千代田区)の野口章太郎さんに受講後のインタビューに応じていただきました。
ネットアドバンス野口「弊社は小学館の関連会社です。知識探索支援サービス JapanKnowledge(ジャパンナレッジ)を開発、サービス展開しています。」
関口「JapanKnowledge を使うとどのような知識探索ができるのでしょうか。」
野口「JapanKnowledge を使うと(主に)人文系の辞事典をインターネットから検索できます。見出し語数50万項目を誇る『日本国語大辞典』(小学館)や『日本歴史地名大系』(平凡社)などをはじめとする約50種類の辞事典を横断的に検索できます。この4月からは群書類従を収録コンテンツに加え好評を得ています。群書類従は古代から近世末期まで、歴史・文学・宗教・言語・風俗・美術・音楽・遊芸・教育・道徳・法律・政治・経済・社会・その他各分野にわたる全書目を分類収録した一大叢書です。」
関口「JapanKnowledge の検索機能は Solr を使っていますね。弊社も構築をお手伝いさせていただきました。」
野口「はい、昨年4月から JapanKnowledge は他社の検索システムから Solr に乗り換えました。これにより、以前は辞書種別をチェックボックスで選んでからキーワード検索させていたのを、まずキーワード検索してもらって、ファセットで絞り込みできるようになりました。チェックボックスで辞書種別を選ばせる検索では、0件ヒットが発生してしまいますが、ファセットによる絞り込み検索にすることでユーザの操作負担が減らせました。」
野口「JapanKnowledge は辞書検索サービスのため、見出し語や本文をきちんと検索できることが大事ですが、これは Solr を使ってある程度は達成できました。さらなるサービス向上を機械学習の知識を使ってできないかと考えたのが受講のきっかけです。」
関口「受講してみていかがだったでしょうか。」
野口「あることをしたいとき、たとえばレコメンドや分類などですが、その理論的背景と数式、演習が適度に提供されていて、飽きずに最後まで取り組めてよかったです。」
野口「辞書検索では、ユーザが明確な検索意図を持って検索を行うという特徴があります。これにもしレコメンド機能を提供できれば、関連する項目を提示することで、ユーザの知識を広げる手助けができるのではないかと考えています。また、1日目の『教師あり学習』の知識を使って、分類ラベルのついていない辞書に、他の分類ラベルがついている辞書を教師に使ってラベル付けができるのではないかと考えています。」
関口「なるほど、それは面白そうですね。本日はトレーニング受講後でお疲れのところ、お話を聞かせていただき大変ありがとうございました。」
ネットアドバンスについて
ロンウイット関口「ネットアドバンスという会社について教えてください」ネットアドバンス野口「弊社は小学館の関連会社です。知識探索支援サービス JapanKnowledge(ジャパンナレッジ)を開発、サービス展開しています。」
関口「JapanKnowledge を使うとどのような知識探索ができるのでしょうか。」
野口「JapanKnowledge を使うと(主に)人文系の辞事典をインターネットから検索できます。見出し語数50万項目を誇る『日本国語大辞典』(小学館)や『日本歴史地名大系』(平凡社)などをはじめとする約50種類の辞事典を横断的に検索できます。この4月からは群書類従を収録コンテンツに加え好評を得ています。群書類従は古代から近世末期まで、歴史・文学・宗教・言語・風俗・美術・音楽・遊芸・教育・道徳・法律・政治・経済・社会・その他各分野にわたる全書目を分類収録した一大叢書です。」
関口「JapanKnowledge の検索機能は Solr を使っていますね。弊社も構築をお手伝いさせていただきました。」
野口「はい、昨年4月から JapanKnowledge は他社の検索システムから Solr に乗り換えました。これにより、以前は辞書種別をチェックボックスで選んでからキーワード検索させていたのを、まずキーワード検索してもらって、ファセットで絞り込みできるようになりました。チェックボックスで辞書種別を選ばせる検索では、0件ヒットが発生してしまいますが、ファセットによる絞り込み検索にすることでユーザの操作負担が減らせました。」
トレーニングコース受講の動機
関口「野口さんが今回このトレーニングコースを受講しようと考えたきっかけはなんでしょうか。」野口「JapanKnowledge は辞書検索サービスのため、見出し語や本文をきちんと検索できることが大事ですが、これは Solr を使ってある程度は達成できました。さらなるサービス向上を機械学習の知識を使ってできないかと考えたのが受講のきっかけです。」
関口「受講してみていかがだったでしょうか。」
野口「あることをしたいとき、たとえばレコメンドや分類などですが、その理論的背景と数式、演習が適度に提供されていて、飽きずに最後まで取り組めてよかったです。」
今後について
関口「今回トレーニングコースを受講して得た知識をどのように業務に生かせそうでしょうか。」野口「辞書検索では、ユーザが明確な検索意図を持って検索を行うという特徴があります。これにもしレコメンド機能を提供できれば、関連する項目を提示することで、ユーザの知識を広げる手助けができるのではないかと考えています。また、1日目の『教師あり学習』の知識を使って、分類ラベルのついていない辞書に、他の分類ラベルがついている辞書を教師に使ってラベル付けができるのではないかと考えています。」
関口「なるほど、それは面白そうですね。本日はトレーニング受講後でお疲れのところ、お話を聞かせていただき大変ありがとうございました。」
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!