SERVICE
サービス

コンサルティングサービス

どのようなことにお困りですか?
ロンウイットの経験豊富な
コンサルタントが手がける事例を、
いくつかのケースごとに分けてご紹介します。

セマンティックサーチ/類似画像・動画・音声検索/BERTモデル構築

  • セマンティックサーチ

    セマンティックサーチでは人が文章を理解するように、検索エンジンがテキスト(検索対象文書とクエリ)を理解するので、従来型のキーワード検索とは全く異なる検索体験をユーザーに提供できます。検索エンジンはクエリの「意味」を理解して検索するので、類義語辞書の整備やランキングチューニングなどが不要になります。ロンウイットではセマンティックサーチを実現するためのBERTのモデル構築を支援いたします。

  • 類似画像・動画・音声検索

    セマンティックサーチではオブジェクト(検索対象)をベクトル化できれば、検索対象をテキストに限る必要がありません。テキストに加え、画像・動画・音声ファイルも検索対象とすることができます。クエリもベクトル化できればテキストに限定されません。したがって、類似画像検索システム(この画像と似た画像を検索する)も構築することが可能です。

検索エンジン/情報共有/Apache Solr

  • 検索意図ごとの
    検索最適化、評価基準の導入

    ユーザーが真に欲している情報を素早く提供するために、検索ユーザーの検索意図を解析し、検索を最適化することを行います。
    その際に、ユーザーの検索目的 (商品カタログを探しているのか、経費精算の方法を探しているのか等)を正しく把握し、目的ごとにユーザーのクエリを自動的に書き換えます。検索の意図別に最適な評価・メトリクスを導入して、どのくらい改善できたのかのアセスメントも行います。

  • 手探りによる
    検索改善からの脱却

    「ヒットしない」「ヒットしすぎる」「上位に表示されない」など、情報検索にまつわる問題はいろいろな原因から発生します。それに対して、なんとなく手探りで改善しようとしていませんか。
    情報検索の世界で10年以上の実績を持つ弊社では、問題の原因を把握した上で改善を施し、改善結果が見えるように正解セットの作成と評価・メトリクスを導入します。メトリクスを導入して評価することで投資効果を可視化でき、貴社内での改善作業を継続できます。

  • ランキング・チューニング/
    パーソナライズ検索

    ユーザーが真に欲している情報が検索結果ページの上位に表示されれば検索に要する時間は短縮され、それだけ本来の業務に時間を有効利用できます。
    より良いランキングを提供するため、インプレッションログ(クリックログを発展させたもの)を導入してクリックモデルから正解セットを作成します。その上で全体最適を目指すためのパラメーター探索、個別最適化を目指すランキング学習を用いたパーソナライズ検索をご提案します。

  • Apache Sparkを使った
    スケーラブルな前処理共通
    インフラの導入

    より良い検索システムを構築するには、インデクシング時の前処理がとても重要です。文字列の正規化、文書分類、ページランク(ページの重要度)計算、キーワード抽出、特徴量抽出、スクレイピング、等々必要な前処理は業務要件とともに増える一方です。
    このような要求に応えられるよう、Apache Sparkを使った スケーラブルなインデクシングの前処理共通基盤を導入することをご提案します。

  • 商品や文書のレコメンド導入
    によるWebサイトの活性化

    「こちらの商品を買った人はこの商品も検討しています」を実現する、協調フィルタリングによるレコメンド(おすすめ)機能。全文検索機能に加え、ECサイトや情報共有システムにレコメンド機能を追加することで、Webサイトのさらなる活性化を実現できます。
    ECサイトではクロスセルやアップセルに、エンタープライズ・サーチ(企業内検索)では社内に埋もれていた有用な文書が発掘されるなど、業務の効率化・業務知識共 有の促進に役立ちます。さらに、検索エンジンを用いたコンテンツベースのレコメンドを組み合わせることで、コールドスタート問題への対策もバッチリです。

  • バージョンアップ

    Apache Solrは後方互換性を考えながらバージョンアップがされますので、他のOSSの検索エンジンなどと比べるとバージョンアップは比較的容易です。
    それでもインフラ更新などに伴うSolrのバージョンアップには不安がつきものです。ロンウイットではお客様の検索アプリケーションや利用状況をヒアリングし、バージョンアップによる影響調査を行い、その上でお客様に最適な安定稼働最新バージョンをご提案し、バージョンアップを成功させます。

  • パフォーマンス・チューニング

    「インデクシングやoptimizeに時間がかかり、登録が翌朝までに終わらない」「特定の検索が遅い」などのご相談もよく寄せられます。
    ロンウイットでは、Apache Solrのパフォーマンス・チューニングに関する知識の蓄積がありますので、お客様の要件に合わせた最適なチューニング方法をご提示できます。

  • 検索エンジンの新規導入/
    RDBからのシステム移行

    もちろん、これから新しく全文検索エンジンを導入するお客様にも、要件ヒアリングから導入完了までご支援させていただきます。必要に応じてカスタマイズやプラグイン開発も可能です。
    これまでRDB(リレーショナ ルデータベース)しか使っていなかったアプリケーションに全文検索エンジンを適用するだけで検索の使い勝手が大きく向上し、検索ユーザーの世界が一変するでしょう。ぜひご検討ください。

  • PoCだけで終わらない。
    その先を見据えたご提案

    お客様独自のCMS(コンテンツ管理システム)内の検索、LDAPやActive Directoryなどの認証システムと連携した検索システムの構築、その他研究開発を伴うものなど、PoC(概念実証)プロジェクトのご相談もよくいただきます。
    ロンウイットではお客様の目的をよく理解し、PoCだけで終わらない、その先を見据えたご提案をさせていただきます。

機械学習/AI/Apache Spark

  • Apache Sparkを使った
    スケーラブルな前処理共通
    インフラの導入

    IoT機器やWebサイトのアクセスログ/クリックログなど、様々な場所で発生するビッグデータを処理する データエンジニア、整形されたデータから機械学習モデルを作成/評価するデータサイエンティスト、機械学習モデルをデプロイするアプリケーションエンジニア。
    ほとんどの企業ではこれらの人々が独自のツールを使って個別に作業をしており、作業効率の悪さが指摘されています。ロンウイットでは、Apache Sparkを使ったスケーラブルな前処理共通基盤(データフ レームのパイプライン)の導入をご提案しています。これにより、個々人の得意なツールはそのまま使いつつ、データ処理パイプラインが統一され、作業効率が格段にアップします。

  • Apache Sparkを使った
    複数モデル構築と
    最適モデル選択

    前述のように Apache Sparkによるスケーラブルなデータフレームの共通基盤を導入したら、Keras/TensorFlowなどを用いたモデル構築も高速化できます。
    Sparkのクラスタ上で複数のモデルを一気に学習/評価させ、最適なモデルを選択することで、デプロイまでの時間を短縮できます。

  • 特徴量エンジニアリング
    (Feature Engineering)

    ロンウイットではランキング学習モデル構築時に特徴量のご提案や特徴量エンジニアリングを行います。
    これにより、検索対象商品や文書が持っているテキスト情報だけから抽出できる特徴量よりもより広い有益な特徴量を抽出でき、パーソナライズ検索や、時期や曜日を考慮したランキングチューニングが可能となります。

  • 研究開発/論文調査

    前述のようなアプリケーションに有益な特徴量を探すなどの作業は、個々のコンサルタントの技量によるところもありますが、お客様の業務内容に近い論文を探し出して内容を理解し、レポートを作成するとともに使えそうな部分をご提案し、実装まで行うこと可能です。

    研究開発に近い作業も必要に応じて可能ですので、ぜひご相談ください。

自然言語処理/Apache OpenNLP

  • 名寄せ、商品カテゴリ階層構築、上位下位概念抽出

    「実際には同じものなのに、表記揺れを起こしているために検索できない」「多数の商品から商品カテゴリ階層を構築して、商品を探しやすくしたい」「テキスト記事から上位下位概念を抽出したい」などの課題をよくいただきます。個別のお客様要件に合わせて、これらの問題に対応します。

  • 文書分類、固有表現抽出、タグ付け、類義語辞書構築

    ロンウイットでは、検索精度(適合率)を高めたり、再現率を高めるためにこれらの技術を使っています。もちろん、検索以外のアプリケーションでのこれらの技術のご利用について、お気軽にご相談ください。

情報収集/クローラー/Apache ManifoldCF

  • カスタムクローラー作成、
    スクレイピング

    相手側の負荷を考えながら行うクローリングは、今や情報収集に欠かせない技術です。簡単に作ってしまうと、他メンバーに引き継げない職人芸のプログラムになってしまいがちです。
    弊社ではこれらを考慮して、Apache ManifoldCFによるクローリングをお勧めします。必要であれば開発したプラグインをコミュニティにフィードバックするお手伝いもさせていただきます。これにより、TCO削減が達成できます。

検索システムのことなら
ロンウイットにお任せください。

  • 検索システムにかかわる要求分析/開発・運用設計/実装/テストを
    チームメンバーの皆様と一緒に実施します。
  • ご質問/不具合報告/課題などにタイムリーに対応し、
    お客様のプロジェクトを成功に導きます。
  • Lucene/Solrを使った検索システムの構築やカスタマイズ、
    作成したシステムの動作検証(機能/性能)を実施します。
  • Lucene/Solrを使った検索システムのプロトタイプを作成します。
  • 既に商用検索エンジンを導入して運用中だが、「Lucene/Solr」への
    リプレースを検討しているお客様に対し、実データを用いてLucene/Solrの機能面・性能面の検証を行うお手伝いをいたします。
  • 検索エンジンの導入を検討中のお客様が、
    商用検索エンジンやその他のオープンソースの検索エンジンと
    Lucene/Solrを比較/検討する際の技術アドバイスをご提供します。

KandaSearch

KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。

  • セマンティックサーチ

    人間が理解するように検索エンジンがテキストや画像を理解して検索できます。

  • クローラー

    検索対象文書を収集するWebクローラーが使えます。

  • 簡単操作のUIと豊富なライブラリー

    検索や辞書UIに加え、定義済み専門用語辞書/類義語辞書やプラグインがあります。

  • ローコードで低コスト導入

    検索UIで使い勝手を調整した後、Webアプリケーションを自動生成できます。

セミナー

企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!