INFORMATION
サービス
[インタビュー] Apache Mahout & Spark ではじめる機械学習トレーニングコース受講者 ㈱大和総研ビジネス・イノベーション様
2018年10月にApache Mahout & Spark ではじめる機械学習トレーニングコースを受講されました、株式会社大和総研ビジネス・イノベーションの企業システム開発本部の池田さん、岩田さんに受講後インタビューに応じて頂きましたのでご紹介します。
大和総研ビジネス・イノベーション池田:「弊社”大和総研ビジネス・イノベーション”は、大和総研とともに大和総研グループの中核を担う会社です。大和総研は、マクロ経済・金融資本市場に関する分析、政策提言などのリサーチ事業、事業戦略の策定・実行支援などの経営コンサルティング事業、大和証券グループ向けのシステムサービス事業の3つの事業を行っています。一方、私たち大和総研ビジネス・イノベーションは、大和証券グループ外の事業会社、金融機関、官庁および地方自治体、健康保険組合といった幅広いお客様に向けて、システムコンサルティングおよびシステムサービスを提供しています。」
大和総研ビジネス・イノベーション岩田:「私と池田は企業システム開発第四部に所属し、その中で大手通信会社のシステム設計・開発に携わっています。経営層の意思決定支援やマーケティングに利用するデータ分析の基盤となるデータウェアハウスやデータマートの開発を行っています。旧システムから、Apache Sparkを利用した新システムへの移行が、つい先月完了したばかりです。」
池田:「IBM の AIX 上で動いていた シェルおよび C 言語で書かれたシステムを、Linux 上で Apache Spark を使ったアプリケーションに書き換えるプロジェクトで、私はサブリーダーを務めました。Spark の検証を始めた当初のバージョンである 1.6 を使用していますが、RDD は使用せず、DataFrame で Parquet などを使っています。また、数十台のクラスターを組んでの運用も行っており、ここではバージョン 2.2 も使っています。社内で Scala 言語に強い人がいて、DataFrame を簡単に扱えるようライブラリが開発されており、それを使って開発効率を高めました。」
関口:「すでに Scala を業務システム開発に利用されているとのこと。大和総研グループというとお堅いイメージがあるので、先進的な取り組みをされていて驚きました。」
池田:「はい。Spark の利用経験はすでにありますが MLlib はまだ使ったことがありませんでした。機械学習には以前から興味がありましたので、上司からの指示を幸いに、岩田が見つけてくれたこの研修コースを受講しました。」
岩田:「私は学生時代に、ファジィクラスタリングと回帰分析の融合モデルを住宅用太陽光発電量分析に適用し、変量間にある局所依存を複数の線形回帰モデルによって示す研究を行っていました。業務の中でも機械学習を利用した取り組みをしたい思いがあり、今回の研修は、学生の時には学ばなかったいろいろな機械学習アルゴリズムを基礎から学ぶことができ、良い機会になりました。」
池田:「機械学習のさまざまなアルゴリズムだけではなく、アプリケーションに応じたさまざまな特徴量抽出のテクニックをどのように使うのかなどの話も面白かったです。たとえば手書き文字認識におけるフーリエ変換や、画像処理におけるクラスタリングとベクトル量子化などです。なぜ使うかという理由を理解したので、自分の仕事にも応用できる場面があればぜひ使っていきたいと思いました。まずは、社内のバッチジョブの遅延予測や原因抽出などに応用し、ゆくゆくはお客様向けのシステムにも使えるようにしていきたいと考えています。」
関口:「貴社の業務に少しでもお役に立てればうれしく思います。本日はお疲れのところ、お話しをお聞かせいただきありがとうございました。」
㈱大和総研ビジネス・イノベーション池田さん(右)、岩田さん(左)
大和総研ビジネス・イノベーションについて
ロンウイット関口:「貴社について教えてください。」大和総研ビジネス・イノベーション池田:「弊社”大和総研ビジネス・イノベーション”は、大和総研とともに大和総研グループの中核を担う会社です。大和総研は、マクロ経済・金融資本市場に関する分析、政策提言などのリサーチ事業、事業戦略の策定・実行支援などの経営コンサルティング事業、大和証券グループ向けのシステムサービス事業の3つの事業を行っています。一方、私たち大和総研ビジネス・イノベーションは、大和証券グループ外の事業会社、金融機関、官庁および地方自治体、健康保険組合といった幅広いお客様に向けて、システムコンサルティングおよびシステムサービスを提供しています。」
大和総研ビジネス・イノベーション岩田:「私と池田は企業システム開発第四部に所属し、その中で大手通信会社のシステム設計・開発に携わっています。経営層の意思決定支援やマーケティングに利用するデータ分析の基盤となるデータウェアハウスやデータマートの開発を行っています。旧システムから、Apache Sparkを利用した新システムへの移行が、つい先月完了したばかりです。」
Apache Spark への取り組み
関口:「Apache Spark をどのように使っているのでしょうか。」池田:「IBM の AIX 上で動いていた シェルおよび C 言語で書かれたシステムを、Linux 上で Apache Spark を使ったアプリケーションに書き換えるプロジェクトで、私はサブリーダーを務めました。Spark の検証を始めた当初のバージョンである 1.6 を使用していますが、RDD は使用せず、DataFrame で Parquet などを使っています。また、数十台のクラスターを組んでの運用も行っており、ここではバージョン 2.2 も使っています。社内で Scala 言語に強い人がいて、DataFrame を簡単に扱えるようライブラリが開発されており、それを使って開発効率を高めました。」
関口:「すでに Scala を業務システム開発に利用されているとのこと。大和総研グループというとお堅いイメージがあるので、先進的な取り組みをされていて驚きました。」
機械学習との関わりと今後について
関口:「すでに Spark をご利用中ということから、こちらの研修を受講していただいたのでしょうか。」池田:「はい。Spark の利用経験はすでにありますが MLlib はまだ使ったことがありませんでした。機械学習には以前から興味がありましたので、上司からの指示を幸いに、岩田が見つけてくれたこの研修コースを受講しました。」
岩田:「私は学生時代に、ファジィクラスタリングと回帰分析の融合モデルを住宅用太陽光発電量分析に適用し、変量間にある局所依存を複数の線形回帰モデルによって示す研究を行っていました。業務の中でも機械学習を利用した取り組みをしたい思いがあり、今回の研修は、学生の時には学ばなかったいろいろな機械学習アルゴリズムを基礎から学ぶことができ、良い機会になりました。」
池田:「機械学習のさまざまなアルゴリズムだけではなく、アプリケーションに応じたさまざまな特徴量抽出のテクニックをどのように使うのかなどの話も面白かったです。たとえば手書き文字認識におけるフーリエ変換や、画像処理におけるクラスタリングとベクトル量子化などです。なぜ使うかという理由を理解したので、自分の仕事にも応用できる場面があればぜひ使っていきたいと思いました。まずは、社内のバッチジョブの遅延予測や原因抽出などに応用し、ゆくゆくはお客様向けのシステムにも使えるようにしていきたいと考えています。」
関口:「貴社の業務に少しでもお役に立てればうれしく思います。本日はお疲れのところ、お話しをお聞かせいただきありがとうございました。」
㈱大和総研ビジネス・イノベーション池田さん(右)、岩田さん(左)
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!