INFORMATION
サービス
[インタビュー] Apache Mahout & Spark ではじめる機械学習トレーニングコース受講者 金融エンジニアリング・グループ原田様 黒柳様
Apache Mahout & Spark ではじめる機械学習トレーニングコースを受講されました、株式会社金融エンジニアリング・グループ(本社:東京都中央区)の原田慧さんと黒柳敬一さんに受講後のインタビューに応じていただきました。
FEG原田「ひとことでいうと、データ分析を行う会社です。お客様のデータを分析し、お客様の業務改善につながる提案を行っています。データ分析をコンサルティングで提供したり、分析機能を組み込んだシステム構築を提案したりしています。」
関口「具体的にいうとどのようなコンサルティングやシステムでしょうか。」
原田「たとえば、住宅ローンの申込書に書かれた内容を分析して、自動的にローン審査OK/NGを判断したり念のため人が見た方がよいものに分類するようなシステムを提案・構築します。このシステムを使えば人が確認する必要がある申込書の枚数を限定できるので、それだけ審査業務効率が上がることになります。我々はデータ分析のコンサルタントですから、このようなシステムの場合は分析モデルの構築だけを行い、システム自体の構築は他部門や関連会社等が行います。」
関口「住宅ローンの申込書を分類するのは教師あり学習でしょうか。」
原田「はい、システムを依頼されてきたお客様の過去の申込書とその後のデフォルト有無を訓練データに使ってモデルを構築します。」
FEG黒柳「1ショットで終わるコンサルティングだけではなく、月例などモニタリングサービスも提案します。モニタリングして定期的に性能測定をさせていただくことで安心してモデルをお使いいただけます。たとえば、モデルがマーケットの実態と合わなくなってきたりした場合は、モデルを作り直すご提案を行ったりします。ITシステムの構築ではシステムの不具合改修を1年間保証したりしますが、モデルの場合はベストエフォートが基本です。モデルの納入と同時にモニタリング契約を別途締結させていただき、モデルが合わなくなってきたときは少し安価にモデルを作り直す、ということをしています。」
関口「金融エンジニアリング・グループという社名ですが、お客様は金融機関になりますでしょうか。」
原田「かつては金融機関がメインのお客様でしたが、最近は金融以外のお客様も増えてきています。黒柳さんのところは金融業以外のお客様ですね。」
黒柳「はい。あまり詳しくはお話しできませんが、たとえば小売業ではPOSデータや販売履歴データを学習して売り上げをもっと伸ばす方策を提案したりお客様と一緒に考えたりします。また、新規会員登録してくれた顧客の解約を防止するもしくは優良顧客へと転換するにはどうすべきかを過去のデータから学ぶことができます。」
関口「どの分類アルゴリズムを使うかはどのように決めているのでしょうか。」
原田「案件の種類ごとに弊社で実績のあるものの中からプロジェクトリーダーが選択します。ただ、金融機関では自社実績・他社実績も豊富なため、どうしても同じような手法になりやすいですね。データ分析プロジェクトの期間としては3〜6ヶ月くらいです。」
黒柳「金融機関以外のお客様では比較的新しい試みやR&D的な案件が多くなります。その場合は参照できる過去の実績はないので、私や原田さんの裁量の範囲が大きくなり、比較的自由に作業ができます。」
関口「きっとそういう新しい試みはデータ分析者として燃えるのでしょうね。」
原田・黒柳「はい。(笑)」
原田「私は無限次元空間の研究で数学の博士課程を修了したあと就職の道を選びました。最初はリクナビなどで会社を探しましたがうまく探せませんでした。その後大学の掲示板に貼ってあったFEGのデータ分析コンサルタントを募集する求人票を見つけました。そこには博士修了者も採用することが書かれており、入社することになりました。今年で入社4年目になります。」
黒柳「私は物性物理学の理論専攻で冷却原子気体の量子物性に関する研究で修士課程を修了し、FEGに入りました。今年で入社5年目になります。学生時代に(微分方程式という同じ数学テクニックを使う)金融工学や研究所にインターンで行ってました。その関係から就職活動の時はナビで『金融工学』を検索し、FEGを見つけました。」
関口「インターンで行ったいくつかの金融工学の会社や研究所がある中で黒柳さんがFEGを選んだ決め手はなんだったのでしょうか。」
黒柳「FEGはデータマイニング分野で研究活動を行っている国際団体が主催しているKDD-Cupで世界第2位になるなど、企業としての実力と研究マインドを持っていることが決め手となりました。」
原田「弊社ではSAS互換のWPSを使っていますが、この製品はデータのクリーニング等の加工処理や機械学習アルゴリズムがシングルサーバーで動くことを前提に最適化されています。しかし今後は分散環境でより高速に実行できるようにすることが必要になると感じており、MahoutやSparkというキーワードで探したところ、こちらのコースを見つけました。」
関口「受講してみていかがだったでしょうか。」
原田「機械学習の話は特に目新しい話はありませんでしたが、自然言語処理や情報検索の話は興味深く感じました。」
黒柳「演習を通じて今回改めて感じたのは、我々は普段Javaを使っていないので、Mahoutは使いにくいと思いました。Mahoutは足りないところをJavaで書かなければいけませんが、我々にとってはハードルが高いです。Sparkの方が必要なロジックを抜き出して使いやすそうだと感じています。」
関口「テキストの構成はどうでしょうか。」
原田「私はお客様から機械学習の講師をお願いされることがありますが、テキストの中で説明の仕方が参考になるところはありました。分量的には機械学習初心者の方が2日間でこれだけの内容を学ぶのは厳しいのではないかと感じました。」
黒柳「ポイントポイントで演習が配置されているのはいいと思います。」
原田「以前はモデラーとかデータマイナーと社内的に呼んでいました。私はデータサイエンティストという肩書きは自分には当てはまらないと思っています。というのも、我々が行っているデータ分析業務にはそれぞれのお客様のビジネスに応じた要素も多く含み、高尚で個別のビジネスを志向していないサイエンスとは異なるからです。データ分析コンサルタントという呼称が一番しっくりきます。」
黒柳「私も同感ですが、お客様からはデータサイエンティストと呼ばれることが多いです。」
原田「私はスーパーマリオブラザーズのゲーム画面のスクリーンショットを強化学習してマリオを自動的に動かすプログラム作成を趣味でやっています。ATARIのインベーダーゲームのスクリーンショットを学習するという先行研究などを参考にしていますが、現在は次元をいかに削減しようかと悩んでいるところです。できたら動作しているところをニコニコ動画にアップしようと思います。」
黒柳「私は『パターン認識と機械学習』(略称PRML)という書籍の読書会に参加しています。毎週開催され、今日もこのあと参加します。」
関口「PRML読書会はどのように進められるのですか。」
黒柳「参加者に2ページ分の担当が与えられ、毎回6ページほど進みます。担当になった人はそのページを理解して次週に発表します。行間を埋めるのが大変で式展開まで行わなければなりません。担当になると土日がそれでつぶれてしまいます。私は初回からのノートをすべて持っています。」
関口「それはすごいですね!」
原田「黒柳さん、PRMLの解説本が書けますね。」
原田「個人的には指示待ちでなく、自分で面白いと思ったことをどんどん進めて行ってしまうような人に来てもらいたいと思っています。」
黒柳「私は金融工学というキーワードで就職先を探していましたが、FEGに入社してよかったと思っています。金融工学というキーワードだけで会社を選んでいたら、時系列データ解析や微分方程式くらいしか扱えなかったかも知れません。FEGではいろいろなテクニックを使ってデータ分析ができるので、データサイエンティストを目指すのであればうちの会社はお勧めです。」
関口「本日はトレーニング受講後でお疲れのところ、面白いお話を聞かせていただき大変ありがとうございました。」
金融エンジニアリング・グループについて
ロンウイット関口「金融エンジニアリング・グループ(略称FEG)という会社について教えてください」FEG原田「ひとことでいうと、データ分析を行う会社です。お客様のデータを分析し、お客様の業務改善につながる提案を行っています。データ分析をコンサルティングで提供したり、分析機能を組み込んだシステム構築を提案したりしています。」
関口「具体的にいうとどのようなコンサルティングやシステムでしょうか。」
原田「たとえば、住宅ローンの申込書に書かれた内容を分析して、自動的にローン審査OK/NGを判断したり念のため人が見た方がよいものに分類するようなシステムを提案・構築します。このシステムを使えば人が確認する必要がある申込書の枚数を限定できるので、それだけ審査業務効率が上がることになります。我々はデータ分析のコンサルタントですから、このようなシステムの場合は分析モデルの構築だけを行い、システム自体の構築は他部門や関連会社等が行います。」
関口「住宅ローンの申込書を分類するのは教師あり学習でしょうか。」
原田「はい、システムを依頼されてきたお客様の過去の申込書とその後のデフォルト有無を訓練データに使ってモデルを構築します。」
FEG黒柳「1ショットで終わるコンサルティングだけではなく、月例などモニタリングサービスも提案します。モニタリングして定期的に性能測定をさせていただくことで安心してモデルをお使いいただけます。たとえば、モデルがマーケットの実態と合わなくなってきたりした場合は、モデルを作り直すご提案を行ったりします。ITシステムの構築ではシステムの不具合改修を1年間保証したりしますが、モデルの場合はベストエフォートが基本です。モデルの納入と同時にモニタリング契約を別途締結させていただき、モデルが合わなくなってきたときは少し安価にモデルを作り直す、ということをしています。」
関口「金融エンジニアリング・グループという社名ですが、お客様は金融機関になりますでしょうか。」
原田「かつては金融機関がメインのお客様でしたが、最近は金融以外のお客様も増えてきています。黒柳さんのところは金融業以外のお客様ですね。」
黒柳「はい。あまり詳しくはお話しできませんが、たとえば小売業ではPOSデータや販売履歴データを学習して売り上げをもっと伸ばす方策を提案したりお客様と一緒に考えたりします。また、新規会員登録してくれた顧客の解約を防止するもしくは優良顧客へと転換するにはどうすべきかを過去のデータから学ぶことができます。」
関口「どの分類アルゴリズムを使うかはどのように決めているのでしょうか。」
原田「案件の種類ごとに弊社で実績のあるものの中からプロジェクトリーダーが選択します。ただ、金融機関では自社実績・他社実績も豊富なため、どうしても同じような手法になりやすいですね。データ分析プロジェクトの期間としては3〜6ヶ月くらいです。」
黒柳「金融機関以外のお客様では比較的新しい試みやR&D的な案件が多くなります。その場合は参照できる過去の実績はないので、私や原田さんの裁量の範囲が大きくなり、比較的自由に作業ができます。」
関口「きっとそういう新しい試みはデータ分析者として燃えるのでしょうね。」
原田・黒柳「はい。(笑)」
入社のきっかけ
関口「お二人はどのような経緯でFEGに入社したのでしょうか。」原田「私は無限次元空間の研究で数学の博士課程を修了したあと就職の道を選びました。最初はリクナビなどで会社を探しましたがうまく探せませんでした。その後大学の掲示板に貼ってあったFEGのデータ分析コンサルタントを募集する求人票を見つけました。そこには博士修了者も採用することが書かれており、入社することになりました。今年で入社4年目になります。」
黒柳「私は物性物理学の理論専攻で冷却原子気体の量子物性に関する研究で修士課程を修了し、FEGに入りました。今年で入社5年目になります。学生時代に(微分方程式という同じ数学テクニックを使う)金融工学や研究所にインターンで行ってました。その関係から就職活動の時はナビで『金融工学』を検索し、FEGを見つけました。」
関口「インターンで行ったいくつかの金融工学の会社や研究所がある中で黒柳さんがFEGを選んだ決め手はなんだったのでしょうか。」
黒柳「FEGはデータマイニング分野で研究活動を行っている国際団体が主催しているKDD-Cupで世界第2位になるなど、企業としての実力と研究マインドを持っていることが決め手となりました。」
トレーニングコース受講の動機
関口「今回トレーニングコースを受講していただいたきっかけはなんでしょうか。」原田「弊社ではSAS互換のWPSを使っていますが、この製品はデータのクリーニング等の加工処理や機械学習アルゴリズムがシングルサーバーで動くことを前提に最適化されています。しかし今後は分散環境でより高速に実行できるようにすることが必要になると感じており、MahoutやSparkというキーワードで探したところ、こちらのコースを見つけました。」
関口「受講してみていかがだったでしょうか。」
原田「機械学習の話は特に目新しい話はありませんでしたが、自然言語処理や情報検索の話は興味深く感じました。」
黒柳「演習を通じて今回改めて感じたのは、我々は普段Javaを使っていないので、Mahoutは使いにくいと思いました。Mahoutは足りないところをJavaで書かなければいけませんが、我々にとってはハードルが高いです。Sparkの方が必要なロジックを抜き出して使いやすそうだと感じています。」
関口「テキストの構成はどうでしょうか。」
原田「私はお客様から機械学習の講師をお願いされることがありますが、テキストの中で説明の仕方が参考になるところはありました。分量的には機械学習初心者の方が2日間でこれだけの内容を学ぶのは厳しいのではないかと感じました。」
黒柳「ポイントポイントで演習が配置されているのはいいと思います。」
データサイエンティストという職業について
関口「昨今、データサイエンティストという肩書きがはやっていますがどのように見ていますか。お二人はそういう職種が命名される前からデータ分析のコンサルタントだったわけですが。」原田「以前はモデラーとかデータマイナーと社内的に呼んでいました。私はデータサイエンティストという肩書きは自分には当てはまらないと思っています。というのも、我々が行っているデータ分析業務にはそれぞれのお客様のビジネスに応じた要素も多く含み、高尚で個別のビジネスを志向していないサイエンスとは異なるからです。データ分析コンサルタントという呼称が一番しっくりきます。」
黒柳「私も同感ですが、お客様からはデータサイエンティストと呼ばれることが多いです。」
興味のあること
関口「仕事以外に熱心に取り組んでいることがあれば教えてください。」原田「私はスーパーマリオブラザーズのゲーム画面のスクリーンショットを強化学習してマリオを自動的に動かすプログラム作成を趣味でやっています。ATARIのインベーダーゲームのスクリーンショットを学習するという先行研究などを参考にしていますが、現在は次元をいかに削減しようかと悩んでいるところです。できたら動作しているところをニコニコ動画にアップしようと思います。」
黒柳「私は『パターン認識と機械学習』(略称PRML)という書籍の読書会に参加しています。毎週開催され、今日もこのあと参加します。」
関口「PRML読書会はどのように進められるのですか。」
黒柳「参加者に2ページ分の担当が与えられ、毎回6ページほど進みます。担当になった人はそのページを理解して次週に発表します。行間を埋めるのが大変で式展開まで行わなければなりません。担当になると土日がそれでつぶれてしまいます。私は初回からのノートをすべて持っています。」
関口「それはすごいですね!」
原田「黒柳さん、PRMLの解説本が書けますね。」
データサイエンティストを目指す人へひとこと
関口「お二人がFEGで楽しくデータ分析の仕事をしていることが大変よくわかりました。最後に、データサイエンティストを目指そうという人に、FEGをアピールしてください。」原田「個人的には指示待ちでなく、自分で面白いと思ったことをどんどん進めて行ってしまうような人に来てもらいたいと思っています。」
黒柳「私は金融工学というキーワードで就職先を探していましたが、FEGに入社してよかったと思っています。金融工学というキーワードだけで会社を選んでいたら、時系列データ解析や微分方程式くらいしか扱えなかったかも知れません。FEGではいろいろなテクニックを使ってデータ分析ができるので、データサイエンティストを目指すのであればうちの会社はお勧めです。」
関口「本日はトレーニング受講後でお疲れのところ、面白いお話を聞かせていただき大変ありがとうございました。」
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!