INFORMATION
サービス
[インタビュー] Apache Mahout & Spark ではじめる機械学習トレーニングコース受講者 日本ヒューレット・パッカード㈱置田様
2017年9月にApache Mahout & Spark ではじめる機械学習トレーニングコースを受講されました、日本ヒューレット・パッカード株式会社の置田さんに受講後インタビューに応じて頂きましたのでご紹介します。
HPE置田:「私は YHP 入社です。 HP もコンパック、 EDS 、オートノミーなどを買収し、大きくなりましたが、一昨年 PC ・プリンタ部門は” HP Inc. ”として、サーバ部門は” Hewlett Packard Enterprise ”として分割されました。また、今年に入ってから SI系は DXC、ソフトウェア系マイクロフォーカスになりました。」
関口:「複雑ですね。。。」
置田:「はい、複雑です。」
関口:「置田さんは博士号(情報科学)をお持ちなのですね。」
置田:「はい、会社勤務の傍ら、はこだて未来大学を2008年に卒業しました。」
関口:「はこだて未来大学というと人工知能で有名ですが。 」
置田:「はい、ただ私の専門は人工知能ではなく、モバイル端末におけるブラウザ方式に関する論文を書きました。」
関口:「人工知能/ Deep Learning に業務がシフトしていったのはどういったきっかけだったのでしょう。」
置田:「始めたのは1年前で、本格的に取り組み始めたのは今年の春くらいからです。いろいろ学ぶために、自宅のメールを SPAM/HAM 判定したりしています」
関口:「SPAM/HAM 判定は、機械学習では分類問題に相当しますが、 Deep Learning ではどのように行うのでしょうか。」
置田:「自分で学ぶにあたり、2万通の手元のメールを手作業で SPAM/HAM のラベル付けを行い、教師データを作りました。また、学習はテキストでは無くバイナリデータを画像に見立てて、CNN で学習させました。最初は91%ちょっとの正解率から、チューニングを行うことで98%くらいまで上がりました。ツールは Chainer を使っています。」
置田:「メールは数時間くらいです、最近の仕事では一晩かけて学習させることも多いです。」
関口:「どのようなマシンをお使いなのでしょうか。GPU をお使いですか。」
置田:「GPU がないとほぼ無理ですね。処理時間に数十倍の違いが出てしまいます。特に画像( CNN )だと畳み込み処理の並列度が高いことから50倍とか100倍の違いが出ます。RNN だとシーケンシャルで処理をするため20倍くらいでしょうか」
関口:「そんなに違うものですか。具体的なサーバーを教えていただいてもよろしいでしょうか。HP のサーバーだと思うのですが(笑)。これから Deep Learning に挑戦しようかという本記事の読者の方の参考までに。」
置田:「DL380にNVIDIA Tesla P100 GPU を2枚搭載して使用しています。近々、1U で 4GPU 搭載できる HPE Apollo sx40 に置き換える予定です。GPU の消費電力が高いのと発熱量が多いのが課題ですね。」
関口:「結構大変ですね。自宅でも同じですか。」
置田:「自宅ではいわゆる『ゲーマー向けパソコン』を使っています。ただ、自宅の場合は電気代との戦いですね」
置田:「ディープラーニングの現状は、まだ試験導入の段階が多いです。今は投資段階なので盛り上り始めていますが、今後は収益を生み出していけるようにしていかなければなりません。また、人材不足も深刻で、エンジニア育成も必要です。 機械学習はアカデミックで難しい印象がありますが、Deep Learning は原理が判れば比較的簡単に扱うことができます。そういう意味で今回このトレーニングコースを受講して、基本原理の理解が進み、出てきた結果の数学的な解釈が身につきました。体系立てて理解できたことも良かったです。機械学習と比べて Deep Learning は扱いやすいので、さまざまな所で活用できると思います。たとえば、農家でキュウリの画像をたくさん読み込ませて自動仕分けをさせるなど、IT の世界では思いもつかなかった所で、これからも色々な応用が考えられていくと思います。ちなみに、Deep Learning よりも JavaScript でWebアプリとか、スマホのアプリを作る方がたぶん難しいですね。。。」
関口:「Deep Learning をすでに1年以上使っているということで、機械学習との違いや、Deep Learning への取り組みが意外に簡単である、などのお話しをおうかがいできました。本日はお疲れのところ、お時間をいただき、ありがとうございました。」
普段から Deep Learning を業務で使っているという置田さん。示唆に富む具体的なお話しをたくさんお聞かせいただきました。インタビューが盛り上がって、今回、写真を撮影するのを忘れてしまいました(涙)。
置田さんご自身について
ロンウイット関口:「私は旧 DEC 出身なのですが、現在の HPE さんはどのような感じなのでしょうか?」HPE置田:「私は YHP 入社です。 HP もコンパック、 EDS 、オートノミーなどを買収し、大きくなりましたが、一昨年 PC ・プリンタ部門は” HP Inc. ”として、サーバ部門は” Hewlett Packard Enterprise ”として分割されました。また、今年に入ってから SI系は DXC、ソフトウェア系マイクロフォーカスになりました。」
関口:「複雑ですね。。。」
置田:「はい、複雑です。」
関口:「置田さんは博士号(情報科学)をお持ちなのですね。」
置田:「はい、会社勤務の傍ら、はこだて未来大学を2008年に卒業しました。」
関口:「はこだて未来大学というと人工知能で有名ですが。 」
置田:「はい、ただ私の専門は人工知能ではなく、モバイル端末におけるブラウザ方式に関する論文を書きました。」
関口:「人工知能/ Deep Learning に業務がシフトしていったのはどういったきっかけだったのでしょう。」
置田:「始めたのは1年前で、本格的に取り組み始めたのは今年の春くらいからです。いろいろ学ぶために、自宅のメールを SPAM/HAM 判定したりしています」
関口:「SPAM/HAM 判定は、機械学習では分類問題に相当しますが、 Deep Learning ではどのように行うのでしょうか。」
置田:「自分で学ぶにあたり、2万通の手元のメールを手作業で SPAM/HAM のラベル付けを行い、教師データを作りました。また、学習はテキストでは無くバイナリデータを画像に見立てて、CNN で学習させました。最初は91%ちょっとの正解率から、チューニングを行うことで98%くらいまで上がりました。ツールは Chainer を使っています。」
Deep Learningについて
関口:「テキストではなくあえて画像で学習させるというのが面白いですね。その学習にはどのくらいの時間がかかるものなのでしょうか。」置田:「メールは数時間くらいです、最近の仕事では一晩かけて学習させることも多いです。」
関口:「どのようなマシンをお使いなのでしょうか。GPU をお使いですか。」
置田:「GPU がないとほぼ無理ですね。処理時間に数十倍の違いが出てしまいます。特に画像( CNN )だと畳み込み処理の並列度が高いことから50倍とか100倍の違いが出ます。RNN だとシーケンシャルで処理をするため20倍くらいでしょうか」
関口:「そんなに違うものですか。具体的なサーバーを教えていただいてもよろしいでしょうか。HP のサーバーだと思うのですが(笑)。これから Deep Learning に挑戦しようかという本記事の読者の方の参考までに。」
置田:「DL380にNVIDIA Tesla P100 GPU を2枚搭載して使用しています。近々、1U で 4GPU 搭載できる HPE Apollo sx40 に置き換える予定です。GPU の消費電力が高いのと発熱量が多いのが課題ですね。」
関口:「結構大変ですね。自宅でも同じですか。」
置田:「自宅ではいわゆる『ゲーマー向けパソコン』を使っています。ただ、自宅の場合は電気代との戦いですね」
今後について
関口:「最後に、今後についてお聞かせください。」置田:「ディープラーニングの現状は、まだ試験導入の段階が多いです。今は投資段階なので盛り上り始めていますが、今後は収益を生み出していけるようにしていかなければなりません。また、人材不足も深刻で、エンジニア育成も必要です。 機械学習はアカデミックで難しい印象がありますが、Deep Learning は原理が判れば比較的簡単に扱うことができます。そういう意味で今回このトレーニングコースを受講して、基本原理の理解が進み、出てきた結果の数学的な解釈が身につきました。体系立てて理解できたことも良かったです。機械学習と比べて Deep Learning は扱いやすいので、さまざまな所で活用できると思います。たとえば、農家でキュウリの画像をたくさん読み込ませて自動仕分けをさせるなど、IT の世界では思いもつかなかった所で、これからも色々な応用が考えられていくと思います。ちなみに、Deep Learning よりも JavaScript でWebアプリとか、スマホのアプリを作る方がたぶん難しいですね。。。」
関口:「Deep Learning をすでに1年以上使っているということで、機械学習との違いや、Deep Learning への取り組みが意外に簡単である、などのお話しをおうかがいできました。本日はお疲れのところ、お時間をいただき、ありがとうございました。」
普段から Deep Learning を業務で使っているという置田さん。示唆に富む具体的なお話しをたくさんお聞かせいただきました。インタビューが盛り上がって、今回、写真を撮影するのを忘れてしまいました(涙)。
INFORMATION
KandaSearch
KandaSearch はクラウド型企業向け検索エンジンサービスです。
オープンAPIでカスタマイズが自由にできます。
セミナー
企業が検索エンジンを選定する際のポイントから、
実際の導入デモをお客様ご自身でご体験!