F@N Ad-Tech Blog

株式会社ファンコミュニケーションズ nend・nex8のエンジニア・技術ブログ

非理系、非エンジニア、非分析者が新米データサイエンティストになるためにやったこと

こんにちは、先日マイケルジャクソンの命日で30歳になったh_matsumotoです。
上司曰く6月25日は欅坂46の平手友梨奈の誕生日らしいけどよく分かりません。

本日はタイトルの通り、データサイエンティストに類するようなキャリアを
持たないような方がデータサイエンティストを目指す上で参考になるを教材を
ご紹介したいと思います。

これまでのキャリア

  • 私大文系卒
  • 2016年(去年)の8月1日に当社に入社
  • 主に事務系のアウトソーシングサービス会社で色々やってました
  • Accessで社内業務用のツールの開発と保守を約4年、VBAを約2年
  • 機械学習や統計の知識はほぼ無し

実践 Python データサイエンス

勧める理由
  • プログラミング(Python)、機械学習、統計学等カバー範囲が広い
  • 104レクチャー、全編17時間の充実したコンテンツ
  • セール期間中に買うと安く(1,200円くらい)費用対効果が良すぎる
  • 各単元毎のドキュメントが付録してあり、実務の際に辞書替わりに使える

www.udemy.com
Pythonのプログラミングを学んで、それを使ってデータ解析を行い
機械学習ライブラリの使い方まで学べます。
私も最初は訳も分からないので、動画を見ながら一緒にコードを書いて
いるだけでしたが、後で振り返るとここで手を動かしながら学んだ事が
身になっていると感じます。
後で、進○ゼミじゃないですけど
あ、これudemyでやったやつだ!」ってなると思います。

数学

機械学習や統計学に関するものを読むと、避けて通れないのが数学です。
数列、微分、積分、行列の計算などを理解するために、高校数学から復習しました。
その際に使用した教材をご紹介します。

超分かる高校数学

勧める理由
  • 単元が細かく区切られている。
  • Youtubeの無料動画だが、内容が丁寧に分かり易く作ってある。

各単元の説明動画(主に奇数番号)だけを見て概念や解法を理解しました。
単元が細かく区切られているため、後で部分的に振り返りたい時は
その単元の動画だけを見ればいいので使いやすいです。
【指数関数・対数関数が超わかる!】◆指数法則の拡張 (高校数学Ⅱ・B) - YouTube
【微分が超わかる!】◆微分の定義 (高校数学Ⅱ・B) - YouTube
【積分が超わかる!】◆不定積分の基本 (高校数学Ⅱ・B) - YouTube
【ベクトルが超わかる!】◆ベクトルの基本 (高校数学Ⅱ・B) - YouTube
【数列が超わかる!】◆数列の基本 (高校数学Ⅱ・B) - YouTube
【関数の極限が超わかる!】◆関数の極限の基本 (高校数学Ⅲ) - YouTube

理系なら知っておきたい数学の基本ノート

勧める理由
  • 大学で数学を学んだけど難しくて理解出来ない人向けに書かれた本
  • 途中式なども省略されずに載っているので分かり易い

Amazon CAPTCHA

Amazon CAPTCHA

gacco

f:id:fan_h_matsumoto:20170630132722p:plain

勧める理由
  • レベルに応じて統計学の講座を受けられる
  • 課題(必須ではない)を解くことでより一層理解を深められる
  • 無料で受けられる

いつでもすぐに目的の講座を受けられる訳ではないですが、事前に受講申し込みが
可能です。
統計学Ⅰ:データ分析の基礎 | gacco
統計学Ⅱ:推測統計の方法 | gacco
統計学Ⅲ:多変量データ解析法 | gacco

易しめな統計学や機械学習の本

  • いきなり難しい本を読むと挫折するのと理解が困難
  • 実務をする上でもとりあえずの知識は欲しい

当然といえば当然なのですが、理解には段階があるので前提となる教養がない
人間が難しい本を読むと挫折するし、理解が出来ないです。ですが案外簡単
な本を読んで概念や基礎的なことを理解した上で、前に理解できなかったもの
に挑戦するとすんなり理解出来る場合があります。

https://images-na.ssl-images-amazon.com/images/I/51SBnoVntOL._SX351_BO1,204,203,200_.jpg
Amazon CAPTCHA

https://images-na.ssl-images-amazon.com/images/I/51kqkQYzzrL._SX350_BO1,204,203,200_.jpg
Amazon CAPTCHA

https://images-na.ssl-images-amazon.com/images/I/51-ZTS%2B6YfL._SX385_BO1,204,203,200_.jpg
フリーライブラリで学ぶ機械学習入門 | 堅田洋資, 菊田遥平, 谷田和章, 森本哲也 |本 | 通販 | Amazon
(私はこれらを読みました)

データサイエンティストとしてのマインド

会社を変える分析の力 (講談社現代新書) | 河本 薫 |本 | 通販 | Amazon
https://images-na.ssl-images-amazon.com/images/I/31DDYcbaRfL._SX308_BO1,204,203,200_.jpg
上司に勧められて読んだ本ですが、会社における分析者の役割を説いています。
分析を行うには勿論、数学や統計学な高度な知識を必要としますが、ビジネスの
現場においてはそれらを売上に結び付けなくてはなりません。独りよがりな分析
になってしまっては高度な知識も宝の持ち腐れです。目の前にある課題を自分事
として捉える事、実際に分析した内容を現場で使ってもらえるように説得する事
もデータサイエンティストの重要な役割です。

じゃあそれで今どうなってるの?

f:id:fan_h_matsumoto:20170630140355p:plain
(引用元:https://www.datascientist.or.jp/common/docs/skillcheck.pdf)
データサイエンティスト協会で定めるスキルセットとして上記の図のように
なっています。私の立ち位置としてはビジネス力を活かす方向で実際に営業
現場の方とやり取りし、課題を吸い上げ解決に導いています。具体的には
PythonやSQL(トレジャーデータ)を使って、営業現場で必要とされるデータ
の提供をしたり、不正調査や売上向上のための分析、データに基づいた営業
アクションの提案等を行っています。

まだまだ自分の知識不足やプログラミング技術不足により、営業現場からの
要望に応えられない部分もあり、勉強しなくてはならない事も多いですが
優秀な諸先輩方のご指導もあり、日々頑張れております。

最後に

ファンコミュニケーションズでは機械学習エンジニアを募集しています。
私のような未経験者でもやる気と頑張り次第では活躍出来ると思いますので
興味がある方は以下のページをご覧ください。
(Webアプリケーションエンジニアと書いてありますが、機械学習エンジニアも含んでいますので安心してください。)

www.fancs.com