F@N Ad-Tech Blog

株式会社ファンコミュニケーションズ nend・nex8のエンジニア・技術ブログ

佐賀から青山にきた理系大学生が未経験の統計分析をやってみた話

こんにちは、インターンシップ生のh_hondaです。
休日は友人とゲームをしたり、知り合いとツーリングに行ったりしています。余談ですが愛車はHondaのCBR250Rです。

さて、前々から気になっていた統計分析に挑戦しました。

今回、大半の学生がアルバイトをしている中で人気のあるアルバイトとそうではないアルバイトがあり、そのギャップが気になっていたので、地方の学生のアルバイト事情について実態を探ってみようと思います。
自身が地方の学生ということで、身近なところからアプローチしていきます。

  • アルバイトの満足度の分析
    • 分析したもの
    • 用意したもの
    • アンケート結果の基本統計量
    • 分析してみる
    • 散布図と回帰分析で時給と満足度の関係を分析する
    • 箱ひげ図で融通性と満足度の関係を分析する
    • 箱ひげ図で職種毎の満足度を分析する
  • まとめ
  • 今回のインターンシップ
    • 参加した理由
    • 良かった点
  • インターン募集のお知らせ
続きを読む

IPアドレスに都市名やドメイン名を付加する方法

皆さんこんにちは、h_matsumotoです。
最近レンタルが解禁された『君の名は。』を見て感動し、その後まだ上映している映画館に見に行きました(まさかの二度見)。

本日ご紹介する内容はIPアドレスの活用方法についてです。

  • Treasure Dataに新しく追加されたIPアドレスから都市名などが分かる関数の紹介
  • Treasure Dataを使わないでIPアドレスに都市名やドメイン名を付加する方法
  • IPアドレスを活用する上での注意事項

Treasure Dataに新しく追加されたIPアドレスの関数

Treasure Dataで8月にリリースされたPrestoの新しい関数

  • TD_IP_TO_CITY_NAME   IPアドレスから都市名を取得
  • TD_IP_TO_POSTAL_CODE IPアドレスから郵便番号を取得
  • TD_IP_TO_DOMAIN    IPアドレスからドメイン名を取得

以上の関数についてご紹介いたします。元々IPアドレスから国を取得する関数は存在していたのですが、都市や郵便番号が分かることで日本国内のどこからアクセスが多いのか把握する事が出来るようになります。

※8月からリリースノートが日本語版PDFでも閲覧出来るようになりました。

続きを読む

非理系、非エンジニア、非分析者が新米データサイエンティストになるためにやったこと

こんにちは、先日マイケルジャクソンの命日で30歳になったh_matsumotoです。
上司曰く6月25日は欅坂46の平手友梨奈の誕生日らしいけどよく分かりません。

本日はタイトルの通り、データサイエンティストに類するようなキャリアを
持たないような方がデータサイエンティストを目指す上で参考になるを教材を
ご紹介したいと思います。

これまでのキャリア

  • 私大文系卒
  • 2016年(去年)の8月1日に当社に入社
  • 主に事務系のアウトソーシングサービス会社で色々やってました
  • Accessで社内業務用のツールの開発と保守を約4年、VBAを約2年
  • 機械学習や統計の知識はほぼ無し

実践 Python データサイエンス

勧める理由
  • プログラミング(Python)、機械学習、統計学等カバー範囲が広い
  • 104レクチャー、全編17時間の充実したコンテンツ
  • セール期間中に買うと安く(1,200円くらい)費用対効果が良すぎる
  • 各単元毎のドキュメントが付録してあり、実務の際に辞書替わりに使える

www.udemy.com
Pythonのプログラミングを学んで、それを使ってデータ解析を行い
機械学習ライブラリの使い方まで学べます。
私も最初は訳も分からないので、動画を見ながら一緒にコードを書いて
いるだけでしたが、後で振り返るとここで手を動かしながら学んだ事が
身になっていると感じます。
後で、進○ゼミじゃないですけど
あ、これudemyでやったやつだ!」ってなると思います。

続きを読む

Treasure Reporting (Reporting & Dashboarding)を使ってみた

はじめましてこんにちは、新米データサイエンティストのh_matsumoto
(中身はやや古米)です。

今回は弊社で絶賛利用中のトレジャーデータのオプションサービスである
「Treasure Reporting (Reporting & Dashboarding)」をご紹介したいと思います。
docs.treasuredata.com

紹介動画
vimeo.com


「Treasure Reporting (Reporting & Dashboarding)」はSlemma社が提供する
BIツールをOEMとして利用しています。
slemma.com

トレジャーデータに格納されたデータを使って、レポートやダッシュボードを作成し
データの可視化を行う事が出来ます。
弊社でもデータの可視化にはシステムを改修して表示、クエリの結果をCSVとして
PythonやExcel上で処理する、他のBIツールを利用するといった用途に応じて対応
してきましたが、それらと比較しても中々便利に活用出来ます。

Treasure Reporting (Reporting & Dashboarding)の利用用途

  • 1回限りではなく頻繁に確認する事がある
  • 自分以外に共有する事がある
  • 出来るだけ手間を掛けず、簡単に済ませたい

といった場合に非常に便利に活用する事が出来ます。
具体的なシーンで言えば、営業現場等からある数値を可視化し、毎日確認出来るよう
にしたいと要望があった場合などです。
逆に、1回限りそのデータの中身を可視化したい場合などには適しません。

続きを読む

機械学習を用いた天気予報 その2

こんにちは、気象予報士のy_kawasaki(取得してもう早、15年経つらしい)です。

前回は、精度が向上するどころか、悪化するという大惨事で終わりましたが、精度向上を目指します。

ここで、日本付近の気象学的知識を投入して考えましょう。そう、天気は西から変わるんです!というわけで、安直に、静岡くらいの天気情報を入れたいと思います。

東京と静岡を読み込んで、風向をDropします。

続きを読む