機械学習
初めまして、ファンコミュニケーションズさんで5日間のインターンでお世話になった澤祐斗です。データ分析でのインターンということで、ビッグデータに触れられる機会を楽しみにしていました。 まずは簡単な自己紹介 東京の理系大学生(非情報系) データ分…
こんにちは! インターン始めてもうすぐ5ヶ月になる a_ota です。 時が経つのは早いですね、このあいだ正月だったのに、もう春ですね。お花見したくなります。 大学生活も残り少ないので、たくさん遊ぼうと思います。 さて、前回は、iosアプリについてでし…
皆様新年あけましておめでとうございます。冬場は毎日在宅勤務したいh_matsumotoです。最近無料でディープラーニングを学べるという「Aidemy」をやってみました。とても勉強熱心なので、12月24日と25日を丸々費やしてみました。決して予定が空いていた訳では…
BLOG月間ということで、頑張ってBLOGを書き書きしてるy_kawasakiです。こんにちは。随分昔に試したきり記事にしていなかったのでトピックモデルの使い方をまとめておこうと思います。 トピックモデルとは 題材 コーパスの作り方 モデルの作成 結果
こんにちは、先日マイケルジャクソンの命日で30歳になったh_matsumotoです。 上司曰く6月25日は欅坂46の平手友梨奈の誕生日らしいけどよく分かりません。本日はタイトルの通り、データサイエンティストに類するようなキャリアを 持たないような方がデータサ…
こんにちは、気象予報士のy_kawasaki(取得してもう早、15年経つらしい)です。前回は、精度が向上するどころか、悪化するという大惨事で終わりましたが、精度向上を目指します。ここで、日本付近の気象学的知識を投入して考えましょう。そう、天気は西か…
こんにちは、気象予報士のy_kawasaki(取得してもう早、15年経つらしい)です。一般的な天気予報は、数値予報モデルといわれる、物理方程式で作られた仮想の地球で数値微分を行い、気温、気圧などを予測したあと、ガイダンスといわれる、機械学習を用いた…
こんにちはデータサイエンティストのt_sakaiです。 前にCTR予測についての概論・評価方法についての記事を書きましたので、今回はさらに踏み込んだ内容についてまとめてみたいと思います。
ご無沙汰しています。情報科学技術研究所のy_kawasakiです。今回も無事、Blogを書くタイミングで所属名が変わってます。これで、今までの投稿ですべて違う、所属名(≠所属)で記事を書いています。 やりたいこと 例えば、imp数の監視をしたいということがあ…
こんにちは、k_oomoriです。最近、機械学習の分野でFactorization Machines (FM)という手法があることを知りました。Matrix Factorization (MF)は知っていたのですが、共にfactorizationという単語を含んでいるため、何か関係があるのだろうか?と気になり調…
先日Treasure Data Tech Talkという勉強会に登壇して、機械学習を用いてリアルタイムCTR予測を行う発表をしてきました。上記スライドは機械学習の知識がない人にも分かるように作ったので、本ブログ記事ではもう少し踏みこんで、作成した予測モデルの性能評…
この記事はTreasure Data Advent Calendar 11日目の記事です。 こんにちは、データマイニングチームのy_kawasakiです。(毎回所属が変わってます!) 最近、大量のデータを前に途方にくれていました。TreasureData(以下TD)という、武器を手に入れて、がっ…
Introduction こんにちは、k_oomoriです。今回は非負値行列因子分解 (Non-negative Matrix Factorization, 略してNMF) を用いたデータの解析について触れてみたいと思います。 まず最初に用語の定義として、「非負値行列」とは全ての要素が非負値(0以上の実…