こんにちは、気象予報士のy_kawasaki(取得してもう早、15年経つらしい)です。
前回は、精度が向上するどころか、悪化するという大惨事で終わりましたが、精度向上を目指します。
ここで、日本付近の気象学的知識を投入して考えましょう。そう、天気は西から変わるんです!というわけで、安直に、静岡くらいの天気情報を入れたいと思います。
東京と静岡を読み込んで、風向をDropします。
続きを読むこんにちは、気象予報士のy_kawasaki(取得してもう早、15年経つらしい)です。
前回は、精度が向上するどころか、悪化するという大惨事で終わりましたが、精度向上を目指します。
ここで、日本付近の気象学的知識を投入して考えましょう。そう、天気は西から変わるんです!というわけで、安直に、静岡くらいの天気情報を入れたいと思います。
東京と静岡を読み込んで、風向をDropします。
続きを読むこんにちは、気象予報士のy_kawasaki(取得してもう早、15年経つらしい)です。
一般的な天気予報は、数値予報モデルといわれる、物理方程式で作られた仮想の地球で数値微分を行い、気温、気圧などを予測したあと、ガイダンスといわれる、機械学習を用いた、いわゆる天気予報への翻訳を行っています。
そこで、行われていることは、http://aitc.jp/events/20160916-Seika/20160916_特別講演_気象庁における機械学習の利用.pdfで説明されているように、カルマンフィルター、ロジスティック回帰、ニューラルネットワークなどが用いられています。特に、専門的に知りたい方は、気象庁数値予報課が毎年刊行している、研修テキストに詳しく載っていますので、そちらを参照してください。
さて、今回は気象庁とは別のアプローチで機械学習で、天気を予報してみようと思います。
続きを読むこんにちは、情報科学技術研究所のy_kawasakiです。春になり天気予報が微妙にずれる(時間的に)のが気になる今日このごろです。
ベイズ統計学による、統計モデリングのことです!それぞれの意味は個々でググってください!
ベイズ統計モデリングをやるには、MCMC(マルコフ連鎖モンテカルロ法)で解く必要があるので様々なパッケージが用意されています。たとえば、BUGS言語を使ったソフトや、Stanというツールなど。ここでは、最近流行りのStanを使うことにします。Pythonから使う必要が(自分には)あるため、PyStanを利用します。
> pip install PyStan
難しいことはありません。
弊社では本社があるビルが手狭になったことから一部の部署が切り出されて、近くのビルに放り出されました(以下、本社とサテライト)。そこで、時々、本社と行き来する必要が発生して、片道どれくらいかかるのかを情報科学技術研究所的には調査する必要性が発生しました。(使命感)
そこで、被験者3名に計測を依頼したところ、A7件、B2件、C4件、計13件の下記の結果を得ることができました。なお、本社、サテライト間には、信号とエレベータが障害として存在しています。
こんにちは、サービス開発部情報科学技術研究所所属のk_oomoriです。先日、
migi.hatenablog.com
というブログが公開され、アドテク界隈で話題になったようです。私も読ませていただきましたが、平易に書かれていてとても良い記事だと思いました。僭越ながら要約させていただくと、
という仮定をおくとか月後のユーザ数はとなり、それをからまで足しあげた延べ継続期間が
となるため、平均継続期間=ユーザの延べ継続期間/ユーザ数 として定義した平均継続時間が1/解約率で与えられることが示された、というものです。
似たような問題は実は他の文脈でも現れます。例えば原子核物理学の分野で不安定な原子核の放射性崩壊という現象があり、ある時刻における不安定原子核の数を、崩壊率あるいは崩壊定数(崩壊のしやすさ、詳しくは後ほど説明します)をとしたときに、時刻において崩壊せずに残っている原子核数をとを用いて表すことができます。この場合、1個の原子核が平均的にどのくらい生き延びるか?という問題を考えることができ、平均寿命と呼ばれています。これを先ほどのユーザの解約問題と比較すると、
によって対応付けできるため、数学的には同種の問題とみなすことができます。(離散、連続の違いはありますが)
続きを読むこんにちは、サービス開発部 情報科学技術研究所の h_shinです。 Rで学ぶ推薦システム(recommendation system)について記事を書きたいと思います。
続きを読む