こんにちは、k_oomoriです。最近、機械学習の分野でFactorization Machines (FM)という手法があることを知りました。Matrix Factorization (MF)は知っていたのですが、共にfactorizationという単語を含んでいるため、何か関係があるのだろうか?と気になり調べてみました。
ここではサンプルデータとしてFactorization Machinesの論文で使われていたものを使用します。
タイタニック (TI) | ノッティングヒルの恋人 (NH) | スターウォーズ (SW) | スタートレック (ST) | |
Alice (A) | 5 | 3 | 1 | |
2010-1 | 2010-2 | 2010-4 | ||
Bob (B) | 4 | 5 | ||
2009-5 | 2009-8 | |||
Charlie (C) | 1 | 5 | ||
2009-9 | 2009-12 |
Alice, Bob, Charlieの3人が4本の映画作品に対して評価をしたものです。上段が評価値、下段が評価を行った年月を表します。また空欄は未評価であることを示しています。問題設定としては、この未評価の部分を推定し、高評価になりそうな作品を推薦(レコメンド)したいとします。 続きを読む