推薦システムのアルゴリズム

来源：互联网发布：淘宝评论上穿不了照片编辑：程序博客网时间：2024/04/29 03:30

http://www.kamishima.net/archive/recsys.pdf

最初に『推薦システム (recommender system) 』とは何であるかということについ

て,その原点の一つである ACM Communications 誌での特集 [Resnick 97] での記
述を紹介する:

It is often necessary to make choices without sufficient personal experience of the
alternatives. In everyday life, we rely on recommendations from other people either
by word of mouth, recommendation letters, movie and book reviews printed in
newspapers, or general surveys such as Zagat’s restaurant guides.
Recommender systems assist and augment this natural social process.
自分の経験だけでは違いがあまりよくわからないものの中からでも,どうしてもどれか
を選ばなければならないということはよくある.こうしたときには,口コミ,推薦状,
新聞の書評や映画評,ザガットのレストランガイドなどの他人からの推薦に頼ることを
日常的に行っている.
推薦システムは,こうした社会で普通に行われている一連の行為を補助したり,促進し
たりする.

より簡潔には, Konstan によるチュートリアル [Konstan 03] の定義がよいだろう:

Recommenders: Tools to help identify worthwhile stuff
推薦システム:どれに価値があるかを特定するのを助ける道具
このように,利用者にとって有用と思われる対象,情報,または商品などを選び出し,
それを利用者の目的に合わせた形で提示するシステムといえる.
この推薦システムが必要になった背景は大きく二つある.第一に,大量の情報が発
信されるようになったことがある.これは,情報化技術の進展により,個人・団体が
容易かつ低コストで発信できるようになったためである.第二の理由は,これら大量
の情報の蓄積や流通が容易になり,誰もが大量の情報を得ることができるようになっ
たことである.これも計算機の記憶媒体の大規模化や,通信の高速化によるものであ
る.これらの要因により,大量に発信された情報を,だれもが大量に取得できる状況
が生じた.しかし,どのように欲しい情報を特定する方法が分からない(例:統計資料
として公開されているがその名前が分からない)とか,探している情報を特定できな
い(例:類似した資料が大量にあり,その中に目的のものが埋もれてしまっている)と
いった理由により,情報を参照できる状態にあるにもかかわらず,それを識別できな
いという状況が生じた.この状況を『情報過多 (information overload) 』 [Maes 94]
(情報爆発 (information explosion) や情報洪水 (information overflow) )という.こ
の状況に対処するため,利用者にとって有用な情報を見つけ出す推薦システムは考案
された.
この推薦システムがどのように誕生し,広まっていったかを述べておく.広義に
は情報検索や情報フィルタリング技術の一つと見なせるので,初期の推薦システム
はこれらの技術を基盤としていた.この推薦システムの実現手法の一つに協調フィ
ルタリングがあるが,この用語の方が推薦システムという用語より古く, 1992 年
に文献 [Goldberg 92] にて使われた.しかし,これは現在のような協調フィルタリ
ングではなく,他人が手動で行った推薦を検索できる協調作業支援のシステムで
あった.この過程を自動化したシステムが 1994 年の GroupLens [Resnick 94] や
Ringo [Shardanand 95] であり,現在の推薦システムの基礎となった. 同時に,も
う一つの実現手法である内容ベースフィルタリングも,従来からある情報フィルタリ
ングとして,また,事例ベース推論の応用としても研究されてきたが,推薦システム
として独自の側面が徐々に強くなっていった. 1996 年には,専門のワークショップ第 1 章
推薦システム
4
も開催されるほどに研究が活発化した. 1997 年には上記の ACM Communications
誌での特集 [Resnick 97] により,この種のシステムの呼び名として “recommender
system” が定着した.また,このころには NetPerceptions や Firefly などの企業に
よってシステムの商業化も始まった. Web を通じた各種サービスの機能で活用され
たり [Lawrence 99, Linden 03, Das 07] ,セットトップボックスなどの機器に組み
込まれたり [Ali 04] している. 2000 年代以降は,物理的な店舗面積に商品数が制限
されない電子商取引の発展や,大量の画一的な商品から,少量多品種を扱う mass
cusomization への消費傾向の変化に伴って,その重要性も広く認識されるようになっ
た.このことを象徴する Amazon.com CEO の Jeff Bezos の発言を引用しておこう
[Ben Schafer 01] *1 .

If I have 3 million customers on the Web,
I should have 3 million stores on the Web

Web に 3 百万人の顧客がいるなら, 3 百万の Web ストアを用意すべきだ

現在では,推薦システムは多方面で利用されるようになり,研究も継続的に行われ,多
様な方法が目的に応じて考案されている.
この推薦システムには大きく三つの要素技術が関連している.一つ目は,人間から
必要な情報を収集し,人間との対話を扱うヒューマン・コンピュータ・インターフェー
ス技術.二つ目は,収集したデータから推薦情報を生成し,それを目的に応じて変換
する機械学習,統計的予測,そして情報検索の技術.三つ目は,推薦に必要な情報を
蓄積し,処理し,流通させる基盤技術であるデータベース,並列計算,そしてネット
ワーク関連の技術.本稿では,三つ目の基盤技術については扱わず,推薦システム独
自の側面が強い,ヒューマン・コンピュータ・インターフェース技術と機械学習関連
技術を中心に主立った研究を紹介する.

0 0