Recsys 2014 Automating Readers’ Adivsory to make book recommendations for K-12 Readers
来源:互联网 发布:用户数据分析方法 编辑:程序博客网 时间:2024/04/30 13:53
作者:
Maria Soledad Pera Yie-Kai Ng
Brigham Young University
名词说明:
K:Kindergadom 12:12年级,相当于国内高三
现在的系统存在的问题:
1. 没有考虑读者的阅读能力,对于青少年的确该考虑到
2. 受到信息保密等限制,目前很多推荐基于的信息都是拿不到的(交互、历史)
作者提出的方法:
主要思想:从图书馆管理员图书推荐的思路来自动实现推荐,考虑的维度有:①topic ②content ③appeal factors (appeal-term description)
实现的框架:
Brigham Young University
名词说明:
K:Kindergadom 12:12年级,相当于国内高三
现在的系统存在的问题:
1. 没有考虑读者的阅读能力,对于青少年的确该考虑到
2. 受到信息保密等限制,目前很多推荐基于的信息都是拿不到的(交互、历史)
作者提出的方法:
主要思想:从图书馆管理员图书推荐的思路来自动实现推荐,考虑的维度有:①topic ②content ③appeal factors (appeal-term description)
实现的框架:
Reader R的profile是一个N本已经阅读过的书集
待推荐的书是从网站、图书馆等找到的书 BiblioNasium
Topic来自于LCSH(一个图书索引,可以提供类别等信息)
Content是从网站上抓下来的内容简介
Appeal-term是文章的重要创新点
公式①
公式②
公式③
公式④
公式⑤
最重要的是ABET(Appeal-based extraction tool),即如何得到appeal-term description
首先考虑的角度:Appeal factors
其次设计的规则:
rules that eamine typed dependencies relations between word pairs in sentences extracted from reviews
Typed dependency 是基于Stanford typed dependencies manual(provide a simple description of the grammatical relationships in a sentence)
步骤
1. 借助与wordnet,对7个appeal factors里面的词进行了扩充。
2. 具体的规则
Rule 1 & 2:句子的主语或者宾语是factor,那么与这个主语/宾语之间关联的语义词就是appeal term
Rule 3:通过语法关系来得到不是直接相关的appeal term
Rule 4:考虑否定词,not等
Rule 5-7基于介词、主语、宾语来得到Frame和special topics相关的appeal term
对每本书的reviews处理后得到的结果是
括号里面的是出现的次数,frequency,可以代表权重。
作者通过一是通过与人工标注的结果进行对比;二是通过survey的方式 证明了这种方法抽取的appeal term的准确度很高。
错误分析:读者的review内容很多样化,所以虽然对appeal factors进行了扩充,还是存在一些keyword没有包含进去;poor phrasing
还有一个小的创新点是计算content similarity的时候考虑了同义词
评论:
作者的思路还是比较好理解的,从主体、内容、appeal-factors。作者能够想到方法关键是联想了正常大家去图书馆选书时候的过程,advisory起到的作用。所以做推荐还是要多联想正常的人与人之间推荐过程是怎么样的,然后想办法让机器自动完成。
文中的appeal term提取方法看起来准确度非常的高,有机会可以试试。
回顾学习的内容:
1. 相似度计算的时候经常会放在一起待选的方法:
Vector Space MOPPOodel VS. KL-divergence
VSM handles frequency distributions
Cosine similarity衡量的是两个向量的夹角
KL散度衡量的是两个分布的相似程度
PRML里面有对KL散度的原理说明
2. 评价指标nDCG
考虑相关度及其返回结果的位置。
0 0
- Recsys 2014 Automating Readers’ Adivsory to make book recommendations for K-12 Readers
- An introduction to weblog terms for weblog readers
- Readers' Choice Awards 2014
- Gated-Attention Readers for Text Comprehension
- Sorry to all the readers here
- 2005 JDJ Readers' Choice Awards - Best Java Book Nominees:
- Some English expressions for non-native English readers
- Using Delegates with Data Readers to Control DAL Responsibility
- What Blog Readers Want
- What Blog Readers Want
- What Blog Readers Want
- What Blog Readers Want
- Filter Readers and Writers
- readers-writers problems
- Readers/Writers lock
- c2 Streams Readers and Writers
- InputStream Readers OutputStream Writers 不同
- tensorflow编程: Inputs and Readers
- Oracle学习
- unity3d中itween插件按钮摆动或者震动的代码
- Log4J学习【十二】Properties文件中能够定义的配置项的格式和示例一
- 定远农机购置补贴促进农机化快速发展
- android NDK开发
- Recsys 2014 Automating Readers’ Adivsory to make book recommendations for K-12 Readers
- Xcode里-ObjC, -all_load, -force_load
- Log4J学习【十三】Properties文件中能够定义的配置项的格式和示例二
- camera ISP
- Log4J学习【十四】XML配置方式
- Log4J学习【十五】XML的配置方式练习
- 酷派s6、Coolpad 9190l_C00 无log信息输出解决方法
- ceph存储 "ceph集群浅析一"前言
- Log4J学习【十六】Log4j的默认启动流程一