lemur学习

来源:互联网 发布:龙神契约升阶数据 编辑:程序博客网 时间:2024/05/17 22:53
database 是我在MySql数据中建的表(map, sets, category)
error_set.cvs,media_categories.csv, training_set.csv这三个文件是原始文件
error_set.csv这个应该是错误文件,我没有理它
training_set.csv文件存的url, category,score,分别是数据的url,分类,和得分,其中分类对应在media_categories.csv文件中,如第一行:
http://100floorsanswers.com/level-66-100-floors-answers/    41                                                                    0.515
      URL                                                   分类(在media_categories.csv文件中找到41对应的分类是"Computer & Video Games"   这个是得分,
       

newMapWithHost.txt是我分别给这些url赋予一个id从第一行开始,第一行的id是1,第二行的是2,这个文件中分成了三列,第一列就是id,第二列就是id,第三列是这个url的主机



http://pojaaman.appspot.com/?p=18002

原创粉丝点击