杂记_比赛的一些记录

来源:互联网 发布:java仿qq好友列表 编辑:程序博客网 时间:2024/05/19 02:06

目前遇到的问题:

1、数据太多, excel 表无法完全加载

问题解决: 使用 pandas 进行读取

2、还没有确定使用什么算法

3、还不能将一列 unix 时间戳转化为正常时间

问题解决: 代码如下

import pandas as pdimport timedef timestamp_datetime(value):    """    value: 传入的值为时间戳(整形), 如1332888820    """    # 经过 localtime 转换后变成    # time.struct_time(tm_year=2012, tm_mon=3, tm_mday=28, tm_hour=6, tm_min=53, tm_sec=40, tm_wday=2, \    # tm_yday=88, tm_isdst= 0)    # 最后再经过 strftime 函数转换为正常日期格式    return time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(value))def test():    value = pd.DataFrame(dict(data=range(1332888820, 1332888888)))    value.data = value.data.apply(timestamp_datetime)    print value    return value


对赛题的思考和分析:

1、是什么原因影响一个歌手的新歌的点击数量?

注: 以下原因不按权重大小来排序

①歌手本身的名气: 因为歌手出名则意味着他有很多的粉丝, 而粉丝相比非粉丝会更容易接触到该歌手的歌曲

②歌曲本身的质量: 人们更愿意分享好东西

③音乐平台本身的推荐

④听歌者的安利: 这些人在听到喜欢听或觉得好听的歌曲时会主动向他人安利, 所以这些人的安利人群覆盖范围和成功率也会有影响


来自官方的信息汇总:

由于在参赛过程中会遇到各种各样的问题, 所以一切都以官方回复为标准

1、预测歌曲的播放量的时间段为: 9.1~10.30

https://bbs.aliyun.com/read/281838.html?spm=5176.bbsl254.0.0.BAKNSy


2、提交的结果中的DS段以记录收集日期为准

https://bbs.aliyun.com/read/282003.html?spm=5176.bbsl254.0.0.BAKNSy


3、忽略0831

https://bbs.aliyun.com/read/281976.html?spm=5176.bbsl254.0.0.BAKNSy


4、艺人播放量是指预测时间段内的总播放量

https://bbs.aliyun.com/read/280758.html?spm=5176.bbsl254.0.0.hRxaMR


5、关于缓存和下载: 未解决

https://bbs.aliyun.com/read/281875.html?spm=5176.bbsl254.0.0.hRxaMR


6、“初始播放量”指的是记录收集之前所有的播放量,但不一定是发行后的播放量,因为有的歌曲在之后才发行,但是发行前已有播放(非官方回复)

https://bbs.aliyun.com/read/280758.html?spm=5176.bbsl254.0.0.hRxaMR


7、非官方qq群:341587561


8、歌曲表里面的歌曲是某艺人的全部歌曲, 这些歌曲的播放量相加等于该歌手的总播放量

https://bbs.aliyun.com/read/280004.html?spm=5176.bbsl254.0.0.xp59r5


9、有关于点播量突变的问题: 未解决

https://bbs.aliyun.com/read/281188.html?spm=5176.bbsl254.0.0.xp59r5


10、用户下载或收藏后,用户对歌曲的播放行为还会计数

https://bbs.aliyun.com/read/281043.html?spm=5176.bbsl254.0.0.xp59r5


11、

0 0