阿里音乐流行趋势预测大赛—浅尝辄止(二)
来源:互联网 发布:癌症诊断书生成软件 编辑:程序博客网 时间:2024/05/20 13:40
本篇博文接上一篇博文浅尝辄止(一)的内容,这里主要介绍竞赛给的数据中时间戳的处理方法,时间戳是形如“1426406400”形式的一组时间计数,我们需要将其转化为正常的时分秒的形式,然后再将转化后的结果写入到csv文件当中去,最后我们得到的转换前的和转换后的文件内容形式如下:
转换后的:
从左到右的数据依次为:用户ID,歌曲ID,时间点,用户操作行为,日期,月,日,时;观察发现我们这里做的主要工作只是将Unix时间戳转化成日常形式,然后将月,日,时,截取出来,将这些数据分别对应的重新写入到csv文件当中。下面给出具体的程序,程序做了简单标注,欢迎指正!
# -*- coding: utf-8 -*- import timeimport pandas as pd import numpyimport csvstart=time.clock()def timestamp_datetime(value): format = '%Y-%m-%d %H:%M:%S' #'%Y-%m-%d %H:%M:%S' value = time.localtime(value) dt = time.strftime(format, value) return dtdef timestamp_datetime_month(value): format = '%m' value = time.localtime(value) dtm = time.strftime(format, value) return dtmdef timestamp_datetime_day(value): format = '%d' value = time.localtime(value) dtd = time.strftime(format, value) return dtddef timestamp_datetime_hour(value): format = '%H' value = time.localtime(value) dth = time.strftime(format, value) return dth#t=eval('1426406400')#T=timestamp_datetime(t)actions=pd.read_csv('E:\\Tianchi\\Music\\mars_tianchi_user_actions.csv',nrows=1000000,header=None)date=actions.loc[:,2]user=actions.loc[:,0]song=actions.loc[:,1]act=actions.loc[:,3]day=actions.loc[:,4] #数据被切分出来i=0dt=numpy.mat(date) #或许用list列表更方便dt=numpy.transpose(dt)months=[]days=[]hours=[]while i<1000000: #5652232 #if date[i:(i+1)]=NaN: # break months.append(timestamp_datetime_month(float(dt[i,0]))) days.append(timestamp_datetime_day(float(dt[i,0]))) hours.append(timestamp_datetime_hour(float(dt[i,0]))) #三个大列表 T=timestamp_datetime(float(dt[i,0])) #时间戳变换 T=str(T) date.loc[i:(i+1)]=T i=i+1#print datedate=list(date)user=list(user)song=list(song)act=list(act)day=list(day)with open('E:\\Tianchi\\Music\\test.csv','wb') as myfile: i=0 mywriter=csv.writer(myfile) #实例化为mywriter while i<1000000: mywriter.writerow([user[i],song[i],date[i],act[i],day[i],months[i],days[i],hours[i]]) i=i+1end=time.clock()print 'running time is: %.3f'%(end-start)
0 0
- 阿里音乐流行趋势预测大赛—浅尝辄止(二)
- 阿里音乐流行趋势预测大赛—浅尝辄止(一)
- 阿里音乐流行趋势预测大赛—浅尝辄止(三)
- 天池_阿里音乐流行趋势预测大赛(1) —— 赛题分析
- 阿里音乐流行趋势预测大赛-赛后思路整理
- 【天池竞赛系列】阿里音乐流行趋势预测大赛思路
- 天池阿里音乐流行趋势预测大赛--复赛
- 天池阿里音乐流行趋势预测大赛--初赛
- 阿里音乐流行趋势预测大赛一起做-(1)介绍
- 阿里音乐流行趋势预测大赛一起做-(2)weka初识
- 阿里音乐流行趋势预测大赛一起做-(3)思路
- 阿里音乐流行趋势预测大赛一起做-(4)成绩提交
- 阿里音乐流行趋势预测大赛一起做-(5)温故知新
- 阿里音乐流行趋势预测大赛一起做-(6)小结
- 阿里音乐流行趋势预测大赛一起做-(7)初赛总结之用户分类
- 阿里音乐流行趋势预测大赛一起做-(1)介绍
- 阿里音乐流行趋势预测大赛一起做-(2)weka初识
- 阿里音乐流行趋势预测大赛一起做-(3)思路
- Ztree树形控件的使用
- 阿里音乐流行趋势预测大赛—浅尝辄止(一)
- XPath学习笔记
- tomcat7和iis7整合80端口后无法访问bin下资源
- android链接服务端数据库
- 阿里音乐流行趋势预测大赛—浅尝辄止(二)
- 八 s3c2440 linux 触摸屏 驱动代分析
- Flash as3事件学习
- AFNetWorking请求时, “Request failed: unacceptable content-type: text/html”
- Android多行文本折叠展开效果
- 查看电脑配置指令大全
- Android音频播放器的实现
- [iOS] 使用WebViewJavascriptBridge实现OC与JS交互
- linux常用命令之压缩与解压缩命令