有关csv格式的数据转换成libsvm格式的数据
来源:互联网 发布:360数据恢复手机版 编辑:程序博客网 时间:2024/05/19 02:45
需要传入一个pandas的DataFrame格式的数据,将其转换为libsvm格式的数据
代码如下
# -*- coding: utf-8 -*-"""Created on Sat May 13 21:50:03 2017@author: Administrator"""import pandas as pd import timedef df2ffm(df, fp): ''' Convert pandas.DataFrame to data format that libffm can directly use @Args: df: pandas.DataFrame to be converted fp: save libffm format data to fp<filepath> ''' now = time.time() print('Format Converting begin in time:...',now) columns = df.columns.values d = len(columns) feature_index = [i for i in range(d)] field_index = [0]*d field = [] for col in columns: field.append(col.split('_')[0]) index = -1 for i in range(d): if i==0 or field[i]!=field[i-1]: index+=1 field_index[i] = index with open(fp, 'w') as f: for row in df.values: line =str(int(row[0])) for i in range(1, len(row)): if row[i]!=0: line += " %d:%d" % (feature_index[i], row[i]) line+='\n' f.write(line) print('finish convert,the cost time is ',time.time()-now) print('[Done]') print()def main(): df = pd.read_csv(r'E:\tencent\input\train1.csv') df = df.fillna(0) fp = r'E:\tencent\output\train.csv' df2ffm(df,fp)if __name__ == '__main__': main()
0 0
- 有关csv格式的数据转换成libsvm格式的数据
- 读取csv文件转换成你自己想要格式的数据
- 读取csv文件转换成你自己想要格式的数据
- python解决数据预处理:将KDDCPU99数据格式转换成libsvm可读的格式
- HBase导出CSV格式数据的方法
- php导入导出CSV格式的数据
- hive导入CSV格式的数据
- CSV格式转成libsvm标准格式的小程序
- YUV422格式的数据转换成RGB24
- NSDictionary转换成json格式的数据
- 数组转换成json格式的数据
- 我写的采用csv格式将数据转换为excel的函数,带有分栏
- csv转Libsvm格式
- 采用csv格式将数据转换为excel的函数,带有分栏功能
- 如何生成libsvm格式数据
- 使用ADO.net链接到csv格式的数据.
- Nodejs fastCSV 实现数据的csv格式导出
- 如何用命令行导入csv格式的数据
- i am from shanghai 将字符串倒过来输出的算法
- 【Codeforces Round #414 C Naming Company】
- 十大算法简述
- 学习Linux命令(7)
- 单链表部分1
- 有关csv格式的数据转换成libsvm格式的数据
- PAT-A-1051. Pop Sequence (25)
- 我所理解的多线程之synchronized
- Dbutils简介
- Android触摸事件分发机制完全解析《一》
- 腾讯云搭建git服务器--和踩过的坑
- 12 qt的反射机制应用
- Mariadb数据库配置及管理
- C语言中局部变量与全局变量在内存中的存放位置