【数据平台】pandas将一列中的文本拆分成多行
来源:互联网 发布:最简单的游戏编程 编辑:程序博客网 时间:2024/05/21 00:47
1、场景:如下图,要将cont中的字符串分割出词汇并单独成一行
2、一列中的文本拆分成多行的效果:
3、实现方法:
方法一:
df=df.drop('cont', axis=1).join(df['cont'].str.split('/', expand=True).stack().reset_index(level=1, drop=True).rename('tag'))
方法二:
df=df['cont'].str.split('/', expand=True).stack().reset_index(level=0).set_index('level_0').rename(columns={0:'tag'}).join(df.drop('cont', axis=1))
参考:https://zhuanlan.zhihu.com/p/28337202
比较好用!
阅读全文
0 0
- 【数据平台】pandas将一列中的文本拆分成多行
- hive一行数据中一列拆分成多行
- hive一行数据中一列拆分成多行
- hive一行数据中一列拆分成多行
- Pandas学习之文本拆分
- excel一列数据拆分为两列
- 【数据平台】dataframe一列成多列
- Excel中如何将一个Excel工作表的数据按一列的关键字拆分成多个工作表
- Excel表操作 将一列数据设为文本(单元格左上角标有绿色三角)
- Pandas 文本数据方法 cat()
- Pandas 文本数据方法 get( )
- Pandas 文本数据方法 join( )
- Pandas 文本数据方法 get_dummies()
- Pandas 文本数据方法 contains()
- Pandas 文本数据方法 replace( )
- Pandas 文本数据方法 repeat( )
- Pandas 文本数据方法 wrap( )
- Pandas 文本数据方法 slice( )
- 20171031
- cf612D-The Union of k-Segments(思路题(类似扫描线))
- 【LPC54100】GPIO驱动TFT LCD
- Erlang 并发编程基础二
- luogu 2700 逐个击破
- 【数据平台】pandas将一列中的文本拆分成多行
- VirtualBox中克隆出现的eth0错误的问题
- std::any——C++弱类型特性
- 99. Recover Binary Search Tree
- 【BZOJ1055】【HAOI2008】玩具取名
- 20171031
- JAVA实现excel表格导出,(IDEA 导入jar包操作)
- HTMl5的sessionStorage和localStorage
- int、 long、 float、 double范围(java)