趣味分析系列 | 文胸品牌知多少(一)
来源:互联网 发布:sql降序查询 编辑:程序博客网 时间:2024/05/17 09:32
一年一度的圣诞节马上就快到了,各位男神是不是又在劳神费力地给女神们准备圣诞节礼物?今年送啥呢?
送脑白金怎么样?NO,NO,NO!脑白金是送给大妈的!!!
直接给MONEY? NO,NO,NO!太俗气!!!
送鲜花与巧克力?NO,NO,NO!不实在!!!
按我说,直接送个文胸套装,有情调又贴心!!!说不定你的女神会给你个惊喜呢!
但是问题又来了,挑选哪个品牌的文胸好呢,总不能送一个层次太LOW的吧。因此,你需要对文胸的品牌有个大概的了解。简单讲,首先你得了解女生文胸品牌有多少?品牌的排名度是怎样的?为了减少各位男神上网的搜索时间,看我下面仔细分析给你看!
一、数据准备
打开浏览器上某东,祭出我们的F12神器,然后把如下网页代码复制下来(还不会?来找我,我当面告诉你,教到你会为止!)。
源码稍作处理如下:
二、分析过程
1、把数据上传到OpenFEA(请访问www.openfea.cn的下载专区,可以在互联网上搭建的在线试用环境中跟我一起分析),如下图:
2、加载数据到内存DF表
3、数据分析与处理
(1)数据行列转换
(2)字段重命名与数据打标签
(3)数据过滤
(4)数据提取
(5)数据合并
(6)存储结果数据
(7)结论
女生文胸品牌总共有1240个,各位男神慢慢了解吧,我只能帮你到这了。
三、分析脚本
#加载数据
df1 = load csv by jd_goods.txt with (encoding="gbk",sep="=",header=-1)
#行列互换
df2 = @udf df1 by udf0.df_T
rename df2 as (0:"content")
#数据打标签
df2.flag1 = str content by (contains("brand-"))
df2.flag2 = str content by (contains(u'品牌'))
df3 = filter df2 by (flag1==True)
df4 = filter df2 by (flag2==True)
#数据分析与提取
df3.brandno =str content by (findall("(\d+)"))
df3.brand_code=str brandno by (get(0))
df4.brands = str content by (split("::"))
df4.brands_1=str brands by (get(1))
df4.brand_name = str brands_1 by ([0:-8])
#数据合并
df3 = add idx1 by (range(df3.index.size))
df4 = add idx2 by (range(df4.index.size))
df5 = join (df3,df4) by (idx1,idx2)
df6 = loc df5 by (brand_name,brand_code)
#存储数据
store df6 to csv by jd_goods.csv
<烦请关注,下期内容更精彩!>
趣味分析系列 | 文胸纬度分析360度(罩杯、颜色......)(二)
趣味分析系列 | 女神在哪里(三)
更多文章,敬请期待......
- 趣味分析系列 | 文胸品牌知多少(一)
- 趣味分析系列 | 女生罩杯型号知多少
- 趣味猜猜(一)
- 趣味数组(一)
- 趣味分析系列 | 维多利亚女神的秘密
- 趣味题系列(4):
- 趣味题系列(5):
- 少女内衣、学生文胸、少女文胸 、学生内衣、开店创业、内衣品牌、内衣代理、内衣加盟-可娃衣
- 趣味面试题(一)
- Java趣味编程(一)
- 【虫师--系列12】性能测试知多少---性能需求分析
- 【虫师--系列15】性能测试知多少---系统架构分析
- 网络安全知多少(一)
- ActiveMQ 分析系列(一)
- 趣味程序之趣味系列
- 性能测试知多少系列(目录)
- 趣味题系列(6):帽子戏法
- 趣味题系列(7):蚂蚁
- SSL P1408【树】哈夫曼树(二)
- LINUX
- Oracle 的dataguard配置
- AJAX之XMLHttpRequest对象
- 测试boost::algorithm::replace_all 方法
- 趣味分析系列 | 文胸品牌知多少(一)
- 基础/Java基础/(3)面向对象的特征有哪些方面?
- hibernate和spring mongo对比
- Linux 使用wget 命令下载JDK的方法
- Android手机自定义一个文件并写入内容
- 《JAVA与模式》之单例模式
- java前端的重要框架---windowbuilder介绍
- 学习记录——数据链路层(2)
- 电子老鼠闯迷宫 SSL1455