• 实战案例:科技工作者心理健康数据分析
来源:互联网 发布:阿里云 驾照识别 编辑:程序博客网 时间:2024/05/18 03:33
import csv# 数据集路径data_path = './survey.csv'def run_main(): """ 主函数 """ male_set = {'male', 'm'} # “男性”可能的取值 female_set = {'female', 'f'} # “女性”可能的取值 # 构造统计结果的数据结构 result_dict # 其中每个元素是键值对,“键”是国家名称,“值”是列表结构, # 列表的第一个数为该国家女性统计数据,第二个数为该国家男性统计数据 # 如 {'United States': [20, 50], 'Canada': [30, 40]} # 思考:这里的“值”为什么用列表(list)而不用元组(tuple) result_dict = {} with open(data_path, 'r', newline='') as csvfile: # 加载数据 rows = csv.reader(csvfile) for i, row in enumerate(rows): if i == 0: # 跳过第一行表头数据 continue if i % 50 == 0: print('正在处理第{}行数据...'.format(i)) # 性别数据 gender_val = row[2] country_val = row[3] # 去掉可能存在的空格 gender_val = gender_val.replace(' ', '') # 转换为小写 gender_val = gender_val.lower() # 判断“国家”是否已经存在 if country_val not in result_dict: # 如果不存在,初始化数据 result_dict[country_val] = [0, 0] # 判断性别 if gender_val in female_set: # 女性 result_dict[country_val][0] += 1 elif gender_val in male_set: # 男性 result_dict[country_val][1] += 1 else: # 噪声数据,不做处理 pass # 将结果写入文件 with open('gender_country.csv', 'w', newline='', encoding='utf-16') as csvfile: csvwriter = csv.writer(csvfile, delimiter=',') # 写入表头 csvwriter.writerow(['国家', '男性', '女性']) # 写入统计结果 for k, v in list(result_dict.items()): csvwriter.writerow([k, v[0], v[1]])if __name__ == '__main__':run_main()
''''
项目名称:科技工作者心理健康数据分析项目地址:https://www.kaggle.com/osmi/mental-health-in-tech-survey项目任务:统计各国家男性、女性心理健康数据分布
阅读全文
0 0
- • 实战案例:科技工作者心理健康数据分析
- 互联网大数据日志收集离线实时分析实战案例
- 基于Python数据分析与机器学习案例实战教程
- 心理健康
- 对象分析过程案例实战
- kafka实战案例分析总结
- 数据同步案例分析
- 《八个案例贯通R语言数据分析与挖掘》实战培训课
- 大数据Spark企业级实战版【学习笔记】-----Spark Streaming案例分析
- 数据分析挖掘全套课程视频spss/sas/R/excel/案例实战体系教学
- 航班数据分析实战
- <<《Spark商业案例与性能调优实战100课》第17课:商业案例之NBA篮球运动员大数据分析系统代码实战
- 《Spark商业案例与性能调优实战100课》第19课:商业案例之NBA篮球运动员大数据分析核心业务逻辑代码实战
- 面向对象分析过程案例实战
- 面向对象分析过程案例实战
- 面向对象分析过程案例实战
- 面向对象分析过程案例实战
- 面向对象分析过程案例实战
- Java中的自动装箱与拆箱
- 进程控制
- [杂题] Codeforces 739D Round #381 (Div. 1) D. Recover a functional graph
- WinRT surface屏幕常亮设置
- NYOJ 58最少步数
- • 实战案例:科技工作者心理健康数据分析
- [一天几个linux命令] 用户与用户组
- 计算机图形学-基于OpenGL的绘制直线及图形变换练习
- 判断是否是合法的出栈序列
- 勒索病毒刷出的存在感远不及安全公司强!
- JAVA 类加载时机与过程
- codeforce811b Vladik and Complicated Book(都是不好好想题惹的祸)
- static关键字
- Hibernate学习(3) (继承映射,配置文件和注解版)