1对n的条件筛选
来源:互联网 发布:19岁网络女主播萱萱 编辑:程序博客网 时间:2024/05/22 10:28
文件中有word pinyin freq参数,一个word可能对应多个pinyin和多个freq,例如:
的 de 123
的 di 100
读取一个文件进行高freq的筛选
def gen_single_word_dic(): import codecs,os THIS_PATH = os.path.dirname(os.path.abspath(__file__)) BASE_WORDS_HZOUT = os.path.join(THIS_PATH, "data","HZout_NoTone.txt") fileObj= codecs.open(BASE_WORDS_HZOUT,mode="rb",encoding="utf-16") word_pinyin_freq_dic = {} for line in fileObj.readlines(): splited_line = line.split("\t") word = splited_line[0] check_word_exists = word_pinyin_freq_dic.get(word) if check_word_exists: #if word exists check_word_exists.append(splited_line) else:#if word not exists list_bak = [] list_bak.append(splited_line) word_pinyin_freq_dic[word] = list_bak fileObj.close() return word_pinyin_freq_dic# gen_single_word_dic()#def get_high_freq(): import codecs word_wpf_dic = gen_single_word_dic() fileObj = codecs.open("data/high_frequence_single_word.txt",mode="wb",encoding="utf-16") for key in word_wpf_dic: word_pinyin_freq_list_len = len(word_wpf_dic[key]) if word_pinyin_freq_list_len > 1: print word_wpf_dic[key] high_freq_word = max(word_wpf_dic[key], key=lambda x: x[2]) print high_freq_word com_str = "\t".join(high_freq_word) fileObj.write(com_str) fileObj.close()get_high_freq()将解析后的数据写入到新文件中
0 0
- 1对n的条件筛选
- 对与主表的筛选条件,应该放在where后面
- 条件筛选
- 素数筛选法 (求1~n的素数)
- 扩展 sp_helpindex, 增加 INCLUDE 和筛选索引的筛选条件
- 满足条件的n
- landa中角色的筛选条件
- DataTable筛选符合条件的DataRow
- 关于DataGridView画面条件筛选的思考
- 关于做多个条件进行筛选的思路
- 自动筛选符合条件的行数
- 根据条件筛选指定的日期
- Android最牛逼的多条件筛选菜单
- 通过dt筛选符合条件的结果
- Android最牛逼的多条件筛选菜单
- jde 动态添加筛选条件的注意事项
- 关于条件筛选出现的查询问题
- 对DataView的筛选问题!!
- 为pcDuino安装OpenWrt
- Unity3D的断点调试功能
- csv模块学习:Python学习笔记—CSV模块读写数据
- POJ2411 状态压缩DP
- Eclipse功能键大全
- 1对n的条件筛选
- DCT变换及matlab实现
- linux VIM/VI的工作模式
- Android内存溢出整理总结
- Mac上 Intellij 13配置tomcat7
- mkswap
- html+css----基本介绍
- 苹果(nyoj 289)
- 题目133:子序列。