预处理程序学习与分析(一)
来源:互联网 发布:粒子群算法 详解 ppt 编辑:程序博客网 时间:2024/05/16 08:46
一、 vocab = set(text)
# {‘跑’, ‘嚬’, ‘夔’, ‘痏’, ‘天’, ….};把字符串转为无序不重复元素集,并去重。
for word in vocab:
vocab_count[word] = 0
for word in text:
vocab_count[word] += 1
for word in vocab_count:
#字典->列表 vocab_count_list.append((word, vocab_count[word]))
vocab_count_list.sort(key=lambda x: x[1], reverse=True)
if len(vocab_count_list) > max_vocab:
vocab_count_list = vocab_count_list[:max_vocab]
vocab = [x[0] for x in vocab_count_list]
self.vocab = vocab
self.word_to_int_table={c:i for i, c in enumerate(self.vocab)}
self.int_to_word_table = dict(enumerate(self.vocab))
- 预处理程序学习与分析(一)
- 时间序列分析之预处理(一)
- Object-C学习(七):预处理程序
- 程序编译与预处理
- 程序文件与预处理
- 暑期学习一(C++预处理命令)
- Spark学习(一)基础数据预处理
- 预处理、const、static与sizeof(一)
- python数据分析与挖掘学习笔记(2)-淘宝商品数据清洗及预处理
- 计算机病毒分析与对抗学习--------(一)
- 数据分析与挖掘学习(一)
- c语言预处理程序与注释(#error)
- Python数据分析与挖掘实战(数据预处理)
- 数据科学与机器学习管道中预处理的重要性(一):中心化、缩放和K近邻
- 数据科学与机器学习管道中预处理的重要性(一):中心化、缩放和K近邻
- 数据科学与机器学习管道中预处理的重要性(一):中心化、缩放和K近邻
- Zookeeper学习笔记:客户端程序分析一
- 嵌入式学习11(C语言预处理与宏)
- mysql事务回滚机制概述
- 通过Spark Rest 服务监控Spark任务执行情况
- c++ 可变参数模板展开原理
- 有趣的Java-J05
- 比较好的自媒体平台推荐,揭秘哪个自媒体平台收入最高
- 预处理程序学习与分析(一)
- Linux网络接口配置文件解析
- 刷题训练——PAT (Basic Level)-1039
- ListView 返回顶部第一条
- 无法解析的外部符号, 但是已经添加的lib库
- 183. Customers Who Never Order
- Hadoop-2.7.3下安装Hbase-1.2.6
- 382. Linked List Random Node
- FreeRTOS 低功耗之 tickless 模式