Python3.5+PyQt5词频统计(一)
来源:互联网 发布:外国媳妇 知乎 编辑:程序博客网 时间:2024/05/17 09:32
一、需求分析
统计给定英文文档中单词出现的频率,要求速度快、准确率高,有良好的交互界面,初期实现简单的分词、统计功能,不考虑词形变换等复杂情况,中期要实现相对简单的词形还原任务,后期实现复杂的词形变换还原(需要较强的自然语言处理能力,暂不考虑)
二、环境搭建
1. 官网下载安装Python3.5
2. 官网下载安装PyCharm
3. 可以在PyCharm打开setting>Project Interpreter>点击加号搜索PyQt5直接安装,其他安装方式请自行搜索
4. 下载Qt5.7安装,自带QtDesigner和QtCreator
注意事项
网上搜索许多PyQt教程,他们的PyQt5中一般自带QtDesigner程序,不知道为什么我的没有,所以只好下载完整的Qt5.7安装包
5. PyInstaller支持Python3,cx_Freeze暂不支持
三、测试案例
使用1M、20M、100M的txt文档,1M、100M的doc文档,50M的docx文档,一个小型的数字文档测试对数字分词的准确率
0 0
- Python3.5+PyQt5词频统计(一)
- Python3.5+PyQt5词频统计(二)
- Python3.5+PyQt5词频统计(三)
- python3结巴分词分行拆分统计词频
- 词频统计(上机)
- Python3.5+PyQt5多线程+itchat实现微信防撤回桌面版(一)
- NLTK 词频统计(一) 词频统计,绘图,词性标注
- 词频统计(一):C++使用Vector做词频统计
- pyqt5&python3 Gui 入门教程 (一) 第一个窗口
- python3.6+pyqt5实现GUI设计(一)
- Hadoop词频统计(一)之集群模式运行
- python3.5 + pyqt5 + pyclarm (windows)
- 词频统计(文本格式)
- Hadoop 词频统计(续)
- Huffman 统计词频(C#)
- 打包python程序(win7(64) +python3.5 + pyqt5 + multiprocess)
- python3+PyQt5
- 词频统计
- mysql 函数
- 这是我最近改写的一个课本c程序
- WPF 在同一窗口区域实现界面切换
- DES如何加密
- STS Spring Tool Suite™ 快速创建spring mvc项目
- Python3.5+PyQt5词频统计(一)
- opnet14.5学习总结二
- 第一个C语言程序
- STL list介绍
- 洛谷 P1037 产生数
- Spark RDD弹性分布式数据集
- 年轻的90后就应该马上创业不要等
- UGUI 虚拟摇杆的实现
- 60条有名的原则与定理