笔记

来源:互联网 发布:手机音乐转调软件 编辑:程序博客网 时间:2024/06/06 00:58

本文主要利用tesseract-ocr对中文进行识别,所做的工作就是对图片进行分割处理,把需要的部分利用tesseract-ocr去识别。主要识别昵称,地区,个性签名。
大体的思路就是利用每一区域间的灰度变化把图像分块,确定具体的某一块代表什么。昵称里含有性别标志,我们可以从右往左找直到遇到黑色区域,由于性别标志的大小固定,我们就可以从第一个遇到黑色区域的位置开始裁掉性别标志。由于不同手机的分辨率不同,我们可以分情况去考虑。同时由于一些用户没有个性签名,或者没有填写 地区,也可以分情况去考虑。在程序中要加入try except,一旦有异常情况,我们可以知道程序哪里出错了,同时我们要打印日志,知道程序运行到什么地步了,不能只是等程序输出最后的结果。

linux 系统下常用指令
kill 进程号 杀掉一个进程 cd进入某个目录下
ps 显示当前进程,
Python2.7 +程序目路径(先进入Python环境下,然后输入这个就可以运行程序了。)
ctrl+z 暂停当前的指令
cat +文件 显示文件内容
mikdir 创建新的文件夹
pwd 显示当前目录
rz 上传文件
rf 删除文件
touch 123.txt 新建文件
vi 123.txt (编辑123.txt) i (插入) hello (编辑的内容) ESC(退出当前命令) :wq(保存并退出) :q!(强制退出vi)
rm 123.txt(删除文件) rm -rf abc(删除文件夹)
ll (显示当前目录下的文件夹,创建时间,)
ls(列出当前目录下的文件名)
cd + 文件夹名(进入某个目录下)
tail-f +文件名(跟踪某个文件)
Tab (自动补全)
ctrl +c(终止当前命令)
ctrl +向上箭头(退到上一个命令)
kill-9 强杀
sz 1.jpg(导出1.jpg)
cd /(返回根目录)
cd ..(返回上一层目录)
python2.7 zxcvbn.py (启python程序)
nohup java -jar asd.jar &(启Java程序)
ps -ef | grep java(显示进程)
pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple gevent(python中使用指定镜像下载依赖包)

原创粉丝点击