OCR检测识别总结

来源:互联网 发布:沈阳浟湙网络怎么样 编辑:程序博客网 时间:2024/05/16 19:43

先记下来。

1、传统方法

灰度→二值化→校正图像→提取特征(LBP、PCA等等)→分类器(SVM等)。

需要文字预先分割。

2、基于卷积网络

免去了提取特征过程,直接往CNN里丢图像。

也不用文字预先分割。

检测:使用faster-rcnn或者yolo框选出区域

识别:multi-digit-number-classification、RNN/LSTM/GRU+CTC、attention-mechanism、mutli-label-classification