笔迹宽度估计的低质量文本图像二值化(Robust Document Image Binarization Technique for Degraded Document Images)
来源:互联网 发布:微信公众号回调域名 编辑:程序博客网 时间:2024/05/23 11:34
文本图像二值化在OCR和相关领域是个老话题,快速而准确的的二值化方法对这些领域的图像进一步处理尤为重要。对于图像亮度特征的有全局二值化、局部二值化,在图像亮度有明显双峰特征的是可进行全局二值化,金典的算法有OTSU,但是一些低质量文本并无双峰特征,这样对这些文本进行二值化就是一种难题。现阶段也存在许多亮度特征局部二值化算法,比如Niblack、Sauvola、Nick,但是这些算法的确定是二值化效果过于依赖所取得窗口大小换句话说是文本字符大小。当然还有一些迭代法、拉普拉斯能量法、Markov随机场等一些方法。本文是《Robust Document Image Binarization Technique for Degraded Document Images》的阅读笔记,对低质量文本图像二值化的一种解决方法。
step 1:构造局部对比度图像
定义:src为原灰度图像
a:根据下试计算局部对比度图像,Imax为局部最大值,Imin为局部最小值e为正无穷小
b:计算权值a,其中Std为src全局标准差y为预定义参数
c:由上两式构造局部对比度图像
得到的图像有明显的双峰特征。
step 2:文本笔记边缘检测
定义:由step1得到的图像为Cimg
a:对Cimg进行Otsu处理提取笔迹边缘像素
b:对src用Canny进行边缘检测得到Canny edge map图像
c:结合a、b保留两幅图像都有的像素点得到图像Edg
step 3:局部阈值化
a:边缘宽度估计得到局部阈值化窗口大小
b:根据下式对Edg图像阈值化处理
step 4:后期处理
0 0
- 笔迹宽度估计的低质量文本图像二值化(Robust Document Image Binarization Technique for Degraded Document Images)
- A paper: "Parallel Nonparametric Binarization for Degraded Document Images"Accepted
- document.images
- 论文阅读_基于CNN的图像二值化_Robust Binarization for Video Text Recognition
- 关于document.images
- 获取document元素显示的实际宽度
- 窗体、滚动条宽度和高度获取以及document.body和document.documentElement,document.compatMode解释(网页高度宽度)
- document文本对象
- document
- document
- Document
- document
- Document
- Document
- document
- Document
- document
- document
- 【31-35】剑指offer
- bzoj1251(splay序列操作)
- Java的HashMap和HashTable
- Parsing XML Data
- HDU 4553 约会安排(线段树区间合并&优先级)
- 笔迹宽度估计的低质量文本图像二值化(Robust Document Image Binarization Technique for Degraded Document Images)
- Co-prime Array
- 遍历二叉树的各种操作
- 常用的Java资源整理, 还是比较全的。
- Linux 文件系统 与 目录树
- Co-prime Array
- 由一道题看栈的应用
- 斯诺登再曝新料:证实美黑客攻击中国公司 哪家中企中招了?
- NYOJ 20 吝啬的国度