掌柜大作战(15):营业执照图片识别,有点尴尬

来源:互联网 发布:g41 g42编程实例 编辑:程序博客网 时间:2024/03/28 19:28
公司和部门,近年来倡导AI高科技。
我参与的项目里,可以使用下AI大数据部门提供的图片识别服务,具体应用场景是:营业执照图片识别。用户上传企业的营业执照图片之后,自动识别出“法人”、“统一社会信用码”、“注册地址”等关键字段。

但是,在项目中实际写了Demo之后发现,不太可行。
1、线上项目,用户上传的都是“PDF格式”,文件里面是图片。
看样子,应该是PDF扫描版。
但是,PDF格式暂时还不被支持。
也就是说,大部分的需求和应用场景还没能从技术上实现。
2、部分用户上传的JPG/PNG格式的图片,但是。
图片上面有红色原型公章,遮住了部分内容。
还有“此复印件仅供参考使用,不作他用,再次复印无效”字样,也遮住了部分内容。
关键字段被遮住,无法识别。

3、只有少部分用户上传的是图片并且没有被遮住。
这样可以识别出大部分的关键字段。
AI技术方面目前也支持这种情况。

因此,对于营业执照识别,由于这个证件的特殊性,用户会加公章以及用户习惯上传PDF,AI技术显得不够牛B。
其它场景,身份证识别、银行卡识别,就没有以上问题。

但是,Boss和大Boss懂得这个道理“学写作,先写才能写好,而不是写好了再去写”。
因此,我们最终还是会把这个AI服务投入到项目中。
先用了再说,有了开头,我们部门才会逐步走向AI升级的光明道路上,而不是总是走老路。

小雷FansUnion-京东程序员一枚
2017年10月
北京-亦庄
阅读全文
0 0
原创粉丝点击