图形识别的应用和发展

来源:互联网 发布:网络教育报名方式 编辑:程序博客网 时间:2024/05/22 05:20


        多媒体识别是信息检索中难度较高且需求日益旺盛的一个问题。以图像为例,按照图像检索中使用的信息区分,图像可以分为两类:基于文本的图像检索和基于内容识别的图像检索。基于文本的图像检索完全不分析和利用图像本身的内容,其检索质量完全依赖于与图像关联的文字信息与图像内容的相关性,因此有必要引入基于内容的图像检索。

       基于图片的搜索模式自09年以来在全球各大权威评选中,都被公认为未来几年互联网最有前途的创新应用。随着互联网信息的急剧膨胀,文字搜索这种序列化的搜索模式已经不能满足用户的需求,互联网搜索将拓展到更宽泛、更形象的图片搜索阶段。关于读图时代,李彦宏说,互联网一直以来最主流的应用是搜索,而搜索的主要载体是文字,但现在越来越多的图片被上传到网上,现在图片已经成了内容的一种新形式,“图片内容在互联网的信息量正在超过文字,这当中隐藏着很多值得挖掘的信息”。

       通用图像识别的实现,仰仗的是“像人脑一样思考”的深度学习技术。传统图像搜索只识别对比图像本身,比如颜色、纹理这些要素,而基于深度学习的图像搜索加入了人脸、人的姿态、地理位置、字符等语义特征。百度董事长李彦宏说,目前图像搜索应用中需求表达最多的一个类型与生活方式相关,占到拍照搜索的35.5%,比如拍下箱包衣服搜索网购地址,这种搜索有极高的商业价值;占比第二位的是人脸搜索,比如拍下在街上偶遇的人上传搜索类似照片等。

       发展图像搜索技术的终极目的不是识别出景物,而是提供后续的服务。“识别出图像之后,更重要的是通过分析满足用户的需求,比如寻找同款、价格比对等等。芮勇认为,真正的图像实体搜索还未达到普及实用阶段,由于图像搜索需要相应的如摄像头硬件的便利性支持,并具有实际使用场景的移动、户外等多样性特点,它天然地与移动互联网的发展息息相关。随着移动互联网的高速发展,在未来二至五年内,图像搜索将迎来新一轮的应用高潮。图像识别和图像搜索结合用户使用场景,能够在复杂背景条件下准确地识别和提取图片中的主体信息,并使用当前人工智能领域较为先进的深度学习技术对获取到的图片信息进行语义分析,最终由搜索引擎研发团队进行大数据分析和处理,形成以图像元素为核心的高度智能的数据库。现在图像识别和图像搜索的应用范围越来越广,例如:
1、手机拍照购物;在书店、超市、电器卖场随手拍摄一个商品,即可查到该商品在网上商城的价格。在我国4.3亿规模的移动互联网用户中,已有超过1亿用户选择登录手机淘宝购物。移动拍照购物搜索,只需通过手机拍摄相应物品的照片就可进行购物搜索,这样的搜索工具使网络购物变得更加直观、便捷。
例如用户拍衣服,转到线上进行比价和购买。再或者很多电商会在随货发送促销单页,用户手机拍下感兴趣的商品,立刻实现在线购买。
2、购物网站相似;在具体商品页面下部,自动列出相似款商品。在各种图库中,不管是公开的图片库,还是企业内部的产品库,让使用者快速搜到相似的图片,节省时间,提高效率。可以是用户上传图片搜索,也可以是站内图片点击搜索。
3、 媒体互动营销;用户拍地铁灯箱的广告活动图片,发送微博参与抽奖,企业和客户进行良性互动,紧紧抓住客户的心灵,在更好地满足客户的个性化需求、为客户提供个性化服务的同时,树立起企业产品和服务在顾客心目中的良好形象。通过自动从上传的照片中提取信息,并对照片进行角度偏差、均衡光线干扰、去除复杂背景等方面的处理,反馈给用户需要推送的丰富内容。
4、目录销售;在特定的商业环境中,目录销售仍然是营销利器,现在还可以加上高科技手段,用户在享受购物目录翻阅的便捷和惬意过程中,用手机拍下感兴趣的图片,即刻被引导到商家的网站,激活线上行为。为用户提供了方便的购买途径,只要简单的网络操作,即时足不出户,也可送货上门,并具有完善的售后服务。
5、手机导览增值服务;着重为观众提供作品背后的信息体验,用户手机拍下感兴趣的展品,相关的深度信息立刻在手机中显示。如艺术家及其创作或活动简介、艺术评论、视频影像等,并能提供链接到美术馆网站、微博、留言,让观众参与评论和分享,提供各种实时互动服务,使得观众对艺术作品的体验更为全面、立体和现实。打开客户端,进入主界面,点击拍照按钮,对准目标拍摄;拍摄图片自动上传到云端处理,并将识别结果返回到客户端;识别返回后,即可看到更多的精彩内容。
6、 媒体监测;在图像时代,品牌的视觉资产比以往任何时候都更有价值,随着社会化媒体的兴起,越来越多人们热衷拍摄和分享图片。用纯粹的基于文本的方法来搜集品牌的情报,将逐渐的无法满足用户的需求。先进的图像识别工具,可以大大弥补文本搜索信息的缺陷。通过对包含品牌logo的图片的识别,在微博等社会化网络中进行实时的品牌监测。
7、版权保护;当摄影师的图片被图片中介公司购买,后者以销售图片获得商业利益。但在目前的情况下,图片所有人并不能很有力地追踪图片是否被盗用。规范的大公司出资购买图片,而大量非规范的小公司或者个人,则堂而皇之的免费用着高质量的图片,肆意的盗取摄影师及中介方利益。通过图像识别技术,发现同源图片的整体或局部在哪些地方出现,包括线上和线下(线下媒体须提供电子版或扫描版),保护图片所有者的版权。

      国际上已经有很多顶级企业如Google、Bing、Ebay、Amazon等在进军这一领域。Google连续投资或收购了Plink、 Pixazza、Like三家公司,累计金额超过1亿2千万美金;苹果则收购了人脸视觉搜索Polar Rose;微软也在Bing上大力推广图像相似搜索。而11月初阿里巴巴集团投资了基于视觉的图片购物搜索淘淘搜(www.taotaosou.com)。一般企业也在往这边发展,比如南京轻搜信息科技有限公司为客户提供以图搜图的服务。南京轻搜信息科技有限公司(www.1000look.com),是一家专注于图像算法服务的高科技公司,为客户提供以图搜图的服务,在图像识别和图像相似搜索方面拥有先进的核心技术。他们的核心技术团队拥有图像算法、大数据分析及云计算架构等多个方向的专家,能够为提供更好的搜索结果和更高效的搜索速度,并提供针对海量数据的多维度分析。他们的团队在图像识别和图像搜索方面拥有世界领先的自主研发核心技术,并拥有多项自主的图像算法专利及相应配置的软件著作权。结合用户使用场景,能够在复杂背景条件下准确地识别和提取图片中的主体信息,并使用当前人工智能领域较为先进的深度学习技术对获取到的图片信息进行语义分析,最终由搜索引擎研发团队进行大数据分析和处理,形成以图像元素为核心的高度智能的数据库。  他们还打造了一个针对图像识别及搜索领域的综合交流平台--有图必应(www.qsooo.com)。平台提供针对图像搜索、识别等应用需求的发布和交流,有能力承接需求研发的个人或公司也可以通过揭榜的方式与需求发布方达成合作意向。

 

 

 

0 0