谷歌推出AVA数据库：让机器识别视频中人类行为 | 研究

来源：互联网发布：淘宝seo从入门到精通编辑：程序博客网时间：2024/05/16 08:17

本文系网易新闻-智能工作室出品

聚焦AI，读懂下一个大时代！

网易年度AI人物评选——2017网易AI英雄风云榜，自荐提名进行中！

奖项设置：技术创新人物TOP 10，商业创新人物TOP 10

表彰人物：华人科学家、学者、企业家、创业者

评委阵容：资深媒体人、AI投资人、AI专业机构等

颁奖：2017年12月，中国乌镇

关注网易智能公众号（ID：smartman163），输入关键词“评奖”，随时获取评奖动态！

【网易智能讯 10月23日消息】计算机视觉正在成为科技公司的一大福音，能够让机器加速运转，并完成迄今为止只能由人类完成的任务。

几个月前，eBay公布将要添加新的搜索功能，可以让用户使用现有照片来寻找类似商品，同时线上服装零售商ASOS则在时尚领域涉足此项。Shutterstock上周公布了一项全新的测试功能，用户可以根据自己的布局来搜索股票照片。过了几天，谷歌照片应用发布了新的宠物图像识别功能。

简而言之，在计算机视觉领域，发展越来越激动人心，同时也可以看到人们对人工智能领域的大量投资卓有成效。

目前，大多数计算机视觉技术的进步主要发生在静态图像领域，但我们也开始在视频中看到计算机视觉技术的成果。例如，俄罗斯当局在全国的实时监控网络中应用了面部识别技术。Pornhub也在做类似的事情，自动对“成人娱乐”视频进行分类，包括训练系统识别特定的性姿势。此外，还有蓬勃发展的自动驾驶汽车行业，在很大程度上依赖于机器对现实世界行为理解的能力。

在这样的背景下，谷歌推出了一个新的视频数据库，希望能够推动计算机视觉识别影像中行为的研究。“原子视觉行为”的英文缩写“AVA”是一个由多个标签组成的数据库，用户可以在视频序列中进行操作。

视频中动作识别的困难主要在于视频中各种复杂的场景交织在一起，多个动作也在同一时间由不同的人发出。