搜文章
推荐 原创 视频 Java开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发
Lambda在线 > 新智元 > 谷歌开源超大型视频数据库,含800万视频 (附技术报告)

谷歌开源超大型视频数据库,含800万视频 (附技术报告)

新智元 2018-06-30

1 新智元编译1

来源:Google Research

编译:弗格森


 ❶ 业界领袖回溯60年AI历史,全球对话人工智能未来挑战,权威发布2016世界人工智能名人堂及中国人工智能产业发展报告;❷ 国际大咖“视频”远程参会, Bengio和李飞飞联袂寄语中国人工智能;❸ 探秘讯飞超脑及华为诺亚方舟实验室,最强CTO与7大研究院院长交锋;❹ 滴滴CTO与百度首席架构师坐镇智能驾驶论坛,新智元三大圆桌阵容史无前例;❺ 中国“大狗”与"X-Dog"震撼亮相,龙泉寺机器僧“贤二”卖萌。


9月28日,谷歌在官方博客上宣布,将含有800万个Youtube 视频URL 的视频数据库开源,视频总时长达到了50万个小时。一并发布的还有从包含了4800个知识图谱分类数据集中提取的视频级别标签。


详细技术报告下载,请在新智元后台回复0929下载。




这一数据库在规模和覆盖的种类上都比现有的视频数据库有显著提升。例如,较为著名的Sports-1M数据库,就只由100万个Youtube 视频和500个运动类目。谷歌官方博客上说,在视频的数量和种类上,Youtube-8M代表的是几乎指数级的增长。

 

“为了保证标签视频数据库的稳定性和质量,我们只采用浏览量超过1000的公共视频资源,随后,我们会构建一个多样化的词汇类目,这一类目在视觉上是可以观察得到的,也足够频繁。词汇的构建结合了频次分析、自动过滤、人为评价验证,并分为24个垂直分类”,谷歌博客写道。


下图是数据集的首页截图,展示了数据集的规模和多样性。



谷歌开源超大型视频数据库,含800万视频 (附技术报告)
谷歌开源超大型视频数据库,含800万视频 (附技术报告)


要在Youtube-8M 规模的数据库上理解视频,一般要求千万亿字节的视频存储和几十个CPU的消耗。未来让受计算机资源所限的研究者和学生也可以用上这一数据库,谷歌们对视频进行了预处理,并提取了帧级别的特征。使用的是最新的深度学习技术——通过ImageNet训练的开源  Inception-V3 图像注释模型。


这些特征的提取是在1帧每秒的瞬时分辨率上完成,从190万个视频帧中提取,并被压缩到可以放到一个硬盘中(小于1.5T)。


这样以来,只需要不到一天的时间,就可以下载这一数据库并在训练一个基本的TensorFlow模型。



谷歌开源超大型视频数据库,含800万视频 (附技术报告)
豪华嘉宾阵容,共飨 AI 盛宴
谷歌开源超大型视频数据库,含800万视频 (附技术报告)
谷歌开源超大型视频数据库,含800万视频 (附技术报告)
谷歌开源超大型视频数据库,含800万视频 (附技术报告)

7 大院长齐聚新智元智库院长圆桌论坛  

技术论坛特设“新智元智库院长圆桌会议”,重量级研究院院长7剑下天山,带来最前沿的AI研究动态、剖析技术发展趋势。

七位人工智能界“高手”现场过招,思想的激烈碰撞会给目前的人工智能发展带来哪些洞见?七位院长对行业的发展会有哪些前瞻揭秘?10月18日下午,2016 世界人工智能大会技术论坛,答案将逐层揭晓。

新智元智库院长圆桌汇集了中国人工智能产学研三界最豪华院长阵容:美团技术学院院长刘江担任主持人,微软亚洲研究院常务副院长芮勇、360人工智能研究院院长颜水成、北京理工大学计算机学院副院长黄华、联想集团副总裁黄莹、Intel 中国研究院院长宋继强、新华网融媒体未来研究院院长杨溟联袂出席。

2016世界人工智能大会技术论坛议程
扫描二维码购票:
购票链接:http://www.huodongxing.com/go/aiworld2016
也可点击‘阅读原文’直接购票。


版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《谷歌开源超大型视频数据库,含800万视频 (附技术报告)》的版权归原作者「新智元」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注新智元微信公众号

新智元微信公众号:AI_era

新智元

手机扫描上方二维码即可关注新智元微信公众号

新智元最新文章

精品公众号随机推荐

上一篇 >>

Dubbo数据透传