冠军！华为云问鼎国际图像识别领域"世界杯"

再接再厉！

在第四届图像识别竞赛 WebVision中

华为云EI以 82.97%的准确率

击败来自全世界的94支参赛队伍

夺得桂冠！

（记得查看文末彩蛋哦冠军！华为云问鼎国际图像识别领域"世界杯" ）

冠军！华为云问鼎国际图像识别领域"世界杯"

WebVision 竞赛由苏黎世联邦理工（ETH）、Google Research、卡耐基梅隆大学（CMU）等共同组织，是目前图像识别领域最权威的竞赛之一，被业界誉为人工智能“世界杯”，接棒曾经推动计算机物体分类准确率超过人类的ImageNet 竞赛。

竞赛中，参赛选手通过AI模型将1600万+张图片精准分类到5000个类目中，其所用数据集直接从互联网爬取，没有经过人工标注，因此数据中含有很多噪音，且数据类别的数量存在着极大不平衡。

此项竞赛相较于 ImageNet，WebVision 难度提高许多，同时也更加贴近于实际应用中的场景。

WebVision竞赛展示了另外一种可能性：基于弱监督学习，深度学习可以不再以人工标注数据为基础，人工智能有望真正摆脱“人工”。

冠军！华为云问鼎国际图像识别领域"世界杯"

此次竞赛中，华为云EI（企业智能）基于 ModelArts训练大规模图像分类模型，基于先进的分布式训练方法，可以缩短超大规模数据集的训练时间。

华为云利用伴随图像数据的文本描述信息，融合文本与视觉多模态特征，通过训练过程中的动态评估，识别并剔除大量噪声数据；通过知识蒸馏进一步降低噪声对模型训练的影响；从互联网上自动爬取大规模数据集进行学习，最终在完全没有人工标注的情况下，训练得到准确率82.97%高精度模型。

冠军！华为云问鼎国际图像识别领域"世界杯"

华为云EI在本次比赛中运用的图像识别技术，可广泛用于通用物品识别、图像/视频标签等领域。

近十年来计算机视觉取得的进展离不开大量人工标注的数据集，但由于人工标注需要较高的成本，几乎不太可能构建包罗万象的超级数据集。

冠军！华为云问鼎国际图像识别领域"世界杯"

互联网上存在几乎取之不尽的无标注图像数据，利用这些数据的周边文本等信息作为带噪声的弱标注数据进行学习，能够在很大程度上降低图像识别对人工标注的依赖。

华为云EI在视觉研究领域有着丰富的技术积累，在6月14日-19日举办的CVPR2020（国际计算机视觉和模式识别大会）中，华为贡献论文34 篇，涵盖迁移学习、半监督学习、网络架构搜索、模型算子优化、知识蒸馏、对抗样本生成等前沿领域。

2019年，基于华为云图像识别能力，在上海天文台与国际组织SKA（平方公里阵列射电望远镜）合作的项目中，科学家们仅用10.02 秒即完成了对 20 万颗星体的识别，同时可以准确地对某一类星体进行定位，而传统方式完成如此大量的星体识别工作需要 169 天时间。

冠军！华为云问鼎国际图像识别领域"世界杯"

-END-

点击“阅读原文”，体验图像识别。

vlambda博客
学习文章列表