COCO (Common Objects in Context) 数据集是由微软研究院提出的大规模计算机视觉数据集,致力于对常见视觉任务(包括目标检测、实例分割、人体关键点检测、全景分割等)进行分析与评测。与之前的PASCAL VOC、ImageNet数据集不同的是,COCO数据集场景更加复杂、任务更加丰富、更接近实际应用。
基于COCO数据集,Facebook人工智能研究院、谷歌研究院、加州理工学院等联合在每年的ICCV或ECCV会议上组织举办COCO系列视觉挑战赛。历年的COCO挑战赛是人工智能领域最具影响力的图像(物体)识别挑战赛,也代表了继ImageNet后图像(物体)识别的最高水平,在学术界和工业界具有极高的认可度和知名度。国内外知名的人工智能企业和科研机构如谷歌、Facebook、微软、清华大学、北京大学、商汤科技、旷视科技等均组队参加过历届COCO系列比赛。
今年的COCO比赛由ECCV 2020会议的COCO-LVIS Joint Workshop举办,共包括目标检测/实例分割、人体关键点检测、全景分割等赛道。芯翌科技(XForwardAI)算法团队此次参加了前两个赛道。在人体关键点检测赛道,芯翌科技位列第一,获得冠军,此次成绩在test-dev测评集上AP指标为80.8%,相比较去年冠军方案(AP指标为79.2%)有了重大提升;在最终的test-challenge测评集上AP指标为77.4%,刷新了该赛道的历史最好成绩。在目标检测/实例分割赛道,芯翌科技也取得了排名前列的成绩。
在人体关键点检测赛道,芯翌科技以绝对领先优势位列第一
此次代表芯翌夺冠的算法团队
在比赛中,芯翌科技的算法研究人员使用了大量的原创性算法技术,包括无偏数据处理技术、关键点可感知的遮挡增强技术、定制化的训练策略,其中无偏数据处理技术已由团队成员撰写为论文,并被CVPR 2020 会议收录。(相关阅读:
),后两项技术也已经公开:
https://arxiv.org/abs/2008.07139
上图是芯翌算法团队对参赛方案进行优化的路线图,在多项原创性技术的加持下最终夺魁。
芯翌科技先后在人脸识别权威评测NIST-FRVT和图像识别权威比赛COCO中获得优异成绩。这些成绩的取得,一方面是由于芯翌科技人工智能算法团队对于深度学习和计算机视觉有着深厚的技术积累,拥有业内第一梯队的视觉算法全栈研发能力;另一方面,也是因为芯翌科技拥有自主研发的视觉算法工厂,可以高效地统一数据层、算力层、算法层和应用层,保证快速的算法创新、训练和验证,实现算法研发和生产的规模化。依托领先的人工智能技术和高效的视觉算法工厂,芯翌科技已在智慧城市和工业互联网多个领域实现落地,完成了20余个城市安全项目和智慧工业项目的交付。在8月初的CCF-GAIR全球人工智能与机器人峰会上,芯翌科技荣获AI+智慧城市最佳产品成长奖,此次夺冠则成为该奖项的又一个有力印证。
图像(物体)识别是这次人工智能革命带来最大技术突破的方向之一,物体检测、图像分割、关键点检测、人脸识别等图像识别技术,有非常大的应用价值。芯翌科技能够相继在全球权威人工智能比赛中取得优异成绩,表明了芯翌科技人工智能相关技术在全球范围内的领先性。未来,芯翌科技将不断加深和拓宽人工智能技术深度与广度,同时沉淀算法的工厂化生产能力,加快技术产品转化,探索“AI+X”的更多可能性。
伴随着新基建的热潮,在新一轮技术革命和产业革命中,芯翌科技将持续深耕人工智能核心技术与落地应用,为中国核心科技进步和人类可持续发展添砖加瓦。