当前位置: 首页 > 焦点新闻 > 正文

西电智能学子斩获国际顶会CVPR2020 - VizWiz-VQA Challenge比赛亚军

【来源: | 发布日期:2020-06-15 】

(通讯员 张艳 赵嘉璇 郭志成 王丹)6月14日上午,由佐治亚理工学院,斯坦福大学,Deepmind,Facebook AI研究院等单位联合举办的CVPR2020 the 2nd VizWiz-VQA Challenge(Visual Question Answering Challenge)公布了大赛获奖名单。由西安电子科技大学人工智能学院焦李成教授指导,2019级人工智能学院智能感知与图像理解教育部重点实验室研究生郭志成、赵嘉璇、张艳组成的学生队伍—Sudoku在这一国际计算机视觉领域最高水平大赛中斩获亚军,并受邀在CVPR2020-Visual Question Answering and Dialog Workshop(线上)作专题报告。

图1 比赛结果公布网站截图<https://visualqa.org/workshop.html>

图2 CVPR2020线上研讨会<http://cvpr20.com/visual-question-answering-and-dialog/>

根据官方公布的结果,本届VizWiz-VQA Challenge赛道中Sudoku队以AA56.2%的成绩获得了本次比赛的亚军。本次大赛任务具有数据集图片质量差且数量多,图片对应的问题及答案复杂多样等难点,Sudoku团队创新性地提出使用不同的主干网络,不同的自然语言模型并融合丰富的图像特征的方法逐一攻克以上难点。大赛于北京时间5月16日早8点结束,赛程的大部分时间中团队都处于疫情隔离在家期间,在师长的指导和帮助下,团队克服无法面对面交流,远程控制等重重困难,以高度自律的精神进行多次方法改进,直到比赛结束最后一刻都没有松懈,用自己的实际行动践行了“艰苦奋斗、自强不息”的西电精神。据悉,来自以色列理工学院、FacebookAI、马萨诸塞大学阿默斯特分校、北京航空航天大学、西北工业大学、浪潮科技等高校和科研单位也参加了本次大赛。

图3 团队比赛效果展示

比赛介绍

VizWiz-VQA Challenge旨在设计能够回答视障人士提出的视觉问题的算法,其数据集为VizWiz-VQA数据集。该数据集由每个视障人士所拍摄的图像并语音记录有关该图片的语音问题,以及关于每个问题的10个众包答案组成。该比赛针对该数据集解决以下两个任务:预测视觉问题的答案;预测视觉问题是否可以回答。赛事希望能够引导更多的人了解视障人士的技术需求,同时为研究人员提供新的研究方向,以开发辅助技术,为视障人士打造更加无障碍的生活。

大会介绍

CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写,即IEEE国际计算机视觉与模式识别会议。CVPR是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术,是世界顶级的计算机视觉会议(三大顶会之一,另外两个是ICCV和ECCV)。

相关链接:

http://cvpr20.com/visual-question-answering-and-dialog/

https://visualqa.org/workshop.html

https://www.youtube.com/watch?v=GqfzEKHO2Yc&feature=youtu.be

关闭