电子科大计算机学院数据智能团队多篇论文被全球计算机视觉顶会CVPR2022接收

在人工智能领域,CVPR已“当选”最顶级会议。CVPR的论文投稿量近三年持续上涨。据CVPR官网显示,本届CVPR的论文有效投稿量再创新高,多达8160篇,接收率仅为25.33%,这些被录取的最新科研成果涵盖了计算机视觉领域各项前沿工作。

近日,2022 IEEE国际计算机视觉与模式识别会议(IEEE Conference on Computer Vision and Pattern Recognition,简称CVPR)官方公布论文收录结果。本届大会总共录取来自全球的论文2067篇,电子科技大学计算机学院数据智能团队(Data Intelligence Group)共有4篇论文被接收。

在人工智能领域,CVPR已“当选”最顶级会议。据2021谷歌学术期刊与会议影响力榜单,CVPR在综合榜单中排名第四,超过了《柳叶刀》 ,仅次于《Science》。CVPR的论文投稿量近三年持续上涨。据CVPR官网显示,本届CVPR的论文有效投稿量再创新高,多达8160篇,接收率仅为25.33%,这些被录取的最新科研成果涵盖了计算机视觉领域各项前沿工作。段立新教授、李文教授管理的数据智能团队此次被录取的4篇论文研究方向以图像视频场景理解与生成为主,包括通用目标检测、跨领域迁移学习、运动捕捉与生成、视频高光时刻检测等最新科研成果,对计算机视觉算法领域的前沿研究起到助推作用。


图1 论文《Undoing the Damage of Label Shift for Cross-domain Semantic Segmentation》内容示意图

其中,2021级博士生刘亚豪为第一作者的论文《Undoing the Damage of Label Shift for Cross-domain Semantic Segmentation》(作者:刘亚豪、李文【通讯作者】、邓金红、陶佳乐、褚童、段立新)针对不同领域标签分布差异对模型的影响常被忽略的问题,通过在两个跨域分割的场景下的实验,提出的两种方法均可以有效提高基于对抗的跨域分割方法的效果,并与多种伪标签方法结合可以到达目前最优异的性能。


图2《Leaning Pixel-Level Distinctions for Video Highlight Detection》PLD-VHD模型

2021级硕士生魏凡越为第一作者的论文《Leaning Pixel-Level Distinctions for Video Highlight Detection》(作者:魏凡越、王标、葛铁铮、姜宇宁、李文、段立新【通讯作者】)设计了一个编码器-解码器网络来建模像素级对比。其中,在时序上使用3D卷积神经网络来预测当前帧的像素级对比。 利用视觉显著性来建模空间上的依赖关系。 在基准数据集上的最优结果验证本文算法的有效性。


图3 论文《Structure-Aware Motion Transfer with Deformable Anchor Model》HDAM模型

2019级博士生陶佳乐为第一作者的论文《Structure-Aware Motion Transfer with Deformable Anchor Model》(作者:陶佳乐、王标、徐博润、葛铁铮、姜宇宁、李文【通讯作者】、段立新)提出了考虑物体结构先验的动作迁移方法,在学习物体动作时约束物体的结构信息;约束方式通过引入可学习的根锚点的仿射变换实现。实验证明通过端到端学习,提出的方法(Deformable Anchor Model, DAM)能够自动学习到有物理意义根锚点和相应的仿射变换,同时在基准数据集上都有不错的性能提升。


图4 论文《Revisiting AP Loss for Dense Object Detection: Adaptive Ranking Pair Selection》框架示意图

团队科研助理徐东篱为第一作者的论文《Revisiting AP Loss for Dense Object Detection: Adaptive Ranking Pair Selection》(作者:徐东篱、邓金红、李文【通讯作者】),剖析了目标检测中一类新颖的排序损失函数即平均精度损失函数(Average Precision Loss)的工作机制,揭示了现有排序损失方法主要问题在于没有筛选出精确且完整的排序样本(Ranking pairs)。论文提出一个简洁的自适排序样本对选择算法,使其能够利用排序得分和定位得分自适应地为检测器提供更优秀的样本对(如图4中的红蓝双色双端箭头)。通过实验证实,该算法能够提升平均精度损失的性能,并且在COCO数据集上超过了目前流行的分类损失函数和排序损失函数方法。

相关链接:

计算机学院数据智能团队(Data Intelligence Group)主要研究领域为机器学习和计算机视觉,具体包括迁移学习、深度学习、弱监督学习、强化学习及在图像视频分析、目标检测、语义分割、眼底影像分析等计算机视觉任务中的应用。研究团队现有正高级教授3人,助理研究员1人,博士生13人,硕士生50余人,博士后2人。在段立新教授、李文教授的指导下,团队成员屡获成绩,近三年在AAAI、IJCV、ECCV、ACM MM、ICCV、ICME等CCF A类/中科院二区以上顶会顶刊均有多篇文章发表。在国内外多项计算机视觉和人工智能大赛中名列前茅,5次参加国内外AI算法竞赛并获奖(最高获得1次全球第一名和1次全球第二名)、获2019年CVPR BDD&D2City迁移学习物体检测竞赛全球第二名、2021年CVPR NTIRE移动端视频超分辨比赛全球冠军等。团队主持自然基金面上项目2项,参与国家重点研发计划项目1项,参与四川省科技厅项目2项,同时与成飞设计研究所、华为、中电二十九所、阿里巴巴等多家公司机构有重要合作。

随便看看别的百科