(院新闻网讯 曾宪森)近日,我院王薇博士团队的两项研究成果——《夜间整体可见度提升:不规则辉光去除与辉光感知增强方法》与《基于时空变化运动模糊的三维盲视频稳定方法》,分别接收到国际权威期刊《IEEE Transactions on Circuits and Systems for Video Technology》与《ACM Transactions on Multimedia Computing, Communications, and Applications》的录用通知。王薇是该文章的通讯作者,我院硕士研究生吴万昱和李恒威分别参与完成了这两项重要研究。
视频稳像是一项具有挑战性的任务,旨在补偿视频采集过程中的帧抖动。在视频中,运动模糊的强度会不断变化,直接结合方法无法充分利用时空信息,提供不足的跨帧补偿线索。为了解决这一难题,王薇博士团队提出了跨帧时空模块框架,采用了一种无需预训练的在测试时进行训练的策略,用于处理由各种条件引起的盲运动模糊问题,该框架利用跨帧时空特征来估计深度图和摄像机运动。大量的实验结果表明,本方法在画幅帧间连贯性方面具有更优性能。
图1 基于时空变化运动模糊的三维盲视频稳定方法流程图
此外,在现实世界中,多种形状的辉光效应对夜间能见度造成了严重影响,而这一领域的研究尚显不足。为了有效提升夜间整体能见度,王薇博士团队提出了一个基于物理模型指导的训练框架,该框架能够生成接近场光源辐射特性的夜间成像模型,并对六种辉光形状类别中的光源生成器进行了生成有效性的验证。在此基础上,团队进一步提出了一种可扩展的光敏盲反卷积网络,以解决直接传输图和光源图的盲分解问题。该方法巧妙融合了深度学习策略和物理领域知识,构建了高效的算法框架,并在多个真实数据集上取得了显著成效,不仅提升了夜间可见度,还优化了多个下游高级视觉任务的表现。
图2 辉光现象及其频域分析图
《IEEE Transactions on Circuits and Systems for Video Technology》作为计算机图形学与多媒体领域的顶级期刊,拥有高达,并被中科院SCI期刊大类一区评为TOP期刊(影响因子8.3),同时也是中国计算机学会(CCF)认定的B类期刊。而《ACM Transactions on Multimedia Computing, Communications and Applications》作为国际计算机学会(ACM)的权威会刊,专注于多媒体计算、通信和应用领域的学术论文发表,是多媒体领域的国际一流刊物,同样获得了中国计算机学会(CCF)的B类期刊推荐。
王薇所属的视觉人工智能研究组(https://vai-lab.com),在计算机视觉和人工智能领域深耕多年,始终坚持唯实创新、外引内培的发展理念,不断开拓新的研究方向。作为武汉科技大学培养并留校任教的博士生,王薇近年来以第一作者或通讯作者身份,在CCF-A类和IEEE/ACM trans.等国际顶级刊物上发表了多篇重要论文,展现了其在学术界的卓越影响力。