|
CVPR 2026 | OpenDPR:以视觉为中心的基于扩散引导原型检索的开放词汇变化检测 | |||||||||||||||||||||
|
|
||||||||||||||||||||||
论文标题:OpenDPR: Open-Vocabulary Change Detection via Vision-Centric Diffusion-Guided Prototype Retrieval for Remote Sensing Imagery 论文:https://arxiv.org/abs/2603.27645 代码:https://github.com/guoqi2002/OpenDPR 收录会议:CVPR 2026 武汉大学测绘遥感信息工程全国重点实验室RSIDEA研究组提出一种以视觉为中心的基于扩散引导原型检索的开放词汇变化检测方法,通过对该任务流水线进行误差归因分析,设计了免训练的 OpenDPR 及其弱监督变体,显著提升了开放词汇变化检测的性能。相关研究成果"OpenDPR: Open-Vocabulary Change Detection via Vision-Centric Diffusion-Guided Prototype Retrieval for Remote Sensing Imagery" 发表于人工智能领域顶级会议CVPR 2026。武汉大学测绘遥感信息工程全国重点实验室硕士生郭祺为第一作者,武汉大学测绘遥感信息工程全国重点实验室钟燕飞教授、刘寅贺博士后为共同通讯作者,北京理工大学王爵博士后共同参与完成研究。 一.研究背景 开放词汇变化检测(OVCD)旨在突破预定义固定类别的限制,实现对任意感兴趣变化的识别。本文将现有OVCD重构为一个两阶段流程:首先利用SAM、DINOv2等视觉基础模型(VFM)生成类别无关的变化候选区域,随后通过CLIP等视觉语言模型(VLM)完成类别判定。通过误差归因分析,我们发现类别识别误差是OVCD的主要性能瓶颈,其原因在于基于图文匹配的视觉语言模型(VLM)难以有效表征遥感场景中的复杂细粒度地物类别;此外变化定位误差为OVCD的次要瓶颈,其原因在于视觉基础模型(VFM)虽然具有较强的地物空间感知能力,但缺乏跨时相变化先验,造成大量变化定位虚警。
二.主要创新点 ① 针对类别识别误差这一主要瓶颈,提出一种免训练的以视觉为中心的扩散引导原型检索框架,利用扩散模型离线构建目标类别的多样化视觉原型,推理阶段使用候选变化提议在视觉空间进行相似度检索以完成类型识别;② 针对变化定位误差这一次要瓶颈,提出一种可选的由空间到变化的弱监督变化检测模块,通过预训练将视觉基础模型的空间建模能力适配至二类变化定位,将其与免训练框架集成可形成弱监督变体,在仅引入极低监督成本的情况下进一步提高开放词汇变化检测整体性能。
三.实验结果 开放词汇变化检测旨在推动变化检测任务突破传统闭集范式的局限,迈向更通用的开放世界理解。所提方法包括免训练的OpenDPR和弱监督的OpenDPR-W两个版本,在建筑物二类变化检测数据集WHU-CD、LEVIR-CD和多类语义变化检测数据集Hi-UCD mini、SECOND上进行定量与定性分析,优于现有的无监督、弱监督、以及开放词汇变化检测方法。
版权与联系方式 OpenDPR方法版权归智能化遥感数据提取分析与应用研究组(RSIDEA)所有,该研究组隶属于武汉大学测绘遥感信息工程全国重点实验室(LIESMARS),仅限于学术目的使用,任何商业用途均被禁止。 如果您有任何问题或反馈,请联系: 郭祺 硕士生: guoqi2002@whu.edu.cn 刘寅贺 博士后: liuyinhe@whu.edu.cn 供稿:郭祺 排版:柯天 审核:吴娇、刘寅贺 |
||||||||||||||||||||||