您所在的位置:首页 - 园区动态

园区动态

沙河学术汇第三期|论文精读沙龙

2025年4月27日,计算机与通信工程学院在沙河创新园区成功举办了论文精度沙龙第二期。我院2023级硕士生马雨琪以《一种通过显式线性组合强化属性特征表达的细粒度开放词汇目标检测方法》为题,带来了一场有关细粒度目标检测方法技术的深度分享。

4f759d7dd6e7f6b96f6344ae01f1ce5d.png

前路探索:开放词汇目标检测的难题

开放词汇目标检测旨在突破传统目标检测对固定类别集合的依赖,使模型能够识别和定位在训练集中未曾出现的新类别对象。相比于封闭类别设定,开放词汇检测需要模型理解更加丰富的语义描述,并根据文本信息动态推理出目标区域。当前,如何高效构建图像特征与开放文本描述之间的细粒度对齐机制,如何提升模型在大规模、长尾类别分布下对新颖概念的识别能力,仍是亟待攻克的技术难题。同时,由于开放词汇检测通常依赖外部知识进行语义迁移,如何在提升未见类别探测性能的同时,保持对已知类别检测精度的稳定,也是领域内的重要研究方向。

67ebd580d86914de29a2cf155c051b90.png

插件方法:即插即用使其具备极致泛用性

创新机制

关注细粒度词汇,使用Llama对token进行处理,通过对注意力机制的微调,实现了对物体属性特征的精确捕获,并将其与整个画面的整体特征有机结合起来。这样的设计不但提升了特征表达的一致性和准确性,也使模型具备了洞察事物微妙差异的能力。

实证分析

实验部分展示了令人信服的结果。无论是在经典的双阶段检测器还是现代流行的单阶段架构下,采用上述方法均能显著改善模型的表现。这些实验证据强有力地支持了所提技术的有效性和普适性。

e236a603f5a3317ef3aceea6588e6bbe.png

前沿展望:特殊场景泛化与优化探索

在互动中,马雨琪与同学们深入交流了其工作的细节之处,并探讨了如何改进模型在非常规属性词上的性能。她说,开放词汇目标检测还有不少 “硬仗” 要打,例如罕见属性词的识别难题,需要改进现有模型、扩充标注数据库来提高识别精度;探索优化路径,探索既能维持甚至提升检测质量又能控制计算成本的解决方案;在医疗诊断、交通监控等专业领域,还得根据特定需求定制算法和评估体系。相信随着研究不断深入,开放词汇目标检测将解锁更多可能,为我们的生活带来更多惊喜!

7397ed8f40390c180a69d583ad0d69f3.png

7397ed8f40390c180a69d583ad0d69f3.png