我院硕士研究生张子康在国际学术期刊《Sensors》上发表了题为“UAV Imagery Real-Time Semantic Segmentation with Global–Local Information Attention”的SCI论文,提出了一种利用全局-局部注意力和特征融合的方法用于对无人机实时图像进行语义分割。
在无人机图像的实时语义分割中,当前的轻量级算法缺乏图像中全局和局部信息的整合,导致分类类别中的漏检和误分类。本文提出了一种集成多尺度全局上下文信息的无人机实时语义分割方法。该原理利用UNet结构,编码器采用Resnet18网络来提取特征。解码器包含一个全局-局部注意力模块,其中全局分支在垂直和水平方向上压缩和提取全局信息,局部分支通过卷积提取局部信息,从而增强图像中全局和局部信息的融合。在实时无人机语义分割上,该方法有效平衡了精度和实时性。
论文链接:https://doi.org/10.3390/s25061786

图1 网络结构图

图2 论文首页