农机装备智能化设计与制造创新团队在农业语义分割领域取得进展

发布日期:2024-01-18 浏览次数: 信息来源:综合办公室

中国农大新闻网讯 11月19日,农机装备智能化设计与制造创新团队杜岳峰副教授在《Pattern Recognition》在线发表了题为《CS-Net: Conv-Simpleformer Network for agricultural image segmentation》的论文。本研究立足于人工智能与智慧农业,聚焦于计算机视觉和农业生产各环节对通用语义分割模型的需求,从研究角度解决工程中存在的模型泛化性问题,为推动人工智能在农业领域的发展提供了新思路。

近十年来,深度学习技术在农业图像分割任务中取得了迅猛发展,特别是CNN架构模型,然而,最先进的Transformer架构模型在农业领域并未得到广泛应用,这表明农业语义分割领域已严重滞后于深度学习的发展潮流。

该项研究首次从农业领域图像特点与应用部署两方面系统地总结了农业图像分割任务较通用语义分割任务的不同与其面临的关键挑战,打破了以往的定式思维。该研究发现,Transformer架构模型在多种农业场景下均出现性能崩塌现象,论文通过大量实验探明了其性能崩塌的机理,同时从数学角度给出了相应描述。该性能崩塌机理的探明对于促进Transformer架构模型在农业领域应用具有较大的推动作用。其次,该研究重新审视了Self-attention(SEAB)的信息处理机制,并从底层计算逻辑出发,提出了Simple-Attention(SIAB)的高效注意力机制和CS-Net农业图像分割模型,其中SIAB解决了SEAB计算复杂度随输入图像呈二次相关的问题,同时,SIAB的理论计算复杂度较SEAB可降低300余倍!最后,在智慧农业四种典型应用场景(谷物收获质量检测、病虫害检测、多机协同作业、作物精准施药)下对CS-Net进行了实验验证。结果表明,CS-Net各项性能均超越其他方法,特别是在推理阶段对计算设备性能需求的减小尤为突出,同时在不同场景下均表现出极强的泛化性与鲁棒性。该研究有望解决各种农业场景下语义分割任务对通用模型在性能和部署方面提出的问题。

图片1.png

CS-Net性能测试与泛化性验证

该项研究成果得到我校“学科交融拓新计划”项目——智慧农业及智能装备数字孪生体构建理论与方法以及国家自然科学基金项目(52175258)的资助。中国农业大学为第一署名单位,硕士研究生李国润和博士研究生刘磊为共同第一作者,杜岳峰副教授为通讯作者。

为促进行业发展,团队一致同意将该研究成果开源,以实际行动践行“强国先强农、农大作先锋”的号召与使命。详细代码已发布至:https://github.com/CAU-COE-VEICLab/Simple-Attention

原文连接:https://doi.org/10.1016/j.patcog.2023.110140

供稿:工学院

供图:工学院

编辑:马文哲

责编:李杨