近期,中国科学院合肥物质院智能所谢成军与张洁团队提出了一种基于因果推断的农作物害虫识别方法。相关研究成果发表在农林科学领域国际权威期刊Pest Management Science上。
害虫的精确识别是智慧农业不可或缺的一环,它对于确保作物的健康生长、提升产量与品质,以及保持生态平衡至关重要。随着计算机视觉技术的飞速进步,深度学习方法在害虫识别领域已经展现出巨大的潜力和显著的优势。然而,现有识别技术面临着一个核心难题:难以适应害虫训练集的分布偏差问题。由于图像采集工作多在特定环境下进行,导致训练数据集中存在大量背景相似的样本,这可能使模型在训练过程中过度依赖背景特征,而非害虫的关键特征。当测试数据的分布与训练数据不一致时,模型的识别准确性便可能大幅下降。
为了克服上述挑战,研究团队提出了一种创新的解耦特征学习(Decoupled Feature Learning, DFL)框架。DFL框架的设计理念是应用因果推断技术,以解决训练数据集的偏差问题。该框架首先通过不同的样本采样策略构建多样化的训练域,以减少模型对原始训练数据集固有分布偏差的依赖,并降低无关特征的干扰。接着,利用中心三元损失(Center Triplet Loss)来加强和优化模型在不同域中捕捉类别核心特征的能力。通过在Li数据集、小样本害虫数据集(DFSPD)以及大规模害虫数据集IP102上的广泛测试,DFL框架显著提升了现有基线分类模型的性能,在三个数据集上分别取得了95.33%,92.59%,和74.86%的最佳识别准确率。此外,可视化结果也证实了DFL框架能够鼓励模型学习到类别的核心特征,即使在测试数据分布发生偏移时也能保持稳定的优越性能,从而证明了其在缓解数据分布偏差问题、增强深度学习在农业领域可靠性方面的重要作用。
该项研究工作是中国科学院合肥物质院智能所与安徽省农科院经信所合作完成,所使用的害虫图像样本由农科院经信所董伟副研究员提供和协助整理。
硕士生胡涛为论文第一作者,谢成军、董伟为论文通讯作者,张洁、颜科宇等团队成员为论文算法设计思路、部分实验和论文撰写做出了贡献。该项工作得到了国家自然科学基金、安徽省自然科学基金、合肥物质院院长基金等科研项目的支持。
图1 DFL框架结构
图2 Li dataset及DFSPD数据集实验结果
图3 DFSPD 数据集可视化结果对比