近日,茶叶所与北京工大联合在Industrial Crops and Products(中科院一区TOP,IF:5.6)和Smart Agricultural Technology(中科院二区,IF:6.3)上分别发表题为“YOLO-TBD: Tea Bud Detection with Triple-Branch Attention Mechanism and Self-Correction Group Convolution”和“TBD-Y: Automatic Tea Bud Detection with Synergistic Object-Spatial Attention and Global-local Attention Guided Feature Fusion”的研究性论文。
精准茶芽检测是茶叶智能化采摘系统的核心技术之一。然而,受到复杂环境、茶芽与背景目标相似等因素的影响,错检和漏检时常发生。针对此问题,该团队基于YOLOv8模型和YOLOv11模型分别提出了两种不同的茶芽精准检测模型YOLO-TBD和TBD-Y,以提高茶芽的检测精度。
图1. YOLO-TBD 整体网络结构流程图
图2. TBD-Y 整体网络结构图
该部分工作的新颖性在于:首先,针对茶芽的形状、尺度、方向变化剧烈,错检、漏检经常发生以及密集小目标无法实现完整的检测的问题,YOLO-TBD模型提出了Triple-Branch Attention Mechanism(TBAM),用以缓解茶芽的错检和漏检问题,然后提出Self-Correction Group Convolution(SCGC)以增大感受野,解决密集小目标无法实现完整检测的问题。其次,针对茶园环境复杂,茶芽目标与背景高度相似,背景对检测性能造成严重干扰的问题,TBD-Y模型提出Synergistic Object-Spatial Attention(SOSA),该机制结合提出的Local Context Attention(LCA),使模型能够自动聚焦于茶芽目标区域,增强目标的特征表示,同时抑制背景干扰。最后提出了Global-local Attention Guided Feature Fusion(GAGFF)策略,该策略一个分支用于增强低分辨率但具有丰富语义信息的特征图,另一个分支用于增强高分辨率但包含更多低层视觉信息的特征图,通过两个分支的融合,通过有效融合语义和尺度不一致的两种特征,提升了特征的表达能力。本研究针对茶芽的具体特点,针对性的提出了不同的特征增强和背景抑制的方法,在茶芽智能采摘系统中具有广阔的应用前景。
茶叶所董春旺研究员与北京工业大学卓力教授为论文共同通讯作者,联培博士生刘中原为论文第一作者,该研究得到山东省农业改良品种项目(2023LZGCQY015)、山东省农业科学院科研启动资金(CXGC2023G33)、山东省现代农业产业技术体系(SDAIT19)等项目的资助。(撰写:陈之威 核稿:董春旺)

