摘要
在同一生长周期内,黄瓜的成熟度会因环境因素而有所不同,这会影响它们的储存质量和食用体验。准确地对收获后的黄瓜进行成熟度分级可以提高其商业价值并减少浪费。然而,目前确定黄瓜成熟度的方法主要依赖于收割者的主观经验和开花后的天数。这种方法具有高度主观性、劳动密集型,并且成本逐渐增加。为了解决上述问题,本研究使用了不同成熟度级别的黄瓜的高光谱图像作为数据来源,并提出了一种新的黄瓜成熟度分级方法。在第一阶段,对高光谱图像进行空间-光谱预处理和特征压缩,以生成一个紧凑的特征矩阵。在第二阶段,将特征矩阵输入到Transformer-CNN-BiLSTM(TCBL)模型中进行成熟度分级。实验结果表明,与基于波段选择的传统机器学习方法和典型的深度学习模型相比,所提出的方法在成熟度分级任务中取得了最佳性能,准确率、精确度、F1分数和召回率均超过了98%,比传统方法提高了5%的分级准确性。这种方法为在线黄瓜成熟度分级系统的开发提供了理论和定量数据支持。
1. 引言
华北型黄瓜(Cucumis sativus L.)是一种营养丰富的鲜食品种,深受消费者喜爱[1, 2]。它占中国黄瓜总产量的80%以上,具有重要的经济价值。黄瓜的质量直接影响其商业价值,而成熟度是内部质量的关键指标,决定了它们的可食用性和保质期[3, 4]。目前,农民根据生长日期来收获黄瓜,但由于个体差异和环境影响,每根黄瓜的成熟度各不相同。收获后,需要由经验丰富的工人在短时间内对黄瓜进行分类,以便根据市场需求确定其成熟度并进入市场。手动分级方法耗费大量劳动力,需要较高的体力劳动,并且依赖于基于经验的主观判断。这种方法阻碍了分级效率和准确性的提高,也难以实现标准化和自动化,导致农业成本增加、质量控制不佳,无法满足不断变化的市场需求。因此,迫切需要开发一种快速且客观的黄瓜成熟度分级方法。这不仅有助于缓解劳动力短缺问题,建立客观的分级标准,还能促进专用水果和蔬菜分级技术的自动化。随着高光谱成像和图像处理技术在农业生产中的广泛应用,有效的黄瓜成熟度分级方法变得越来越可行[5–7]。在水果和蔬菜成熟度研究中,一些研究人员依靠不同成熟阶段的颜色变化从水果和蔬菜的RGB图像的空间域信息中提取特征,以实现成熟度分级。这种方法依赖于不同成熟阶段水果的明显外部变化来达到高准确性。例如,陈淑棉[8]使用柑橘的RGB图像结合深度学习实现了三级成熟度分类,准确率为95%。Syamsudduha Syahrorini[9]使用RGB图像仅对年轻和老化的黄瓜进行分类,由于外部差异明显,准确率为96%。当不同成熟阶段的外部变化不明显,或者需要分类多个成熟度级别时,RGB图像对于成熟度分级的效果较差。例如,对于番茄的三级成熟度分类,由于不同成熟阶段的外部变化较为微妙,准确率为90%[10];对于需要多个成熟度级别的百香果,准确率为91.5%[11]。此外,由于成熟过程中的生长条件影响,水果的外部外观和内部状态可能存在不一致性。仅依赖外部颜色进行判断可能导致误分,无法准确反映水果的真实成熟度。高光谱成像技术结合了光谱和图像信息,能够同时获取目标物体的空间和光谱数据,具有速度快、无损性和准确性等优点[12]。光谱图像用于评估水果和蔬菜的内部质量,通常在400–1000 nm和1000–2500 nm波长范围内。400–1000 nm范围包括可见光和部分近红外光谱。在这个波长范围内,对黄瓜内部质量的预测主要集中在内部缺陷[13, 14]、冷害[15, 16]和干物质[17]上。目前还没有关于这个范围内黄瓜成熟度研究的报告。然而,研究人员已经对其他水果和蔬菜在这个范围内进行了成熟度研究。例如,Xuan[18]在400–1000 nm范围内实现了秋葵的三级成熟度分类,准确率为91.7%;Brahim Benmouna[19]实现了苹果的四级成熟度分类,准确率为96.5%。在400–1000 nm波长范围内,成熟度分级的准确率相对较低,部分原因是光谱范围较窄,以及水果和蔬菜对可见光的强烈吸收,导致可用的反射光谱信息有限。与400–1000 nm范围相比,1000–2500 nm范围属于短波红外光谱,它提供了更宽的光谱范围和更强的穿透能力,能够有效穿透水果和蔬菜的表皮和表层结构,同时反射更多的光谱信息[20]。曾凡国[21]在1000–2500 nm范围内实现了黄瓜种子的五级成熟度分级,准确率高达99.69%。通过利用1000–2500 nm范围内的光谱数据,可以获得丰富的信息,从而实现更精确的质量分级。在基于高光谱成像的水果和蔬菜成熟度研究中,通常应用机器学习和深度学习技术[22]。机器学习方法主要处理一维(1D)数据。直接方法是将多维高光谱图像转换为1D数据,并应用基本统计分析进行分类或回归。例如,PLSDA已被用于基于原始光谱数据对香蕉成熟度进行分类,准确率为91.53%[23]。在此基础上,处理后的1D数据可以与机器学习模型结合用于成熟度分类。例如,SPA-SVM方法被用于检测欧洲李子的成熟度,准确率为87.5%[24];RAW-IRIV-ELM方法实现了葡萄成熟度的分类准确率为96%[25]。这种方法通过优化特征波长并整合机器学习模型,基于1D高光谱数据进行分类或回归预测,在其他水果和蔬菜的内部质量评估中也得到了广泛应用[26–28]。然而,机器学习方法存在固有的局限性,因为它们依赖于1D数据、手动特征提取,且模型复杂性不足。随着深度学习技术的进步,这些局限性得到了有效解决。深度学习可以充分利用高光谱图像的高维数据来提取空间和光谱特征,从而提高准确性。例如,CNN实现了蓝莓成熟度分类的95%准确率[29],AlexNet实现了草莓成熟度分类的98.6%准确率[30]。此外,研究人员还应用深度学习来预测哈斯鳄梨的成熟时间[31]。通过利用深度学习,研究人员可以更好地揭示光谱信息与成熟度之间的内在关系,从而提高分类准确性。尽管高光谱成像和深度学习技术已成功应用于各种水果和蔬菜的成熟度分类,但目前还没有关于它们在黄瓜成熟度分级中应用的报告。探索高光谱成像和深度学习技术在黄瓜成熟度分级中的应用不仅可以填补这一研究空白,还可以为水果和蔬菜分级研究提供新的视角和方向。因此,本研究专注于华北型黄瓜,在1000–2500 nm波长范围内收集了三个成熟度级别的黄瓜光谱图像。研究内容包括:(1)根据现有标准和市场要求制定黄瓜成熟度视觉分级标准,并建立不同成熟度级别的黄瓜光谱图像数据集。(2)提出了一种新的黄瓜成熟度分级方法,包括两个阶段:高光谱图像的空间-光谱预处理和特征压缩,然后是成熟度分级模型。该方法基于光谱信息和深度学习直接进行成熟度分类,无需依赖额外的中间指标。(3)提出了一种基于Transformer-CNN-BiLSTM(TCBL)的创新成熟度分级模型。该模型有效地结合了Transformer的全局特征提取能力、CNN的局部特征捕获优势以及BiLSTM的双向序列信息处理能力。通过从光谱信息中提取多层次特征,实现了高度准确的成熟度分级。
2. 材料与方法
2.1. 概述
图1展示了收获后黄瓜成熟度分级的技术路线图,包括数据采集、数据加工和数据分析。在数据采集阶段,根据成熟度分级标准收集样本,并使用高光谱成像系统在1000–2500 nm波长范围内捕获黄瓜样本的高光谱图像。在数据加工阶段,采用了提出的两阶段深度学习方法进行黄瓜成熟度分级。最后,在数据分析阶段,分别分析了黄瓜的光谱图像、成熟度分级方法和分级模型的性能。
2.2. 数据采集
2.2.1. 样本
实验中使用的华北型黄瓜(Jinyan Number 5)样本来自山东省淄博市的Hongji农业公司。根据黄瓜流通标准(SB/T 10572-2010)和市场要求,将黄瓜分为三个成熟度级别。成熟度级别的分类标准如图2所示。我们从农场收集了三个不同成熟度级别的黄瓜样本,每个级别100根,共计300根。在收集过程中,选择了外观良好且无腐烂或缺陷的黄瓜。收获后,黄瓜被装在保温泡沫箱中运输,以减少运输过程中的损伤。样本当天被带到实验室,休息1小时后进行高光谱成像。
2.2.2. 黄瓜高光谱图像采集与校准
黄瓜的高光谱图像是使用短波红外高光谱成像系统(型号N25E-SWIR,ISUZU OPTICS Co., Ltd.,中国)获取的,如图3所示。该系统包括暗室、高光谱相机、双石英钨卤素灯(QTH)、移动平台和计算机。表1提供了高光谱成像系统和采集设置的参数。使用双QTH作为光源。通过监测实时光谱响应来优化照明角度,以实现高信号强度和空间均匀性,同时避免探测器饱和。基于这一标准,选择了15°的入射角进行后续图像采集。系统在1000–2500 nm波长范围内扫描,每张黄瓜高光谱图像的像素大小为1840 × 384,包含288个光谱带。在图像采集过程中,需要适当设置曝光时间和移动平台的速度,以避免信息过饱和和图像失真。经过实验后,曝光时间设置为7 ms,样本与镜头之间的距离为h = 150 mm,传送带速度为v = 11.5 mm/s。
为了消除光照强度变化和镜头中的暗电流对成像的影响,并计算扫描对象的相对反射光谱,在每批黄瓜光谱数据采集之前进行了黑白板校准[32]。公式如下:
(1)
其中,R代表校准后的图像,IR代表原始图像,ID代表黑板校准图像,IW代表白板校准图像。
2.3.数据处理
如图4所示,采用了一种两阶段方法来利用高光谱图像中的空间和光谱信息进行黄瓜成熟度分级。高光谱数据具有极高的光谱-空间维度,而黄瓜样本的数量相对有限。这导致了一个典型的高维度、低样本量的问题,可能会引起过拟合和高计算成本。为了解决这个问题,第一阶段进行了空间-光谱预处理和特征压缩,将高光谱图像转换为紧凑的特征矩阵;第二阶段则使用TCBL模型进行了监督式成熟度分级。
2.3.1. 空间-光谱预处理和特征压缩
如图4所示,预处理和特征压缩阶段包括波段比率计算、二值化、质心定位、空间感兴趣区域(ROI)裁剪、使用主成分分析(PCA)进行光谱维度降低,以及3D-2D CNN编码器。在空间域中,通过波段比率计算、二值化、质心定位和ROI裁剪来获得一致的黄瓜图像块,从而减少无关的背景信息和计算复杂性。随后,在光谱域中,应用PCA将原始的288个光谱带投影到15个主成分上。这些成分保留了超过95%的总光谱方差,有效减少了光谱冗余和噪声,同时保留了最具信息量的光谱特征。与选择几个固定波长不同,PCA将每个成分表示为所有光谱带的线性组合,提供了完整光谱的客观和紧凑的表示。然后,PCA处理后的高光谱图像块被输入到一个固定的3D-2D CNN编码器中,生成一个大小为200×16的结构化特征矩阵。在这个编码器中,首先使用三维卷积和池化操作来压缩联合的空间-光谱信息,然后使用二维卷积来细化空间特征矩阵。通过这一过程,原始的高维高光谱数据被转换为低维的结构化表示。因此,编码后的特征矩阵作为后续TCBL分级模型的结构化特征序列输入。
2.3.2. TCBL分级模型
基于第一阶段获得的结构化特征表示,开发了TCBL分级模型来捕捉与成熟度相关的复杂光谱变化。黄瓜的成熟度不是由单一的光谱指标决定的,而是由多种生理和生化变化共同作用的结果,例如水分含量、色素浓度和组织结构的变化[3, 33]。这些变化以不同的方式影响光谱响应,导致光谱域中特征特征的互补性。与成熟度相关的生化变化通常同时影响多个光谱区域,从而产生光谱响应的长程依赖性。捕捉这种全局关系对于识别整体成熟度趋势非常重要。特定的化学成分可能在狭窄的光谱区间内产生局部吸收峰,这些峰表现为局部特征模式。对这些局部结构的建模有助于网络检测与成熟度相关的微妙光谱特征。同时,高光谱测量来源于有序的波长序列,相邻光谱带之间的相关性包含有意义的物理信息。尽管原始的高光谱数据在第一阶段被压缩为结构化特征矩阵,但学习到的特征序列仍然保留了潜在的光谱关系。保持这些序列关系使模型能够学习光谱变化模式。由于这些全局、局部和序列特征描述了与成熟度相关的不同方面,因此采用了混合架构。Transformer模块捕捉全局光谱依赖性,CNN组件提取局部光谱模式,BiLSTM模型沿着学习到的特征序列捕捉序列依赖性。模型结构如图4所示。首先,将Transformer编码器应用于输入特征序列,以模拟光谱位置之间的全局依赖性。多头自注意力机制允许模型自适应地为不同的光谱区域分配权重,并捕捉仅靠卷积无法有效建模的长程相关性。编码器使用一个具有两个头部的注意力层和128的输入维度,随后是残差连接和层归一化以稳定训练。然后,将Transformer增强后的特征输入到两个并行分支中。在CNN分支中,使用一维卷积和最大池化层来捕捉局部特征模式和短程光谱变化。这些操作强调局部判别结构,同时减少特征维度。在BiLSTM分支中,使用带有注意力机制的双向LSTM单元来模拟从前后两个方向的序列依赖性。这使得网络能够捕捉光谱位置之间的上下文关系,并关注信息丰富的序列区域。CNN和BiLSTM分支的输出被连接起来,然后输入到密集分类层。最后,softmax函数输出三个成熟度等级的概率。通过集成Transformer、CNN和BiLSTM组件,所提出的TCBL模型在全球、局部和序列层面捕捉了互补的光谱表示,提高了在样本数量有限条件下的黄瓜成熟度分级的鲁棒性和分类准确性。
2.3.3. 训练设置和评估
高光谱图像处理和黄瓜分级模型是在Python 3.8环境中使用TensorFlow 2.7.0实现的。在空间-光谱预处理和特征压缩过程后,从300个黄瓜样本生成了一个特征数据集。数据集包括三个分级类别:一级、二级和三级。其中,225个样本用于训练和验证,每个类别75个样本;75个样本作为独立的测试集,每个类别25个样本。这225个样本进一步使用固定的随机种子以4:1的比例分为训练集和验证集,得到180个训练样本和45个验证样本。数据集划分和超参数设置总结在表2中。
3. 结果与分析
3.1. 不同成熟度等级黄瓜的光谱分析
图5a展示了华北地区不同成熟度等级黄瓜在1000–2500 nm范围内的平均光谱曲线。从图中可以看出,在1200 nm附近出现了一个低谷,不同成熟度级别的黄瓜之间存在明显差异。在1400–1600 nm范围内有一个深谷;然而,不同成熟度阶段的黄瓜的反射率值有所重叠,使得区分变得不那么明显。在1800–1900 nm范围内观察到一个峰值,一级和三级黄瓜之间的差异尤为显著。2000–2400 nm范围是主要的区分带,因为不同成熟度阶段的黄瓜在这个区域表现出明显的差异。
3.2. 两阶段分级方法的性能
3.2.1. 分级结果
两阶段分级方法在测试集上进行了测试,结果如图6所示。从图6a可以看出,所提出的分级方法在测试集上的总体准确率为98.13%±1.69%,表明大多数黄瓜样本被正确分级。精确度和召回率分别为98.14%±1.62%和98.27%±1.56%,显示出在减少误报和避免漏报方面的优异性能。F1分数为98.13%±1.69%,结合了精确度和召回率,进一步验证了在不同等级上的平衡性能。图6b是平均混淆矩阵。如图所示,所提出的方法在识别二级和三级黄瓜方面表现最佳,准确率为100%,意味着这些等级的所有样本都被正确分类。对于一级黄瓜,模型出现了一些误分类,约有4.07%的样本被误分类为二级,1.11%的样本被误分类为三级。对这些误分类的分析表明,一级黄瓜被误分类为二级的概率相对较高,可能是由于边界样本的特征接近二级标准,导致分类偏差。相比之下,误分类为三级的概率较低,可能是由于少数典型样本的光谱或形态特征与典型的初级黄瓜略有不同,偶尔导致误分类。总之,所提出的黄瓜分级方法在分级任务中表现出高准确性和稳定性。
3.2.2. 与机器学习方法的比较
为了评估所提出的黄瓜成熟度分级方法的有效性,使用仅基于光谱域信息的几种经典机器学习方法进行了比较。对于每个黄瓜样本,提取的感兴趣区域内的光谱反射率值在空间像素上进行了平均,生成了一维光谱向量。这些机器学习方法作为参考方法,与所提出的两阶段分级方法进行了比较。评估了三种光谱特征策略,包括全波段、竞争性自适应加权采样(CARS)和连续投影算法(SPA)。CARS通过自适应加权和蒙特卡洛采样来识别信息量大的波长,而SPA通过最小化光谱变量之间的共线性来选择波长[38, 39]。这两种方法在高光谱分析中广泛用于光谱变量选择。机器学习模型使用与所提出方法相同的数据集分区进行训练和评估,数据集包括225个校准样本和75个独立测试样本。两个数据集在三个成熟度类别上都是平衡的。选定的光谱变量被用作几种常见的高光谱分析机器学习分类器的输入,包括支持向量机(SVM)、k最近邻(KNN)、随机森林(RF)和朴素贝叶斯(NB)。这些模型代表了不同类型的传统分类器,在光谱分类研究中广泛用作参考方法。对于KNN分类器,邻居数量设置为5。对于RF分类器,树的数量设置为100。其余模型使用scikit-learn库提供的默认参数实现。从原始光谱变量中,CARS选择了21个波长,而SPA选择了10个波长。图7显示了CARS和SPA选择的波长。
3.3. 与机器学习方法的比较
为了评估所提出的黄瓜成熟度分级方法的有效性,使用仅基于光谱域信息的几种经典机器学习方法进行了比较。对于每个黄瓜样本,提取的感兴趣区域内的光谱反射率值在空间像素上进行了平均,生成了一维光谱向量。这些机器学习方法作为参考方法,与所提出的两阶段分级方法进行了比较。评估了三种光谱特征策略,包括全波段、竞争性自适应加权采样(CARS)和连续投影算法(SPA)。CARS通过自适应加权和蒙特卡洛采样来识别信息量大的波长,而SPA通过最小化光谱变量之间的共线性来选择波长[38, 39]。这两种方法在高光谱分析中广泛用于光谱变量选择。机器学习模型使用与所提出方法相同的数据集分区进行训练和评估,数据集包括225个校准样本和75个独立测试样本。两个数据集在三个成熟度类别上都是平衡的。选定的光谱变量被用作几种常见的高光谱分析机器学习分类器的输入,包括支持向量机(SVM)、k最近邻(KNN)、随机森林(RF)和朴素贝叶斯(NB)。这些模型代表了不同类型的传统分类器,在光谱分类研究中广泛用作参考方法。对于KNN分类器,邻居数量设置为5。对于RF分类器,树的数量设置为100。其余模型使用scikit-learn库提供的默认参数实现。从原始光谱变量中,CARS选择了21个波长,而SPA选择了10个波长。图7显示了CARS和SPA选择的波长。图8展示了仅基于光谱信息的黄瓜成熟度分级分类结果。如图8所示,在特征波段选择方面,使用全波段时,所有五种分类方法的表现都很好,各项指标均超过了80%。当应用CARS时,五种分类方法的整体表现较差,其中KNN方法的准确率最高,为85.33%。当使用SPA时,五种分类方法在五个模型中的表现各不相同,RF的表现最好,所有指标的最高值为93.33%,而SVM的准确率仅为82.47%。全波段数据包含丰富的信息,为不同分类方法取得一定结果提供了基础。然而,这些信息中也包含大量冗余数据,这可能会阻碍分类准确率达到最佳效果。CARS和SPA都是特征选择方法,可以在保留关键信息的同时降低全波段数据的维度。在黄瓜成熟度分级任务中,CARS的表现不如SPA。这可能与CARS倾向于保留更多相关光谱变量有关,而SPA则是通过最小化相关性来选择波长,从而得到更紧凑且信息量更大的特征子集用于分类。SPA通过一系列投影算法,可以更灵活和系统地选择最有意义的波段进行分类。这种方法逐步优化波段选择,使每一步都对后续的分类任务产生积极影响。对于分类方法而言,RF在所有波段方法中表现最好,而SVM的表现较差。这是因为高光谱数据通常具有非线性特征,而RF作为一种由多个决策树组成的集成学习方法,能够有效处理非线性关系和复杂特征空间,因此在高光谱数据上获得更好的分类结果。相比之下,SVM通过核函数来处理非线性关系。尽管它可以处理高维数据,但其性能对核函数的选择和参数设置非常敏感。不适当的参数选择可能会降低分类准确率。
图8显示了不同波段选择和机器方法对黄瓜分级结果的影响。在实验中,SPA和RF的组合表现最佳,总体准确率达到93.33%。然而,我们提出的基于深度学习的黄瓜成熟度分级方法达到了98%的总体准确率,表明分类性能有显著提升。仅利用高光谱图像光谱域信息的机器学习方法试图从光谱波段中识别与成熟度相关的特征,而不考虑所使用的波段选择方法。虽然这种方法可以达到一定的分类准确率,但它会导致大量数据的浪费,因为它忽略了高光谱图像中的空间信息。在黄瓜成熟度高光谱数据集中,机器学习方法的性能提升受到其单一维度特征提取的限制。相比之下,我们的两阶段方法充分利用了空间和光谱域信息。在空间-光谱预处理和特征压缩阶段,有效保留了空间区域和信息量大的光谱特征,3D-2D编码器将数据转换为紧凑的特征矩阵。TCBL分级模型通过深入探索光谱特征与分级任务之间的相关性,进一步提高了光谱数据的有效利用。
3.3 TCBL模型的评估
3.3.1 TCBL与其他深度学习模型的比较
DenseNet-121 [40]、ResNet-50 [41]、SqueezeNet [42]、CapsuleNet [43] 和 Xception [44] 是广泛用于图像分类的深度学习模型,被选为与提出的TCBL模型进行比较。这些模型代表了不同的网络设计机制,包括ResNet中的残差学习、DenseNet中的密集特征重用、SqueezeNet中的轻量级卷积设计、CapsuleNet中的基于胶囊的表示学习以及Xception中的深度可分离卷积。为了公平比较,所有深度学习模型都是使用相同的数据集从头开始训练的。没有使用预训练的权重,训练过程中也没有冻结任何层。所有模型都使用相同的实验协议进行训练和评估。图9展示了评估模型的比较性能。TCBL模型在总体准确率、精确度、召回率和F1分数方面均超过了98%,运行时间为30.8秒,显示出分类准确性和计算效率之间的良好平衡。此外,TCBL在重复实验中的标准差相对较小,表明训练过程中的稳定性很高。相比之下,DenseNet-121、ResNet-50和Xception的总体准确率分别为95.33%±7.42%、96.93%±3.88%和97.47%±7.10%,但它们的运行时间较长,分别为229.05±9.14秒、319.94±2.12秒和371.83±6.45秒。SqueezeNet和CapsuleNet的准确率相对较低,分别为79.60%±26.39%和92.13%±0.98%,精确度和召回率也低于TCBL。为了统计评估模型之间的性能差异是否显著,基于重复实验的结果进行了单因素方差分析(ANOVA)。ANOVA结果表明,模型在准确率、精确度和F1分数方面存在显著差异(p < 0.05),如表3所示。这些结果表明,提出的TCBL模型与DenseNet-121、ResNet-50和Xception相比具有竞争力,同时优于SqueezeNet和CapsuleNet。此外,TCBL的运行时间明显短于大多数深度学习模型,表明其计算效率很高。
图9展示了TCBL模型与其他深度学习模型的比较。表3. 深度学习模型比较的单因素ANOVA结果。
3.3.2 TCBL模型的消融实验
在这项研究中,进行了消融实验来评估TCBL模型中每个关键组件对其整体性能的影响。通过依次移除Transformer、CNN和BiLSTM组件,评估了这些组件对模型分级性能的贡献。图11展示了消融实验的结果。包含Transformer、CNN和BiLSTM组件的消融设置1获得了最高的分级性能。在消融设置2-4中,分别移除了Transformer、CNN和BiLSTM组件,以观察它们对黄瓜成熟度分级的影响。移除Transformer组件后,准确率降至96.53%±0.93%,突显了其在捕获数据全局特征方面的价值。移除CNN组件的影响最大,所有指标均降至95.73%。相比之下,移除BiLSTM组件的影响较小,所有指标仍达到97.47%,表明BiLSTM对模型性能的贡献。消融设置5-7分别评估了Transformer、CNN和BiLSTM组件在黄瓜成熟度分级中的单独使用。它们的准确率分别为95.60±1.99、94.93±1.47和91.47±6.98,精确度指标也低于它们的组合性能。
4. 讨论
本研究采用了高光谱成像系统来获取1000–2500纳米范围内不同成熟度级别的黄瓜的光谱数据。黄瓜的光谱在1400至1800纳米之间有重叠,而在2000–2400纳米范围内观察到了明显的差异,为成熟度区分提供了光谱基础。有趣的是,在黄瓜种子中也发现了类似的趋势[21],这表明水果和种子在成熟过程中可能经历类似的物理化学变化。这一发现为其他水果和蔬菜的成熟度评估提供了有价值的见解和参考。尽管这些光谱特征为分类提供了基础,但要实现高效利用和准确分级仍高度依赖于稳健的分析方法。在基于光谱的水果和蔬菜质量评估领域,传统方法通常遵循“光谱预处理—特征波长提取—机器学习建模”的工作流程[45–47]。虽然这种方法可以达到一定的准确率,但其固有的局限性在于仅使用光谱域信息,而忽略了高光谱图像中的空间特征。因此,数据利用受到限制,分类性能也受到限制。为了克服这一限制,本研究提出了一种两阶段方法。在第一阶段,进行空间-光谱预处理和特征压缩,从高光谱图像生成紧凑的光谱-空间特征。在第二阶段,使用TCBL模型来建模这些特征与黄瓜成熟度等级之间的关系。在同一测试集上,所提出的方法达到了98%的分级准确率,比最佳的传统方法高出5%,证明了其在捕获与黄瓜成熟度相关的复杂光谱特征方面的有效性。该方法在工业应用中显示出巨大的潜力。在采后黄瓜处理中,它可以实现自动化分级系统的开发,将高光谱成像与深度学习相结合,从而减少对人工经验的依赖,提高分级标准化和一致性,并减少因错误分级造成的食物浪费和经济损失。此外,该方法具有很强的可扩展性,通过适当的训练和调整,可以扩展到其他水果和蔬菜(如番茄和甜椒)的无损成熟度检测。
5.**结论**
为了应对黄瓜成熟度分级不准确的挑战,并促进高光谱技术和深度学习在果蔬内部品质分级中的应用,本研究建立了黄瓜成熟度分级标准,并为华北型黄瓜构建了高光谱图像数据集。基于高光谱成像和深度学习,开发了一种两阶段的黄瓜成熟度分级方法。本研究得出了以下结论:根据明确的标准和实际需求,制定了黄瓜成熟度分级标准,并创建了包含300个黄瓜样本的数据集用于研究。为了实现快速准确的分级,首先将高光谱图像转换为紧凑的结构化特征矩阵,然后将其作为输入数据输入到TCBL分级模型中。实验结果显示,所有分级指标的准确率均超过了98%,且运行时间为30.8秒。与机器学习方法相比,所提出的成熟度分级方法的准确率提高了5%;此外,所提出的TCBL分级模型相比其他深度学习模型也表现更好。消融实验表明,在TCBL模型中加入Transformer、CNN和BiLSTM组件后,准确率提高了0.6%–3%。本研究为在线黄瓜成熟度分级的发展提供了理论支持。
**作者贡献**
刘芳红:概念构思、方法设计、软件开发、初稿撰写
张宁:概念构思、资金筹集、资源协调
马世新:数据收集与分析
尹和生:资金筹集
黄波:概念构思、项目监督
柴秀娟:概念构思、资金筹集、项目监督、审稿与编辑
**致谢**
本研究未使用任何人工智能工具。
**资金支持**
作者衷心感谢中国国家重点研发计划(项目编号2022YFD2002205)、中国农业科学院基础研究创新项目(项目编号CAAS-BRC-SAE-2025-01)以及山东省自然科学基金(项目编号ZR2024QF137)提供的财政支持。
**利益冲突**
作者声明不存在任何利益冲突。
**数据可用性**
如需获取支持本研究结果的数据,可向通讯作者提出合理请求。
打赏