食用油是不饱和脂肪酸和脂溶性维生素的主要膳食来源,在全球范围内广泛消费[1],[2]。这些油通常由约98%的三酰甘油组成,同时还含有少量影响营养价值和质量的生物活性化合物[3]。2025年全球食用油产量约为2.28亿吨,其中大豆油、菜籽油、向日葵油、花生油、棉籽油、椰子油和橄榄油的消费量尤为突出[4],[5]。伊朗每年的食用油消费量约为150万吨,芝麻油、橄榄油、向日葵油、椰子油和杏仁油在该国的饮食和食品工业中占据重要地位[6]。由于食用油具有很高的经济价值且消费广泛,尤其是高品质产品,它们经常受到低成本油的掺假。最近的一项全球评估显示,每年约有6.92%的食用油和脂肪受到掺假,这引发了人们对食品质量、消费者信任和法规遵守的严重担忧[8],[9]。因此,开发可靠的油品鉴定方法在食品行业中至关重要。
精油因其生物活性特性(如治疗、抗菌和抗氧化作用)而在食品、化妆品和医药行业中得到广泛应用[10]。它们主要由萜烯、酯类和醛类等挥发性生物活性化合物组成,这些成分决定了它们的独特香气和功能特性[11]。由于精油的高市场价值,它们特别容易受到掺假,通常是通过添加合成物质或低成本提取物来实现的[12],[13]。这些普遍存在的掺假行为凸显了开发快速、可靠和准确的分析技术的重要性,以确保食品、化妆品和医药行业的真实性和质量控制。
已经开发了许多用于油品鉴定的分析方法,包括色谱[14]、光谱[15]、[16]和光谱测量[17]方法[18]。例如,Carranco等人[14]表明,结合化学计量学的高性能液相色谱指纹技术可以有效鉴定和检测特级初榨橄榄油中的掺假。Quintanilla-Casas等人[17]指出,气相色谱-质谱结合化学计量学分析是一种基于地理来源鉴定特级初榨橄榄油的可靠方法。Lim等人[19]报告称,核磁共振光谱结合机器学习可以准确分类和量化食用油及掺假混合物中的芝麻油。虽然这些方法提供了详细的成分信息,但它们通常成本较高、耗时较长且需要大量的样品准备,这限制了它们在快速筛查和大规模监测中的应用[20]。振动光谱技术,特别是傅里叶变换红外(FTIR)光谱,提供了快速、无损的替代方法,可以生成与官能团和整体化学组成相关的分子指纹信息。
在振动光谱技术中,FTIR光谱已成为分析油样最广泛使用的工具之一。这是因为它对官能团的基本振动模式具有高灵敏度,并能够捕捉复杂脂质基质中的细微结构变化[21],[22],[23]。与其他通常在食用油中产生较少强吸收带的振动光谱方法相比,FT-IR光谱具有更高的吸收特征密度,从而形成了信息更丰富的光谱指纹[23]。这种增强的光谱复杂性,加上快速的数据采集、最小的样品准备需求和高测量重复性,突显了FTIR光谱的优势。因此,FTIR特别适合高通量分析和开发用于常规鉴定的大规模光谱数据库。
最近关于油品鉴定技术的综述一致表明,当FTIR光谱与化学计量学分析结合使用时,由于其高信息含量和快速采集能力,成为最常用的光谱技术之一[24],[25]。例如,Yuan等人[26]应用FTIR光谱结合偏最小二乘判别分析(PLS-DA)对五种商业植物油进行了分类,在校准集和预测集中均实现了100%的正确分类。Ye等人[27]使用基于FTIR的判别分析和PLS回归区分了11种食用油,并鉴定了山茶油与其他植物油。Fediuc和Oroian[28]应用FTIR光谱鉴定了被三种常见植物油掺假的核桃油。他们的发现证明了FTIR光谱在检测油样掺假方面的适用性。
然而,在大多数基于FTIR的鉴定研究中,一个重要的实际限制常常被忽视。大多数现有方法隐含地假设基础油已知,然后专注于检测相对于该预定义类别的掺假情况。因此,通常需要预先了解油类及其预期成分。当应用于真实市场场景时,这样的目标框架存在局限性,因为油样可能未标记、标记错误或来源未知。在这种情况下,传统的基于FTIR的模型无法可靠地识别油类或其成分复杂性,尤其是在涉及多组分混合物时。此外,大多数先前的研究通常涉及较少的油类类型、有限的掺假情况(通常是二元混合物)和相对较小的光谱数据集,这限制了它们的通用性和实际应用性。这些限制凸显了开发一个涵盖广泛常用食用油和精油的全面FTIR光谱参考数据库的迫切需求,以便在无需预先假设油类身份的情况下进行识别。
在本研究中,我们通过开发一个包含30种广泛消费的食用油和精油的大规模FTIR光谱数据库来满足这一需求。该数据库旨在支持无需预先了解油类类型或成分的油样无目标鉴定。利用这个参考数据集,我们进行了基于相似性的分析以探索光谱关系并估计多组分混合物中的油比例,同时应用了监督机器学习模型进行多类区分。为了提高可解释性,使用网络分析了数据库中的光谱相似性模式。所开发的FTIR光谱数据库作为补充信息提供,供研究社区开放访问,为现实市场条件下的油品鉴定提供了可扩展的分析资源。