大米(Oryza sativa L.)是人类消费最重要的谷物之一,仅次于小麦和玉米,在经济和社会方面都发挥着战略作用。根据美国农业部(USDA)的数据,2023/2024年度全球大米产量约为5.18亿吨,中国、印度和孟加拉国是主要的生产国。联合国粮食及农业组织(FAO)的数据显示,约89.6%的产量来自亚洲,全球十大大米生产国均位于该地区。巴西是唯一一个年产量超过1000万吨的非亚洲国家,在全球排名中位列第11位,是美洲最大的大米生产国。大米与豆类一起成为巴西国民饮食的主要支柱,在农业产业部门具有重要的经济意义[1]、[2]、[3]、[4]、[5]、[6]。
巴西大米的官方分类由农业、畜牧业和供应部(MAPA)2009年2月16日的第6号规范指令规定,该指令确立了大米商业化和检验的标准。根据这一规范,大米被分为四个层级:组、亚组、类别和类型。分类依据的是米壳的存在情况,将其分为糙米和精米。亚组则根据加工方式确定,糙米进一步分为天然糙米和蒸煮糙米;精米包括糙米、抛光米、蒸煮糙米和蒸煮抛光米。类别依据米粒的尺寸特征(如长度和长宽比),分为短粒、中粒、长粒和细长粒。类型则反映了产品的商业质量,基于物理缺陷(如碎米、污渍、霉变、粉状、损坏、条纹或黄色米粒)的最大允许限度,以及碾磨过程中产生的外来物质和米粒碎片。类型从1型(最高质量)到5型递增,每种类型的允许限度逐渐提高。这一分类框架旨在确保巴西大米销售的标准化和透明度[7]。
巴西消费最多的大米是1型,属于细长粒类别,其特征是米粒长度大于或等于6毫米,宽度小于或等于1.9毫米,长宽比至少为2.75毫米。要被归类为1型大米,产品必须符合严格的物理缺陷容忍限度,如碎米粒和米粒碎片。这种分类与产品的优质特性密切相关,因此1型大米成为食品欺诈的常见目标[7]、[8]。食品欺诈是指故意欺骗消费者以获取经济利益的行为,可能包括原材料的替换、添加或稀释,以及标签信息的伪造[9]、[10]、[11]、[12]。在大米领域,这通常表现为将碎米粒和/或米粒碎片以超过允许比例的方式混入产品中,从而误导消费者并损害产品真实性。MAPA的多次行动揭示了这些行为的严重性,例如在圣保罗市查获标为1型的5型大米,从超市中撤下10,500公斤质量不符的大米,以及圣保罗市和联邦区打击食品欺诈的联合行动[13]、[14]、[15]。
在抛光精米1型大米中,米粒碎片(由碾磨过程中米粒破损产生)和碎米粒(长度不足相应类别完整米粒四分之三的米粒)的最大含量分别应不超过0.5%和7.5%。MAPA采用基于机械分离的方法,使用校准筛子和测量秤等简单仪器,采样和定量程序基于形态学标准。重点在于识别产品的物理缺陷,并根据碎米粒和米粒碎片的百分比进行分类,符合最大容忍限度[7]。
为提高食品安全,人们不断探索新的分析方法来检测和预防大米欺诈。在这方面,已经开发了多种技术用于品种鉴定、地理来源识别和掺杂检测。色谱、光谱、同位素、分子、DNA分析,以及最近的计算机视觉和机器学习方法已被广泛使用[11]、[16]、[17]、[18]、[19]、[20]。尽管计算机视觉在谷物分析方面取得了显著进展,尤其是多光谱和高光谱图像的应用,但大多数研究仍依赖于复杂的处理步骤,如单个米粒的分割和边缘检测。对于机器学习,所使用的模型需要仔细调整超参数。尽管这些策略可以达到高精度,但其实际应用受到技术基础设施和专业知识的要求,限制了其普及性和可重复性[21]、[22]、[23]。鉴于这些限制,无损方法如近红外光谱和数字图像分析因其实用性、速度和符合绿色化学原则而备受关注。特别是基于数字图像并结合化学计量学模型的方法,不仅具有高灵敏度和鲁棒性,而且采集系统成本低廉,适用于工业应用和现场检测[10]、[17]、[24]、[25]。
在这种情况下,基于化学计量学辅助的颜色直方图分析系统(CACHAS)[26]展示了使用智能手机、扫描仪、数码相机和网络摄像头等便携设备对各种食品基质(包括大米)的化学和物理化学性质进行分类或量化的能力[17]、[27]、[28]、[29]。Izquierdo等人(2020)[29]使用卷积神经网络(CNN)对数字图像进行处理,对五种西班牙大米品种进行了分类和鉴定。Pradana-López等人(2021)[17]也应用CNN对在暖光下拍摄的数字图像进行分析,以鉴定日本大米品种是否掺杂了价值较低的品种。Arslan等人(2022)[27]开发了一种与智能手机连接的比色传感器,用于区分掺杂了不同比例低质量白米的优质巴斯马蒂大米样本。尽管这些研究取得了成功,但它们仅限于同时评估单一掺杂物的混合物,限制了模型的通用性和在实际多掺杂物场景中的应用。单类分类(OCC)对于克服这些限制至关重要,特别是在欺诈和食品真实性研究中,因为它可以独立地对目标类别的样本进行表征,而不依赖于其他类别的特征[25]、[30]。据我们所知,数据驱动的软独立建模类比(DD-SIMCA)尚未与基于数字图像的方法结合,用于基于巴西市场质量参数鉴定1型大米中的掺杂情况。因此,本研究首次应用CACHAS方法快速鉴定1型大米样本,并检测其中是否掺杂了碎米粒和米粒碎片。