膳食摄入数据是阐明饮食-疾病关联、支撑政策制定及评估营养干预措施的核心依据,但在人群与社区研究中面临独特挑战:饮食模式异质性高、参与者依从性差异大、实操限制严苛,导致高度受控的膳食评估方法难以推广。移动技术、数字工具与人工智能(artificial intelligence, AI)的进步正重塑膳食数据的采集、处理与分析流程。本叙述性综述系统探讨数字与技术赋能方法如何影响膳食评估全流程中偏倚与误差的关键来源,涵盖样本选择、参与者报告、食物分类及营养素构成赋值环节。研究人员同时评估了这些方法在大规模研究场景中的实施可行性,综合考量成本、基础设施、受访者负担及可扩展性。现有证据表明,尽管多项技术有望减少特定来源的偏倚与测量误差(如回忆限制、访员效应、错误分类),但也可能同步引入新挑战,包括选择偏倚、分析复杂度提升及开发与实施成本高企。这些权衡在异质性高的大规模研究人群中尤为突出——评估方法需在多元场景下平衡准确性与可行性。网络连接、设备可及性及技术能力的限制进一步制约了资源匮乏地区的实施。技术创新为改善膳食评估提供了重要机遇,但其价值取决于具体情境下准确性、可行性与实施成本的权衡。在人群与社区营养研究中遴选方法时,对上述因素的审慎考量是核心前提。
本研究围绕膳食评估中的技术革新展开系统性论述,全文主体结构如下:
背景
全球超重、肥胖及饮食相关非传染性疾病负担持续加重,与此同时微量营养素摄入不足仍是重要疾病负担来源。应对上述挑战需要准确且具有代表性的膳食数据,以识别摄入不足风险人群、评估干预效果并指导政策与资源配置。在大规模层面生成此类数据,要求方法在精度、受访者负担、成本与可扩展性之间实现平衡,这一需求在人群与社区研究中尤为迫切——此类研究需在识字水平、参与意愿及资源可及性各异的多元人群中完成数据采集。传统方法(食物频率问卷food frequency questionnaire, FFQ、24小时回顾法、食物记录法)均存在固有权衡,尤其易受选择偏倚、访员效应、社会期望偏倚、反应性偏倚及回忆限制等多类误差影响。额外测量误差还产生于份量估算、食物分类、食谱拆解及食物成分赋值环节。部分误差源于工具本身,另一些则与设计、实施及语境因素(如食物报告的文化规范、识字与语言障碍、食物环境差异)相关。受访者负担进一步通过影响应答率、数据完整性及失访率制约数据质量,目前尚无单一方法能在大规模异质人群中完美平衡准确性、成本与可行性。移动技术、数字采集平台与AI的发展拓展了膳食数据的采集、处理与分析路径。本综述所指“技术创新”涵盖改造上述流程的数字工具与系统,既包括全新方法,也包括依托连接性、算力与数据基础设施进步对传统方法的适配与规模化应用。尽管这类技术全球应用日益广泛,但其采纳与推广仍不均衡,在部分低收入与中等收入国家(low- and middle-income countries, LMICs)及资源匮乏地区,基础设施、互联网与智能手机可及性、专业人员及资金的限制显著影响可行性与表现。与传统方法整合后,技术创新有望降低偏倚与误差、提升效率并减轻受访者负担,但也可能带来与选择偏倚、数据处理及资源约束相关的新挑战。既往综述多聚焦特定工具、分析性能或高收入地区应用,较少系统评估技术与全流程既有偏倚误差的交互作用,且可行性要素(成本、基础设施、可扩展性)常与测量误差割裂讨论。本综述聚焦人群与社区研究场景(含全国调查、队列研究、项目评估),系统梳理技术创新对膳食数据采集、处理、分析各环节偏倚与误差的影响,并评估实施层面的权衡。
膳食评估中的偏倚来源
偏倚即系统误差,其来源可分为三大域:评估工具固有属性(如依赖记忆、份量估算难度)、研究设计与实施(如抽样策略、调查执行、访员特征)、语境因素(如文化规范、识字水平、食物环境),各域在实际中常相互交织。
选择偏倚是所有方法的潜在问题,源于参与所需的接入条件、能力与意愿,核心驱动为抽样策略与参与壁垒,但特定工具特征会加剧该风险。调查材料或访员未覆盖全部相关语言会普遍提高人群排除风险;自填式问卷进一步排除低识字率、低教育程度及特定残疾群体,而这些群体常在营养研究中代表性不足。受访者负担是另一核心驱动:更长或更复杂的工具(如食物记录、详细FFQ)要求持续的注意力与动机,推高选择偏倚与失访风险。
访员偏倚属于实施层面误差,仅存在于访员 administered 方法中。访员提问方式、追问策略、对食物选择的态度反应及记录差异(源于语言文化障碍、培训不足或对本地食物认知有限)均可引入随机或系统误差。尽管可通过培训、质量控制及访员随机分配缓解,但无法完全消除。采用标准化提示与追问的工具对该偏倚的敏感性相对较低。
社会期望偏倚指受访者因感知到数据收集者或团队的评价而误报食物、饮料或补充剂,是受访者行为与语境的交互结果。参与者倾向于少报自认为“不受欢迎”的食物、多报“受欢迎”食物,通常导致能量摄入低估与部分微量营养素高估,但错报的方向与程度随文化、受访者特征及评估方法而异。
反应性偏倚指意识到被观察或记录会改变食物种类与摄入量,尤其常见于食物记录与预安排的24小时回顾。该偏倚主要与评估方法(如前瞻性记录)相关,但也受语境与参与者意识影响。在自报食物记录中,数据收集负担越重,反应性偏倚越强,通常同样导致健康食物与更小份量的报告偏移,造成能量低估与微量营养素高估,且可能随参与者特征呈现系统差异。
回忆偏倚是回顾性方法的固有局限,反映受访者在记忆食物、饮料及补充剂种类与数量时的认知行为限制。误差可表现为遗漏(消费但未报告)、侵入(报告但未消费)或份量误忆,引入随机或系统误差。零食、调味品与饮料最常被遗忘,份量则常被系统性高估或低估。动机不足的参与者可能因调查疲劳漏报食物,导致营养素摄入低估。
膳食评估中的误差来源
除系统偏倚外,随机误差(无一致方向性的估计变异)同样贯穿评估全流程,部分情况下也可呈现系统模式(如按食物类型或亚群)。误差起源于受访者报告与测量(如份量估算),也产生于数据处理分析环节(食物分类、食谱拆解、营养素赋值),还源于底层数据系统的局限(如食物成分数据不完整或变异大)。在大规模研究中,针对多元食物、制备方式与人群的通用假设会放大误差叠加效应。
份量估算误差既来自受访者认知局限,也源于研究者对报告工具与应答选项的设计决策,与回忆偏倚的区别在于其反映体积与重量估算的认知限制,可同时影响回顾性与前瞻性调查。FFQ中混合菜肴的份量估算尤其困难,将不同频率或份量的同类食物归组也会引入误差。24小时回顾的认知负荷较低、估算更精确,但需预先投入大量工作确定文化适宜的份量估算辅助工具。数据处理环节将报告份量转换为标准单位(如克)时,预设转换系数还会引入额外误差;标准单位与食物图谱对应预估值,家用器具则需针对每种食物进行体积与密度转换,餐具盛装量超过平满容积的特性还要求引入食物与器具特异的“堆高系数”,进一步带来随机或系统误差。
食物分类误差产生于多个环节:受访者误报、细节缺失或不知晓混合菜肴的具体配料与制备方法;访员误解或错录应答;分析人员编码失误。调查设计也会引入误差:电子食物记录、24小时回顾与FFQ通常采用预设食物清单与食物组筛选器,需针对研究人群定制。穷尽式清单虽降低错误分类,却增加受访者与访员负担,过长的清单反而会因受访者倾向选择列表前部选项(即使后部有更匹配项)推高偏倚。检索功能则可能因拼写差异、地域或语言导致的食物名称变异受阻。FFQ尤其易发生错误分类,因其极少捕捉烹饪方法等细节;食物记录与24小时回顾中“其他”类食物的描述若不够详尽,同样会导致分析再分类错误,造成营养素摄入的高估或低估,且可能随食物类型、制备方式或参与者特征呈现系统性。
食物成分数据误差主要源于底层数据系统的局限。传统食物成分表通常为每种食物提供单一营养素剖面,仅有时区分解剖部位(如肉类切割部位),反映的是可用样本的平均值。这种方法在数据稀缺(尤其在LMICs)时具有实用性,但实际中营养素含量受品种、地理、季节、强化情况及加工储存方式影响显著。动物性食物同样因饲料与生产体系差异存在变异。此外,数千种可食用野生作物、昆虫与动物完全缺乏营养素数据,缺失值不得不以相似食物替代,引入假设与潜在偏倚。加工食品常用聚合值代表众多品牌产品,膳食补充剂也面临类似挑战:营养素含量随品牌、剂量与配方变化,且各国尚未普遍建立全面更新的补充剂成分数据库。跨国替代或应用复合值会引入偏倚,且食物成分数据还受限于对文化与地域特异性制备方法、强化实践、新产品快速涌现及分析方法差异的细节缺失。
食谱营养素构成的误差主要在数据处理环节产生,尤其当需要对配料、制备方法及营养素保留率做出假设时。食物成分数据库仅提供个体食物的生食可食部数据,几乎不含熟食或预制食物数据。现有食谱值通常代表该国“典型”制备方法的平均值。由于大规模调查中直接实验室分析不可行,营养素值需通过配料名称、生重、营养素值、烹饪方法、营养素保留因子与产出因子(或最终制备重量)算术估算。营养素保留因子仅在有限食物组与烹饪方法中可得,且很少考虑烹饪方法、食物组及同一食物不同部位的巨大变异。产出因子解释烹饪过程中的水、脂肪、酒精与盐的吸收或流失,通常在食谱层面应用,但也会随配料组合、烹饪方法与时长大幅波动。现有方法对食谱宏量营养素构成的估算相对合理,但对微量营养素(尤其是含量低或烹饪中易降解的种类)常引入显著误差。
利用技术减少偏倚与误差
测量误差多局限于评估的特定阶段,而偏倚常具跨领域性,可同时源于评估工具、设计与语境。技术方法可在采集、处理、分析各环节应对偏倚与误差,但有效性高度依赖应用场景。现有证据多来自高收入地区,资源匮乏地区的证据有限。
电话访谈是最早普及的远程方法,主要通过移动电话或固定电话实施访员 administered 的24小时回顾或FFQ。其在高收入地区广泛应用,在LMICs的应用则随女性与低收入群体手机拥有率提升而增加。该方法主要通过电话拥有率、连接性与接听概率的差异影响选择偏倚,这些差异在低收入地区随性别、社会经济地位与地点而异。例如肯尼亚农村地区,即使采用入户招募与家庭内电话共享策略,电话膳食调查的无应答率(19%)仍是面访(6%)的3倍。高收入地区同样存在显著无应答,如2011-2012年澳大利亚全国营养与体力活动调查中,仅64%合格参与者完成了面访后的第二次电话回顾。电话调查可降低部分参与壁垒(无需留守家中),可能提升特定群体的参与,但通过提供设备、电话共享与入户招募等策略虽可改善参与,仍无法完全解决差异无应答问题。关于其对社交期望偏倚与访员偏倚的影响证据有限,可能随信任水平、匿名性需求及文化背景变化。埃塞俄比亚城市家庭消费调查发现,电话访谈后期问题的报告消费量降低12%,提示更高的回忆偏倚可能与受访者疲劳相关;但电话采集支持重复短期回顾与生态瞬时评估,可减少长时回忆的依赖,不过前瞻性方法可能引入反应性偏倚,仍需更多证据。份量估算是该方法的突出挑战,因缺乏实体辅助工具,但现有证据显示电话访谈的份量估算精度可与面访相当,数字食物图谱或视觉辅助工具的普及可进一步支持估算。斯里兰卡农村研究显示,电话24小时回顾的蛋白质与6种微量营养素估算与称重食物记录的等效性在15%以内,而面访无任何营养素达到等效,但该证据限于单一研究与部分营养素。电话调查通过免除面访差旅降低实施成本,同项斯里兰卡研究估算其成本比面访低27%,但具体成本-精度权衡的直接比较研究仍稀缺。整体而言,电话方法在高、低资源地区均具可扩展性,但表现取决于成本、可及性与数据质量的情境权衡。
计算机辅助访谈包括面对面(computer-assisted personal interview, CAPI)与电话版(computer-assisted telephone interview, CATI),通过平板或电脑等设备实施数字化访员 administered 评估。高收入地区已成熟应用,正逐步向LMICs适配推广。多语言界面可降低语言壁垒导致的选择偏倚,前提是覆盖全部相关语言;受访者对数字采集的信任与感知也会影响参与,部分语境中电子采集可提升调查重要性感知与保密性感知。标准化问题呈现与自动跳转逻辑可降低访员相关偏倚,改善访员体验,但访员与受访者对数字工具的差异熟悉度可能引入新偏倚。电子采集通过必填项约束、标准化份量单位、自动异常值检查与预设食物清单,减少份量估算与错误分类的数据录入误差;实时传输支持集中监测与反馈,降低缺失值与不一致;语义搜索等功能还可改善录入时的食物匹配,减少分类误差。越南女性的验证研究显示,INDDEX24数字回顾平台与传统纸笔法的能量、宏量营养素及5种微量营养素中4种的估算均与称重记录参考值在10%以内等效;加拿大网络版与纸质版FFQ的比较也显示营养素估算高度一致。尽管前期开发、编程与设备成本较高,但数据录入、清理与项目管理效率的提升可抵消成本,尼泊尔2011年人口与健康调查中,平板采集较上一轮纸质调查缩短总周期15%,且设备复用与规模效应可进一步摊薄成本,CATI还可省去访员差旅住宿的大额支出。可行性依赖电力、网络、设备维护与受访者移动数据费用等基础设施,电池续航、连接性与供电在部分地区需备用电池或太阳能充电器等缓解策略;协作开发标准化电子平台(整合本地食物清单、份量转换因子与食物成分数据)可进一步提升跨场景复用效率。
自填式数字调查通过电脑、平板与智能手机应用实施自填食物记录、24小时回顾或FFQ,在高收入地区广泛应用,但针对LMICs的开发与验证仍较少。识字率、语言、数字接入与技术熟悉度的差异会引入选择偏倚,即使在高收入地区,儿童、老年人、低教育程度与少数群体中也观察到更低的准确率与参与度;但灵活的时间安排也可能提升部分群体的参与。其核心优势是彻底消除访员偏倚,部分语境中也可显著降低社交期望偏倚,但自填可能增加受访者负担与反应性,尤其对于重复或详细的条目录入。与电话访谈类似,自填数字方法支持更短频次的报告(如生态瞬时评估),可减少回忆偏倚:荷兰成年人研究显示,智能手机APP每2小时的重复回顾对蛋白质与钾的低估程度(14%与11%)低于自填网络版与访员 administered 电话版24小时回顾(18%与16%),更短的回顾周期与更低的受访者疲劳是主要原因。但自填依赖受访者自主识别与录入食物,无访员支持,可能升高遗漏、侵入与食物分类误差:美国成年人研究中,自填回顾的食物匹配率为66%,低于访员 administered 的75%,且侵入率更高;美国儿童研究中,访员 administered 回顾的匹配率为57%、遗漏率23%,而在线自填分别为37%与35%,提示访员追问与对食物清单的熟悉度可提升准确性,对儿童的效果优于成人。份量估算同样依赖受访者自主判断,交互式辅助与数字食物图谱的有效性取决于可用性与受访者参与度。自填数字工具的边际成本极低,可扩展至大规模人群,减少对训练有素的访员与差旅的需求,有研究称单人成本仅为面访的4%,但未计入开发、适配、验证与数据处理成本。可行性受设备、网络连接与数字素养限制,离线功能与连接性改善可逐步提升可及性,但LMICs证据仍有限。早期评估显示特定人群接受度与依从性较高,多数成年人偏好自填网络回顾而非访员 administered 调查,年轻女性也认为网络版食物记录比纸质版难度更低、耗时更少、更便利,但这些研究多采用高动机、高识字率的志愿样本,推广性受限。导航、登录与食物搜索的挑战常见,游戏化、直观界面与自动提示可改善可用性与依从性,便携式重量传感器与APP整合等新兴工具可进一步减轻负担与份量误差,但大规模研究中的精度与可扩展性尚未验证。
图像采集通过照片记录全天消费的食物饮料,可整合入多种评估方法。纯图像法作为前瞻性食物记录,图像辅助法则结合图像与受访者报告(文本或音频)用于前瞻或回顾方法。图像可由可穿戴设备(相机、眼镜)被动采集,或由手机、手持相机主动采集。被动采集可降低识字、语言或教育壁垒,提升部分人群的包容性,但隐私与信任顾虑可能影响参与,允许参与者审核或删除图像可改善可接受性;主动采集则需要参与者投入与培训,可能按年龄、性别与动机程度引入选择偏倚。无访员可消除访员偏倚并可能降低社交期望偏倚,但反应性偏倚仍显著:佩戴设备或提示录制时参与者可能改变行为,补充语音或文字注释会进一步升高反应性,近四分之三的中国成年人在语音注释视频提醒后报告消费行为发生改变,文字注释虽更易接受,却会在低识字人群中引入选择偏倚。前瞻性图像采集减少对记忆的依赖,降低回忆偏倚;回顾中辅以图像也可改善回忆:新西兰研究显示,图像辅助24小时回顾的能量低估为8%,传统回顾为15%,差异主要来自零食、调味品与饮料等易被遗忘项目的捕获。图像法可改善个体食物的分类,但混合菜肴仍是挑战;图像辅助法结合受访者输入表现更优,但注释的准确性与详细程度差异也会引入分类误差。精度还依赖图像质量与下游处理(食物识别与份量估算算法),嵌入式教程、自动质量检查与实时反馈可改善主动采集的数据质量,但不完整的图像捕获会导致数据缺失。被动采集通过减少对参与者依从性的依赖,可更完整地捕获整个进食事件,固定于食物制备区的摄像头还可记录配料、用量、烹饪时长与用水量,减少食谱营养素构成的估算误差与受访者负担,但连续成像会产生海量数据,提升分析复杂度。图像法可降低访员成本,部分场景减轻受访者负担(尤其被动采集),但可穿戴设备需在研究期间借予参与者,成本与物流限制可扩展性;主动采集使用自有设备更可行,但需要培训、依从性与设备接入,电池续航、存储与离线功能在资源匮乏地区可能构成制约。图像法虽降低访员薪资与培训成本,但不一定降低总调查支出:劣质图像会增加数据清理需求,图像识别系统需要大量的前期模型开发、训练与验证投入,LMICs往往需从零构建训练数据集,推高初始成本与技术门槛,目前尚无研究系统比较图像法与传统方法的全生命周期成本。
人工智能(AI)在膳食评估中的应用贯穿全流程。在调查开发环节,AI可支持生成与组织核心输入(食物清单、食物图谱、食物成分数据与食谱数据库),纳入更多样化的本地化食物,提升工具的完整性与代表性,但效果依赖底层数据的覆盖范围,若特定人群或食物环境未被充分代表,局限性依然存在。AI技术还可改善食物分类与标准化:网络爬虫结合自然语言处理可从线上来源汇编食物名称与食谱信息,知识图谱与语义搜索可增强搜索词关联(如“soda”与“软饮料”),机器学习模型可自动化食物组分配,例如半自动化系统在FoodEx2框架下实现了89%的食物分类准确率,支持更一致、可扩展的分类与本地化适配。卷积神经网络可用于整理食物图谱的图像库,预加载本地食物图像可帮助受访者更准确识别与报告食物,减少分类误差。AI工具通过减少食物清单、成分数据与食谱数据库的编译与分类时间,提升调查开发的效率与可扩展性,但依赖大规模高质量数据集与模型开发维护的技术能力;在本地特色食物代表性不足的场景中,需额外采集数据与训练模型。将AI生成的食物清单与图谱整合入调查平台,还可通过更直观的搜索与导航改善可用性,减轻受访者负担与录入时间。
在数据采集环节,AI可整合入电脑与APP端方法,通过自动化访谈、多模态输入(文本、语音)与情境感知采集支持数据收集。AI访员、AI增强型交互式语音应答(interactive voice response, IVR)系统与聊天机器人正逐步替代电话、APP与网络调查中的访员。多模态输入可降低识字与语言壁垒,减少选择偏倚,但模式选择本身可引入新偏倚:文本输入在公共场合更易接受,但排除低识字受访者;语音输入可能引发隐私顾虑。LMICs的证据显示接入壁垒显著:6个LMICs的IVR调查在3-4次接触尝试后的应答率仅为3%-10%,而面访在1-2次尝试后可达69%-89%;乌干达女性中,25%的参与者因网络连接差等技术问题在IVR膳食调查中失访。深度学习与自然语言处理可改善语音识别、转录与翻译,标准化问题呈现,减少访员偏倚;无访员也可降低社交期望偏倚,但隐私、信任与数据安全顾虑会影响报告行为。AI应用还可通过情境感知采集减少回忆偏倚与食物分类误差,例如位置、Wi-Fi信号或数字收据等被动数据源可补充自报摄入,提升准确性:美国年轻人的试点研究显示,整合位置、体力活动与环境声音的情境传感器数据,使回顾与生态瞬时评估的食物报告一致性提升了5.6%;乌干达的IVR 24小时回顾在人群层面饮食质量指标上与访员 administered 回顾有中度一致性,但受访者倾向于少报食物数量,提示更高的遗漏误差。增强现实(augmented reality, AR)工具通过叠加3维食物模型辅助受访者视觉匹配消费份量,可减少抽象尺寸描述或单纯依赖记忆的局限,3维食物模型库可通过摄影测量高效生成,减少人工编译转换因子的需求,但目前证据多聚焦前瞻性采集,与传统方法的验证有限,且部分研究依赖配备深度传感器的智能手机与受控条件,回顾性采集的优势尚不明确。AI采集工具可减少对训练有素访员的依赖,提升可扩展性,但可行性因方法而异:IVR系统因成本与技术门槛更低,在资源匮乏地区更具可行性,但膳食评估中的可行性、可接受性与成本效益证据仍有限;高级方法(如情境感知系统、AR)需要较高的技术能力、高质量数据整合与部分场景下的专用硬件,限制了大规模或资源匮乏地区的扩展。
在数据 处 理 与 分 析
打赏