引言:脂质组学和代谢组学已成为理解与诊断人类疾病的关键技术,涵盖2型糖尿病、阿尔茨海默病、癌症及肾功能障碍等领域。本研究通过对2004年至2024年的科研成果进行文献计量与文本挖掘分析,结合Scopus数据并采用多数据库交叉验证,系统梳理了该学科的发展演变。方法:共纳入9628篇文献,利用Bibliometrix、Scimago Graphica、OpenRefine及定制化R脚本进行数据整合分析,识别高产期刊、作者、国家及机构,并绘制主题结构与关键词动态图谱。除传统文献计量指标外,本研究融合定量趋势分析与语义概念映射,追踪该领域的方法学与转化演进。为确保结果的稳健性与普适性,同时在Web of Science核心合集(WoSCC)和PubMed中执行等效检索,并通过跨数据库验证评估期刊与国家排名、时间及主题趋势的一致性。结果:该领域呈现快速扩张态势,年增长率达32.6%。美国与中国引领全球产出,欧洲主要国家紧随其后。核心研究主题包括阿尔茨海默病、肥胖及乳腺癌,新兴领域则聚焦于人工智能、多组学整合及孟德尔随机化(Mendelian randomization)。液相色谱-质谱(LC-MS)、气相色谱-质谱(GC-MS)及核磁共振(NMR)等分析技术,连同代谢性疾病,仍是该领域的核心支柱。相比之下,微生物组-COVID-19互作及氧化应激-癌症关联等小众主题代表了新兴的交叉学科桥梁。讨论:总体而言,脂质组学与代谢组学正朝着整合性与计算性框架演进,具备强大的诊断潜力,这凸显了实现临床转化所需的经验证生物标志物、标准化数据流程及开放存储库的必要性。
为评估基于Scopus数据集结果的稳健性和全面性,在Web of Science核心合集(WoSCC)和PubMed中进行了额外检索。基于相同关键词、布尔运算符和时间范围(2004-2024)的等效检索策略被调整为适应每个数据库的语法。所有来源均一致应用纳入和排除标准以确保可比性。对于每个补充数据库,应用了相同的通用分析框架,包括元数据完整性验证。关键词协调未进行,因为预计不同数据库之间的索引术语存在差异。分析侧重于总记录数、年度发表趋势以及基于出版物和通讯作者信息的国家层面生产力。跨数据库比较强调概念一致性而非精确的数值吻合。使用年度出版物数量的线性回归分析评估时间趋势的一致性。
根据布拉德福定律,最富产和最有影响力的核心期刊区包括28种来源(占1.48%),共发表了3205篇文献(占33.29%)。高产期刊包括《Scientific Reports》(441篇)、《Metabolites》(329篇)和《Metabolomics》(283篇)。在引用影响力方面,领先的来源是《Journal of Proteome Research》、《PLoS ONE》和《Scientific Reports》。在声望方面,基于CiteScore(CS)、SCImago期刊排名(SJR)和每篇论文源标准化影响(SNIP),顶级期刊是《eBiomedicine》、《Journal of Lipid Research》和《Journal of Clinical Endocrinology and Metabolism》。
3.3 贡献者
3.3.1 作者
徐国旺(中国科学院大连化学物理研究所)是最高产的作者,在发文量、h指数、g指数和m指数方面均处于领先地位。Clary B. Clish虽然发文量排名第九,但在总被引频次方面位居首位。对这十位作者的深入分析显示,他们的研究关键词频繁提及阿尔茨海默病和心血管疾病,突显了其贡献的临床相关性和主题焦点。
在WoSCC和PubMed中进行的等效检索分别产生了7333篇和5096篇出版物。尽管绝对数量因数据库覆盖范围而异,但三个数据库的年度出版物时间趋势高度一致,决定系数(R2)分别为0.992(Scopus vs WoSCC)和0.995(Scopus vs PubMed)。高产期刊、国家排名及趋势主题在不同数据库中均保持一致。