为了解答这些问题,并勾勒出该流域科学研究的知识版图,一个研究团队开展了一项开创性的文献“测绘”工作。他们不再依赖传统、费时费力的人工文献综述,而是转向了大数据时代的利器——自动化内容分析(Automated Content Analysis, ACA)。这项研究如同一位高效的“科学侦探”,系统地检索、梳理并深入分析了数十年来关于托坎廷斯-阿拉瓜亚流域的数千篇科学文献,旨在揭示隐藏在海量文本背后的研究主题、趋势与空白。这项研究最终发表在期刊《Limnology》上,题为“Mapping scientific production in the Tocantins–Araguaia Basin in Brazil Central: application of automated content analysis in freshwater studies”。
研究者们运用了几个关键的技术方法来达成目标。首先,他们从Web of Science和Scopus两大核心数据库中系统检索了截至2024年关于托坎廷斯-阿拉瓜亚流域及相关淡水环境的学术论文,经过去重和筛选,最终构建了包含1522篇有效文献的语料库。核心分析采用了结构化主题模型(Structural Topic Modeling, STM),这是一种先进的文本挖掘技术,能够从大量文献摘要中自动识别出潜在的研究主题,并分析主题之间的关系及时空变化趋势。此外,研究还运用了词频分析、对应分析(Correspondence Analysis, CA)来对比托坎廷斯-阿拉瓜亚流域与巴西其他主要流域(如亚马逊、巴拉那、圣弗朗西斯科、巴拉圭)的研究主题差异,并通过构建主题相关网络和线性回归分析,探究了不同主题之间的关联强度及其随时间演变的规律。