在建筑行业中,资源成本(包括材料、劳动力和设备)占总项目支出的最大份额。其中,材料价格的波动是成本超支的主要原因[1]。鉴于建筑项目的长期周期和资源密集型特点,这种波动会显著影响正在进行的工作的盈利能力以及投标时采用的定价策略。建筑成本指数(CCI)是整体成本趋势的关键指标,承包商在准备投标时会定期参考该指数,以考虑预期的成本上涨[2]。因此,准确预测CCI趋势对于改善成本控制、增强投标竞争力和支持长期财务规划至关重要。
在台湾,由于自然资源有限,大多数关键建筑材料需要进口,CCI对国际市场动态特别敏感。全球经济周期、地缘政治紧张局势和汇率波动进一步增加了成本预测的复杂性[3]。尽管对及时成本信息的需求日益增长,但台湾建筑行业仍面临数据相关挑战。政府发布的定价信息仅每月发布一次且存在显著延迟,而相关市场信息则通过财经新闻、行业报告和政策公告传播。手动整合这些碎片化的文本信息既耗时又容易忽略影响材料价格趋势的关键信号。
随着数字通信渠道的扩展,市场相关信息现在来自在线新闻平台、社交媒体和其他实时信息流。虽然这些非结构化数据来源丰富且即时,但将其纳入预测工作流程颇具挑战性。在这种情况下,人工智能(AI)技术(如自动新闻提取、自然语言处理(NLP)和情感分析)为整合此类信息并改进中长期价格预测提供了机会。大型语言模型(LLMs)的最新进展进一步增强了在非结构化文本中识别模式和支持数据驱动的市场动态解释的能力。
然而,现有的CCI预测方法主要集中在结构化的数值指标上,而嵌入在建筑相关新闻和政策报告中的行业特定市场信号在预测工作流程中尚未得到充分利用。在台湾背景下,许多信息是以中文发布的,这需要能够准确解释当地术语和行业特定表达的语言模型。因此,当前的预测实践缺乏系统地将文本信息与经济指标结合的机制,从而限制了行业领域知识在CCI预测模型中的整合。这些局限性凸显了需要一种能够整合异构数据源并提高预测可靠性的综合预测方法。
为了解决这些挑战,本研究开发了一个专为台湾建筑市场设计的综合预测和咨询平台。该系统结合了深度学习(DL)、LLMs和检索增强生成(RAG),将宏观经济指标与从建筑相关新闻中提取的情感信息相结合,从而提高了CCI预测的性能。尽管以台湾为实证背景,但该方法论框架可广泛应用于其他数据稀缺或依赖进口的市场,通过替换本地经济指标、特定语言的情感模型和区域新闻来源,可以增强该方法的应用性。
本研究的贡献如下:
(1)一个针对中文建筑相关新闻的领域适应性情感分类模型,使用量化低秩适应(QLoRA)进行微调。
(2)一个多模态预测框架,将LLM派生的情感信息与数值经济指标相结合,以提高CCI预测的准确性。
(3)应用Pilgrimage Walk Optimization(PWO)算法对预测模型和语言模型的超参数进行优化。
(4)一个综合咨询平台,利用基于RAG的摘要和查询功能支持市场解读,以提高用户交互性和可解释性。
本文的其余部分组织如下。第2节回顾了人工智能在金融和建筑成本预测中的应用相关理论和先前研究,以及深度学习(DL)、LLMs和元启发式优化的最新进展。第3节介绍了研究方法论,包括数据预处理、使用量化低秩适应(QLoRA)进行情感模型微调、使用Pilgrimage Walk Optimization(PWO)算法进行超参数优化,以及时间序列预测模型的设计。第4节报告了情感分类和CCI预测模块的开发和评估。第5节介绍了综合咨询平台,第6节总结了主要发现、局限性及未来研究的方向。