基于深度学习方法的城镇建筑立面美学质量评估

时间：2026年5月27日

来源：Results in Engineering

编辑推荐：

城镇立面的美学吸引力对整体城市环境质量及居民满意度具有显著影响。然而，对美的多样化且难以量化的解读持续给建筑设计人员带来挑战。本研究旨在建立一个预测性智能模型，用于定量评估城镇建筑立面的美学质量。为此，研究人员提供了一个数据集，其中包含通过对 388 名活跃建

城镇立面的美学吸引力对整体城市环境质量及居民满意度具有显著影响。然而，对美的多样化且难以量化的解读持续给建筑设计人员带来挑战。本研究旨在建立一个预测性智能模型，用于定量评估城镇建筑立面的美学质量。为此，研究人员提供了一个数据集，其中包含通过对 388 名活跃建筑师和城市规划师进行结构化调查所获得的 77,600 次专业评估。为增强泛化能力，研究人员选取了来自不同城市、代表不同气候和文化背景的 1,300 张立面图像，并由专家进行了评估。通过开放式问卷、定性分析技术以及 MAXQDA 软件的使用，推导出了专家所识别的立面美学质量最关键的影响因素。随后，利用著名的深度学习算法，如 EfficientNet、VGG16、ResNet、YOLOv8 和 MobileNet，在 70% 的数据集上进行训练，在 20% 的数据上进行评估，并在剩余 10% 的数据上进行测试。结果表明，YOLOv8 模型表现出更优的性能，在预测专家对建筑立面美学质量的评估方面准确率达到 81.9%。本研究推进了城镇建筑立面美学特征的定量评估，并为在实施前分析立面美学提供了一种适宜的方法。

**基于深度学习的城镇建筑立面美学质量评估研究解读**

**研究背景与意义**
在建筑学与城市规划领域，城镇立面的美观度是一个关键议题，它深刻影响着城市的身份认同、视觉质量及经济地位。营造具有吸引力的城市空间与更高的环境满意度、社会关系质量、身体活动水平以及城市居民的心理健康状况密切相关。然而，由于人类对城市空间的感知涉及多重感官与体验，如何创造美的空间一直是设计师、建筑师和规划者面临的挑战。尽管以往研究尝试利用对称、对比等指标来应对这一问题，但关于城镇建筑立面美学的非量化感知与定义仍然令从业者感到困惑。现有的美学评估研究多集中于开放空间或景观，且往往依赖受控数据、正面视角或三维数据，缺乏对真实城市环境中多变视角、材料及光照条件的关注，更鲜有将专家的人类感知判断系统性地整合到模型构建中。鉴于卷积神经网络（CNN）在图像处理领域的突破性进展及其在提取几何与语义成分方面的能力，利用数据驱动方法结合专家感知来量化评估建筑立面美学显得尤为重要。本研究发表于《Results in Engineering》，旨在填补这一空白，通过结合真实世界的二维立面图像与建筑专家的形式及感知评估，开发深度学习模型以预测城镇立面的美学价值，为建筑设计前期的美学分析提供量化工具。

**研究方法与技术路径**
研究人员开展了一项综合性的实证研究。首先，在样本队列来源方面，研究团队从伊朗多个具有不同地理、气候及文化特征的城市（包括德黑兰、伊斯法罕、大不里士等）收集了原始图像，经过去除模糊、光照不均及非正面视角等严格筛选后，保留了 1,300 张涵盖多种类型的城镇建筑立面图像。其次，研究组织了 388 名具有学术背景的建筑学专家对这些图像进行“美”与“丑”的二元评估，共获得 77,600 次有效评分，并通过开放式问卷收集专家评分背后的定性依据，利用 MAXQDA 软件进行编码分析以提取关键美学影响因子。最后，在技术方法上，研究人员构建了包含 YOLOv8、VGG16、MobileNet、ResNet152 和 EfficientNet 在内的五种卷积神经网络模型。研究将数据集按 7:2:1 的比例划分为训练集、验证集和测试集，利用 NVIDIA Tesla T4 图形处理器进行模型训练。针对 YOLOv8 模型，研究人员采用了基于遗传算法的自动化参数优化策略，调整了学习率、批量大小等超参数，以适应立面美学分类任务。所有模型均通过准确率、精确率、召回率及 F1 分数等指标进行性能评估。

**研究结果**
**定性影响因素分析**
通过对专家开放式回答的定性分析，研究人员识别出影响立面美学的五大核心选择代码：意义与概念（占比 17.1%）、形式与体量构成（28.7%）、立面元素（43.3%）、与环境的和谐度（9.9%）以及施工质量（0.1%）。其中，“立面元素”被确认为最关键的因素，具体包括材料的颜色与组合、窗户的比例与形状、装饰细节以及虚实空间的对比等。这表明专家在评估时高度关注具体的视觉元素及其组合逻辑。

**深度学习模型性能比较**
在五种深度学习模型的对比测试中，YOLOv8 模型在测试集上展现了卓越的性能，其预测专家评估结果的准确率达到 81.69%（文中摘要提及 81.9%，正文表格数据为 81.69%），显著优于 VGG16（79.23%）、MobileNetv3（78.62%）、EfficientNet（67.54%）和 ResNet152（67.38%）。研究指出，YOLOv8 的成功归因于其强大的多尺度特征提取能力，能够同时捕捉立面的局部细节（如装饰、开口）和全局构图属性（如比例、韵律），这与人类专家的美学感知机制更为契合。相比之下，VGG16 虽然在训练集表现优异，但在测试集上的泛化能力略逊一筹，而 ResNet152 和 EfficientNet 在此特定任务中表现欠佳。

**模型注意力机制与误差分析**
通过对模型注意力图谱的分析发现，模型在判断“美”的立面时，主要关注色彩对比、体量表达和韵律感强的窗户排列；而在误判案例中，模型往往过度依赖明显的视觉特征（如大面积平坦表面或缺乏细节），而忽略了专家所看重的形式纯粹性、极简比例或文化语境等深层语义。这表明虽然深度学习模型能有效识别主导性的美学模式，但在理解涉及记忆、体验和文化背景等语义维度时仍存在局限。

**结论与讨论**
本研究证实，将建筑专家的主观判断与深度学习模型相结合，是实现城镇建筑立面美学定量评估的有效途径。研究得出的核心结论是：经过优化的 YOLOv8 模型能够以较高的准确度模拟专家对立面美学的感知，可作为建筑师在设计初期优化方案、城市规划者评估项目以及决策制定过程中的有力辅助工具。该研究不仅量化了影响立面美学的关键视觉因子，还提供了一种可推广的技术框架。然而，研究人员也指出，未来的工作应进一步纳入更多客观可量化的物理特征（如具体材料类型、色彩数值、设计节奏参数等），并扩展至更大规模、跨文化的数据库，以提升模型的普适性和实用性，从而推动更具人性化且美观的城市空间设计。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部