ACTesting：一种自动的文本到图像软件跨模态测试方法

时间：2025年11月8日

来源：ACM Transactions on Software Engineering and Methodology

编辑推荐：

针对文本到图像（T2I）软件生成复杂或非现实场景时的焦点实体遗漏、图像逼真度低及文本图像信息不一致等问题，提出ACTesting自动化跨模态测试方法。该方法基于元测试原理，利用实体关系三元组定义跨模态语义一致性元等式，设计适应密度约束的突变算子生成测试用例，验证T2I软件输出。实验表明，该方法能有效识别错误，相比基线降低文本图像一致性至20%，并通过消融研究验证了突变算子的有效性。

摘要

近年来，创新的生成式人工智能软件已成为重要的辅助工具，使用户能够快速生成内容并获取灵感。文本到图像（Text-to-Image, T2I）软件是最广泛使用的此类软件之一，它通过跨模态过程将文本输入转换为图像。然而，尽管T2I引擎取得了显著进展，但在生成复杂或非真实的场景时，T2I软件仍会出现错误，例如遗漏关键元素、图像真实感较低以及文本与图像信息不匹配等问题。T2I软件的跨模态特性使得传统测试方法难以检测错误，而缺乏测试“预言机”（即用于验证结果的工具）进一步增加了测试的复杂性。为了解决这一难题，我们提出了ACTesting——一种针对文本到图像软件的自动化跨模态测试方法，这是首个专为T2I软件设计的测试方法。ACTesting利用变形测试（Metamorphic Testing）原理来解决“预言机”问题，并通过实体关系（Entity-relationship, ER）三元组来识别跨模态语义一致性作为其核心的变形关系（Metamorphic Relation, MR）。在MR的指导下，我们设计了三种变异操作符，并结合适应性密度约束来生成新的输入文本。基于生成的图像，ACTesting通过检测两种模态之间的ER三元组来验证MR是否得到满足，从而发现T2I软件的错误。在针对五种流行T2I软件的实验中，ACTesting有效生成了能够揭示错误的测试用例，与基线相比，文本与图像的一致性降低了多达20%。此外，消融研究进一步证明了所提出的变异操作符的有效性。实验结果验证了ACTesting能够可靠地识别T2I软件中的错误。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部