基于生成式人工智能(GenAI)的构思过程:ChatGPT对新手设计师创意自信与设计过程的影响实证研究

时间:2026年5月30日
来源:Design Science

编辑推荐:

教育领域,包括设计教育,正处于生成式人工智能(Generative AI, GenAI)兴起的十字路口。尽管其使用呈指数级增长,但人们担忧其不加反思的使用可能会削弱关键技能的发展。在创造力特定的情境下,其增强或限制认知过程及创意自信的潜力仍有待深入探索。本研究

广告
   X   

教育领域,包括设计教育,正处于生成式人工智能(Generative AI, GenAI)兴起的十字路口。尽管其使用呈指数级增长,但人们担忧其不加反思的使用可能会削弱关键技能的发展。在创造力特定的情境下,其增强或限制认知过程及创意自信的潜力仍有待深入探索。本研究调查了ChatGPT对用户体验设计(User Experience Design, UXD)专业学生(N=35)构思过程的影响,重点关注其认知过程、创意自信和想法创意。在一项组内实验中,参与者在有无ChatGPT支持的条件下总共产生了214个设计概念。收集的数据包括实验前关于ChatGPT使用情况的自我报告、创意自信量表测量、创作成果(草图、拼贴、思维导图)、专家对创意的评估,以及实验后关于创意自信、想法和构思过程的自我报告和访谈。研究结果表明,虽然ChatGPT提升了便利性和速度,但与之相关的是认知参与度的降低,这可能导致对该工具依赖性的增加和创意自信的潜在下降,可能触发一个依赖循环和自我效能感的降低,需要进一步的纵向研究。研究人员最终以对设计教育的建议结束本文,建议整合元认知训练并鼓励对AI使用进行批判性评估,从而将新手设计师培养为积极的、反思性的创意思考者。
**AI辅助构思的隐性成本:ChatGPT对新手设计师创意自信与设计过程的影响研究**

设计领域与众多其他领域一样,在生成式人工智能(Generative AI, GenAI)到来之际正面临一个关键的十字路口。这些模型能够从学习到的数据分布中生成新的输出(如文本、图像)。随着其技术的快速发展,GenAI已被广泛探索作为设计师的工具,用于支持问题探索、灵感激发或构思等。研究也凸显了GenAI克服人类认知局限性的潜力,有助于在不断扩展的解决方案领域中创造新颖的想法。然而,在许多人为AI赋能的设计潜力欢呼时,关于在设计过程中不加反思地使用GenAI的担忧也随之而来。一般教育领域的研究表明,尽管ChatGPT能支持诸如起草作业等教育任务,但过度依赖可能会削弱批判性思维、创造性问题解决和关键技能的发展。事实上,许多倡导者认为,教育机构应对学术界使用AI采取更审慎的立场,因为其无差别的使用会损害独立和批判性的问题解决能力。这种担忧在创意设计教育中尤为重要,因为它涉及设计师的形成期,在此期间不仅技术能力,还有创造性思维习惯和创造性自我认知都在形成之中。

本研究将聚焦于ChatGPT,因其在普及生成式人工智能方面发挥了关键作用,在发布后5天内获得100万用户,2个月内月活跃用户达到1亿。凭借其基于网络的交付方式、最低的设置要求和可访问的免费层,ChatGPT比大多数专业设计工具更容易被学生获得。然而,这种可获得性并非无条件的:高级功能需要付费墙,使用可能受到速率限制,且免费层需遵守需要用户监督的数据共享和保留政策。此外,尽管并非专门为创造力而设计,但它现在被广泛用于内容创作和构思等创意活动中。因此,理解其对学生设计创造力的影响对设计教育具有特殊意义。

在设计过程中,构思长期以来一直被认为是一个核心且认知要求高的阶段,设计师在此阶段通过生成和提炼想法来探索问题,然后选择几个方向进一步发展。构思涉及发散思维和聚合思维的迭代循环,这对于创造创意想法至关重要。尽管最近关于ChatGPT在教育中使用的研究提到了“头脑风暴”或想法生成作为学生使用该工具的活动,但迄今为止,很少有研究探讨其在增强或限制创造性认知过程方面的潜力,特别是在设计背景下。这一空白尤为紧迫,因为GenAI可能改变新手参与创意探索基本方面的方式,如问题框架、想法扩展和概念冒险。对于设计学生来说,这些形成期尤为重要,因为他们正在掌握基本的设计技能,同时也在塑造他们的创意身份。因此,创造性工作的一个补充维度涉及塑造人们参与创意活动意愿的自我信念。更广泛的创造性自我信念文献强调了诸如创意自我效能、创意认同和创意元认知等构念,所有这些都影响个体是否选择参与创造性任务。在这一构念家族中,创意自信指的是一个人跨领域能够进行创造性思考或行动的自我信念,它基于经验的积累而形成。创意自信是“人们潜在创造力与其实际创造性行为之间联系的重要干预因素”。对于设计师而言,这意味着参与构思不仅需要认知技能,还相信自己能够产生有价值的想法、驾驭不确定性并承担创造性风险。然而,如果新手设计师越来越多地将某些创造性任务委托给GenAI工具,他们可能会绕过对创造性认知和创意自信发展都至关重要的学习经验,这种可能性尚未得到实证检验。

鉴于此,本研究旨在解决以下研究问题:在构思中使用ChatGPT如何影响设计师的创意自信、创造性认知过程、体验和创意成果?考虑到本研究探讨的是新兴模式而非检验预定关系,因此未制定先验假设。第2节介绍了详细说明这些构念的概念框架。第3节概述了研究的目的和意义,第4节描述了研究方法。研究人员的实证证据来自一个课程嵌入式样本,即来自用户体验设计课程的N=35名学生,这在第5节中呈现,并随后在第6节中结合其背景和方法论局限性进行讨论。研究人员在第7节以对设计创造力、教育和设计实践的贡献作为结论。

本研究采用了混合方法、组内重复测量设计,所有参与者均暴露于两种条件下。研究人员比较了有和无ChatGPT支持的构思,重点关注学生的创意自信、创造性认知过程和体验,以及由此产生的成果的创意性。研究嵌入在一个二年级设计工作室课程中,该课程属于用户体验设计(UXD)学士项目,学生们被要求为六个复杂程度相当的设计简报之一设计互动共享空间。例如,六个简报之一是“设计一个政府、开发商和公民可以协作的会议场所,通过分享信息和鼓励公民参与来促进参与。”由于样本是基于课程的,本研究有足够的能力检测到中等效应,其在用户体验设计工作室背景之外的普遍性是有限的。然而,设计简报有意设计为领域无关和开放式,以便能够在不同设计领域内研究创意机制。

实验时间安排与学生项目的初始构思阶段同步。在整个课程中,共有96名注册学生,分为16个项目小组,每组约六名学生。研究人员通过简单地更新课程概念模板并添加在线前测和后测问卷,利用了这种设置。参与者在启动会议中被招募,随后在缺席者的后续工作室课程中进行补充招募。在96名学生中,63人提供了知情同意参与研究。要被纳入最终样本,参与者必须完成所有要求的实验材料:(1)实验前在线问卷,(2)每个实验条件下的构思后反思在线问卷,以及(3)所有要求的构思材料(概念模板,以及ChatGPT条件下的对话记录)。35名学生满足这些条件,构成了最终样本(N=35)。损耗率(44.5%)可能是因为参与研究部分(问卷和记录)在强制性课程活动中完全是自愿的。所有学生都作为课程的一部分加入了构思任务,但只有那些选择提交研究材料的学生才被纳入研究数据集。研究人员无法获得额外的基线测量数据,因此无法直接比较完成者与未完成者,研究人员承认这是一个局限性。

参与者为20-29岁的年轻人,其中76.5%在20至24岁之间(一名错误输入“2024”作为出生年的学生被排除在年龄分析之外,但仍保留在其余分析中)。样本中女性占77.1%(N=27),男性占22.9%(N=8)。地区分布为77.1%来自欧洲,8.6%来自亚洲,5.7%来自中东,2.9%分别来自非洲、北美和南/中美洲。

研究人员采用了组内设计,每位参与者在两种条件下完成构思:(1)无GenAI条件:学生在没有任何生成式AI工具的情况下生成三个设计概念;(2)ChatGPT条件:学生在ChatGPT的支持下生成另外三个概念。因此,每个学生总共产生六个概念,与课程要求一致,同时能够在条件之间进行受控比较。研究使用了ChatGPT 3.5,即数据收集时可用的免费网络模型,代表了最强大的免费层。学生有两周时间独立完成作为家庭作业的构思;因此,无法进行行为观察。除了在第二个实验条件下使用ChatGPT支持其创意过程外,对构思技术没有施加任何限制。

研究人员采用了固定顺序(先无AI支持,然后使用ChatGPT),以避免用AI衍生的提示和示例污染非AI基线。这种设计可能会产生顺序效应:学习(任务熟悉度)、疲劳、污染(第一阶段的经验影响第二阶段)和预期/需求效应(推断研究目标并相应调整反应)。考虑到构思自然涉及想法的协同进化和交叉授粉,某种程度的污染是设计实践的特征,而非研究方案的产物。尽管如此,研究人员出于实际考虑降低了风险,通过将ChatGPT放在第二阶段来保护非AI阶段免受特定AI灵感的影响,并插入了一个反思检查点,但残留的顺序效应不能被排除。图3说明了参与者遵循的顺序步骤。参与者完成条件1(无GenAI构思),随后完成反思问卷,然后完成条件2(ChatGPT辅助构思),随后完成第二个反思问卷,最后提交所有概念模板。

除了每个部分产生的构思想法外,研究人员还收集了关于学生在每种条件下体验的自我报告李克特量表评分,以及补充性定性数据,以解释和情境化定量发现。首先,ChatGPT条件的反思问卷包含开放式问题,参与者在其中描述ChatGPT如何支持或损害了他们的创意过程。其次,其中一部分参与者(N=5)在构思任务结束后一周内参加了半结构化后续访谈。这些访谈更深入地探究了学生在每种条件下如何处理构思、如何将ChatGPT整合到他们的过程中,以及他们如何感知其对他们创意自信和想法的影响。每个实验阶段的数据产物概述见图4,详情见第4.3节。

构思任务和概念模板方面,六个课程简报,每个简报解决一个不同的“共享空间”设计挑战,但范围和复杂性相当,构成了构思任务的基础。每个项目小组负责一个简报;然而,为研究进行的构思是个人完成的。在为期两周的时间内(对应于课程的早期构思阶段,图3),每个学生被要求为他们小组的简报开发六个不同的设计概念。在两种条件下,学生都记录了他们过程的发散材料(例如,草图、笔记)以及使用结构化Word模板(补充材料附录A)的六个设计概念中的每一个。对于每个概念,他们:(1)用自己的话描述设计挑战,(2)提供书面概念描述,(3)附上代表该想法的草图或图像。在ChatGPT条件下,学生额外解释了ChatGPT如何影响了该概念,并提交了相应ChatGPT对话记录的匿名链接以供定性分析。概念模板结构通过与三名一年级UXD学生的试点测试进行了改进,以确保清晰性和可行性。来自试点的反馈用于在二年级群体部署模板之前解决歧义并调整说明。

问卷方面,研究人员使用了在线问卷来捕捉基线特征、创意自信信念、感知到的创造性认知过程和体验,以及对成果创意的感知。所有李克特量表项目均在5点顺序同意量表(1=强烈不同意,5=强烈同意)上评分。
i. 实验前问卷:在构思任务之前,参与者完成了一份在线问卷,涵盖人口统计学(如年龄、性别、地区)、先前的ChatGPT使用经验(近期使用、使用频率、自评熟练度)和基线创意自信。基线创意自信通过一个任务特定的创意自我效能陈述进行测量,该陈述改编自Karwowski等人:“我有信心能够想出一个创造性的方式(即新颖且有用)来解决我的设计挑战。”该项目用于在实验前设定参与者的创意自信基准,并与条件后的评分进行比较。
ii. 构思后反思问卷:在每个构思条件之后,参与者完成一份反思问卷。两份问卷主要由在5点同意量表(1=强烈不同意,5=强烈同意)上评分的李克特式陈述组成,并在ChatGPT条件下辅以开放式问题。这些陈述被设计为理论上依据充分的指标,映射到研究人员的因变量(见图1):创意自信、创造性认知过程和体验、成果)。与其为每个构念提供完整的心理测量量表,研究人员选择每个维度少量集中的项目,以在课堂环境中保持可接受的负担,同时仍能实现参与者内部在不同条件下的比较。这一选择用一些心理测量精度换取了可行性,研究人员通过三角化模式与定性报告部分抵消了这一点。
为了评估学生的创造性认知机制,研究人员关注创造力研究中强调的构念,作为评估ChatGPT是否改变学生在构思中思考方式的手段,使用了从每个构念定义改编的陈述:(1)流畅性:“我产生了很多想法。”(2)灵活性:“我探索了非传统的设计灵感”;以及“我从多个角度处理问题和想法。”(3)问题表征/阐述:“我对问题的知识在整个过程中增加了。”一个局限性是,每个子维度仅由一两个项目代表;因此,它们应被解释为对感知过程的实用性指标,而不是对例如发散思维能力的完整诊断量表。
研究人员还使用李克特量表来评估学生的动机和情感状态,这些状态通常被理论化为对创造力重要,但在成果创意中不太可见:(1)参与度:“我在创造概念的过程中感到投入。”(2)创造性刺激:“构思过程激发了创造性思维。”(3)心流:“我在概念构思过程中感到进入了心流状态。”(4)精力:“我整个过程的精力水平都很高。”这些项目使研究人员能够研究ChatGPT是否改变了创意体验的质量,即使成果的创意性没有变化。同时,它们是自我报告的、即时性的判断,无法完全捕捉参与度或心流在会议过程中的动态波动;研究人员通过将它们与定性描述和ChatGPT记录进行三角化来解决这一局限性。
为了捕捉学生自己对产生成果的评估,研究人员使用了(1)有用性:“构思过程产生了有用的概念”;以及(2)新颖性:“构思过程产生了新颖的概念。”一个关键局限性是,这些是自我评估,可能过于乐观或有偏见;研究人员明确地用独立的专家评分(第4.3.3节)来补充它们。
最后,研究人员用与实验前测量的相同项目评估了创意自信:“我有信心我想出了创造性的想法来解决我的设计挑战”。研究人员还有第二个陈述,仅在构思过程后相关:“我对我的设计选择感到自信。”这些陈述捕捉了学生在每种条件下对其决策和想法创意性的自信程度。这些项目在课堂内研究设计中作为感知到的创意自我效能的实用性、任务情境指标。它们应被解释为对即时自信信念的集中代理,而不是对创意自信完整构念的全面评估;本研究并未声称测量需要长时间发展的多项目量表的创意自我概念或创意认同。
第二个反思问卷(在ChatGPT条件后进行)也包括所有提到的李克特量表陈述,从而实现使用与不使用ChatGPT的构思之间的参与者内比较。它还包括特定于感知到的AI工具价值的附加项目:(1)“我会推荐ChatGPT作为构思过程的有用工具”;(2)“你认为使用ChatGPT在多大程度上影响了你的创意过程?”(最后这个陈述的量表为1 - 一点也不 - 到5 - 极其)。

为了评估成果层面的创意,研究人员收集了214个概念(每位参与者在完整样本中六个),分布在六个简报中。两名专家设计师,每人拥有超过5年的专业经验并持有或正在攻读硕士学位,独立评分这些概念,对条件保持盲态。评分程序遵循标准化协议。对于每个简报,专家首先熟悉设计挑战,然后依次评估相应的概念。一个简报与研究人员一起当面审查以进行澄清;其余评估在3周内独立完成。专家被指示关注文本描述而非视觉修饰,因为草图和图像在质量和风格上差异很大。概念根据Dean等人的维度进行评分。考虑到实验仅关注早期构思阶段且参与者时间有限,难以评估某些子维度,研究人员决定排除一些子维度。评估的维度包括原创性(新颖性的一个组成部分)、适用性(是否解决了问题)和有效性(解决问题的潜力),两者都是相关性的组成部分,关于简报约束的可操作性,以及清晰性(与ChatGPT可能对彻底性产生的影响相关)。每个维度在5点量表(1=最低,5=最高)上评分。基于专家反馈和可靠性检查,研究人员从后续分析中移除了可操作性,因为它在概念细节有限的情况下表现出较低的可靠性;其移除提高了整体评估者间信度。由于每位参与者在每个条件下生成三个概念,研究人员分析了想法层面的评分(所有单独的概念)和参与者层面的评分(每个条件下三个概念的平均创意评分)。

半结构化访谈指南旨在探索参与者的构思方法、有无ChatGPT的体验、创意自信感知的变化以及对创意过程的反思。指南扩展了反思问卷中引入的主题,并包括关于参与者如何寻找灵感、迭代想法以及整合AI生成建议的提示。

本研究获得了主要作者所在机构的人类研究伦理委员会(HREC)的批准(批准日期为2024年3月20日),并根据机构对人类参与者研究的指南进行。所有参与者均被告知研究目的、程序、潜在风险、数据处理和他们的权利,并在参与前提供了书面知情同意书。参与是自愿的,可以随时终止而无需处罚;数据撤回的程序已得到沟通和执行。

数据处理遵循批准的数据管理计划。仅用于同意和访谈安排的个人身份信息与研究数据分开存储,并在完成后删除。分析数据集包括人口统计信息、创建的想法(草图和概念描述)、问卷回答和ChatGPT对话记录。为保护隐私,记录通过匿名链接提供,并在导出后以参与者ID标记;参与者被指示如何在导出后取消共享或删除链接。

匿名化数据集保存在受限制访问的机构存储中。它们根据协作机构对学生工作完全匿名化的限制,以半开放访问模型(应合理要求共享)归档在大学仓库中。

研究人员采用了混合方法(图6)来研究ChatGPT在以下方面对构思的影响:创意自信、创造性认知过程和体验、以及成果创意性。

定量分析方面,实验前和实验后反思问卷的李克特量表回答以及专家对学生概念的评分在IBM统计分析软件SPSS中进行分析。该研究采用了组内重复测量设计,每位参与者完成两种条件,因此作为自己的对照,通过考虑个体差异增加了统计功效。Shapiro-Wilk检验(一种适用于小样本的统计检验)确认了非正态分布(Sig < 0.05)。因此,配对结果使用Wilcoxon符号秩检验(双尾)进行分析,这是一种非参数检验,对配对内差异进行排名而不是直接比较均值,因此适用于顺序数据。研究人员应用了多重检验校正来控制相关比较中假阳性的族系错误风险。因为同时进行了多项测试,至少出现一个I类错误的概率增加;Holm-Bonferroni校正通过连续调整显著性阈值来解决这个问题。李克特量表回答被组织到因变量中:(A)创意自信,(B)创造性认知过程和体验,和(C)成果创意性。• 在类别A(创意自信)中,研究人员区分两个子类别,因为它们处理不同的比较。第一个子类别(A1)比较使用ChatGPT时与不使用GenAI时的创意自信(工具效应),第二个子类别(A2)比较基线创意自信与无GenAI条件后的创意自信以及基线创意自信与使用ChatGPT条件后的创意自信(从期望到体验的状态变化;对比共享相同的基线)。• 类别B(创造性认知过程和体验)将设计认知机制(B1)(流畅性、灵活性和问题理解/知识)与创意过程体验(B2)(参与度、创造性刺激、心流、精力)相结合。• 类别C(成果)包含感知有用性、感知新颖性以及来自所创建想法的专家评分(想法层面和参与者层面)。研究人员在每个子类别内(对于A和B类别)以及类别内(对于C类别)使用Holm-Bonferroni校正控制了族系错误率。对于每个Wilcoxon检验,研究人员报告Rosenthal的r作为效应量度量,这是一个独立于样本量的标准化指数,因此适用于小样本量研究。负r表示使用ChatGPT时得分较低。研究人员计算了效应量以量化超越统计显著性的差异幅度。研究人员使用Fisher z变换提供了r的95%置信区间(CIs)。不包括零的置信区间表明效应不太可能仅反映抽样误差。研究人员使用常规基准解释幅度(小≈0.10,中等≈0.30,大≈.50)。当CI不跨越零且pHolm < .05时,结果被认为是稳健的;否则,研究人员认为研究结果是不确定的。最后,研究人员进行了功效分析,以评估给定样本量的研究敏感性。为了将null和显著结果情境化,研究人员在G*Power 3.1软件中进行了敏感性功效分析,以确定研究在80%功效下能够检测到的最小效应。对于最终样本(N=35),该设计有80%的功效来检测大约dz ≈0.49的组内效应(即大约中等大小)。研究人员使用这个阈值来解释:超过此幅度的效应完全在研究的检测范围内,而非显著结果可能反映小于此敏感性的效应。关于成果创意性的专家评分,分析在单个概念(N=107)和每个条件的参与者平均创意评分(N=35)上进行。重要的是,专家评分并非旨在对概念质量进行绝对判断,而仅用于参与者内、条件间比较。更具体地说,它是为了检查同一参与者的概念创意性是否因是否使用ChatGPT而异。它遵循与其他量表项目相同的统计程序。对于仅限于ChatGPT条件的陈述,旨在捕捉参与者对该工具的具体体验,研究人员通过计算每个陈述的频率、中位数(非参数集中趋势度量)和标准差来检查评分分布。

定性分析方面,定性数据包括(1)ChatGPT后反思问卷的开放式回答,(2)访谈记录,和(3)参与者提交的ChatGPT对话记录。前两项在Atlas.ti中使用演绎编码方法进行分析。在第一个编码周期中,研究人员使用了受问卷项目暗示主题启发的编码手册。随着新见解的出现,研究人员用额外的类别和子代码扩展和完善了编码手册。第二个编码周期由第一作者进行了细化类别、子代码和定义。为确保可靠性,第二位编码员(博士研究员,研究团队外部)独立分析了数据子集。评估者间信度(独立评估者在对相同项目进行编码或评分时的一致程度)使用Krippendorff的alpha(c-a-binary)进行测量,这是一种考虑机会一致性并处理多个编码员的系数。超过0.800的值被认为是可接受的。在解决微小分歧后,可靠性从0.714提高到0.812。最终主题在结果部分呈现。为了增加对研究结果的信心,研究人员将主题分析的见解与ChatGPT记录和定量结果进行了比较。

结果部分首先报告了实验前使用ChatGPT的经验。大多数参与者(94.7%)在过去一个月内使用过它,54.3%的人至少每周使用一次。关于用于创意活动的熟练程度,51.4%的人自评为中级(在创意工作流程中有一些使用ChatGPT的经验),34.3%自评为有经验(能熟练运用该工具的能力),14.3%自评为无经验(知道该工具,但很少用于构思),表明大多数参与者对自己在创意背景下使用ChatGPT感到有些自信。参与者还被问及他们在创意过程中如何使用ChatGPT;62.9%的人使用ChatGPT进行想法生成,57.1%用于内容创作(文本、设计或代码),超过40%的人使用它试图克服创意障碍、探索概念或进行研究/综合。较少的人使用它来获得反馈(28.6%)或学习新技能(14.3%)。

定量结果按类别报告:(1)创意自信,在基线对比下分为条件间和基线对比;(2)创造性认知过程和体验;(3)成果创意性,分为自我报告和专家评估。在每个定义的(子)类别内,研究人员报告Wilcoxon符号秩Z。当CI不跨越零且pHolm < .05时,结果被认为是稳健的;否则为不确定。负r表示使用ChatGPT时得分较低。

在创意自信方面,Wilcoxon符号秩检验显示,参与者使用ChatGPT进行构思时,对自己设计选择的自信(中位数=3)显著低于未使用生成式AI时(中位数=4),z=-2.097,p=.036。类似地,与未使用生成式AI相比,参与者对自己能够为设计挑战产生创造性解决方案的信念在使用ChatGPT时(中位数=3)也较低(中位数=4),z=-2.301,p=.021。效应量为中到大;置信区间不包括零,且经Holm校正的p值表明具有统计学意义。如第4.3.2节所述,这些项目作为感知到的创意自我效能的实用、任务情境指标,不应被解释为对完整创意自信构念的全面测量。第二个Wilcoxon符号秩检验,比较参与者的基线自信与每个条件后报告的自信,表明从基线到无GenAI的构思没有显著变化(中位数=4,两种条件相同);z=-.470,p=.638。然而,与基线自信(中位数=4;z=-2.353,p=.019)相比,使用ChatGPT时(中位数=3)自信显著下降,表明创意自信的下降特别与ChatGPT的整合有关。

在创造性认知过程和体验方面,分析参与者构思期间的认知机制时,比较实验条件间李克特量表陈述结果的Wilcoxon符号秩检验显示,在感知流畅性(z=-1.382,p=.167)和灵活性(从多个角度处理问题和想法,z=-.456,p=.648;探索非传统的设计灵感,z=-.356,p=.722)方面没有显著差异。相比之下,使用ChatGPT时,感知到的问题理解改善显著下降(z=-2.182,p=.029)。然而,在Holm校正后,问题理解的负面影响不再显著。相反,与创意过程体验相关的所有项目(他们如何体验构思过程)在使用ChatGPT时始终较低。Wilcoxon符号秩检验显示,使用ChatGPT与参与者在创意过程中的参与度显著下降有关(z=-2.249,p=.025)。参与度项目在两种条件下的中位数均为3。此外,创造性刺激(z=-3.615,p<.001)和心流(z=-3.345,p<.001)在使用ChatGPT(中位数=3)时报告低于不使用时(中位数=4),精力水平在使用ChatGPT时(中位数=2)显著降低(z=-2.974,p=.003),与不使用时(中位数=3)相比。效应量为中到大,CI排除零,所有比较在Holm校正后保持显著,增加了对研究结果的信心。尽管有这些显著结果,当在ChatGPT条件后被问及ChatGPT对构思的有用性时,学生(N=35)评分更积极(中位数=4,SD=1.027),只有8.6%的参与者评分为负面。

在成果创意性方面,Wilcoxon符号秩检验比较了参与者对其创意想法的感知。两种条件之间感知到的新颖性没有显著差异,z=-1.631,p=.103。然而,使用ChatGPT时感知到的有用性(中位数=3)显著低于不使用GenAI时(z=-2.976,p=.003;中位数=4)。对于感知有用性,ChatGPT辅助的概念获得较低的评分;效应量为中到大,CI排除零,比较在Holm校正后仍显著。第二个Wilcoxon符号秩检验检查专家对成果创意性的评估显示条件之间没有显著差异,z=-.281,p=.779。类似地,比较参与者平均创意评分的测试显示两种条件之间没有显著差异,z=-0.418,p=.676。

通过定性主题分析问卷开放式问题(N=35)和访谈(N=5),研究人员能够识别多个主题和类别,从而深入了解ChatGPT如何影响设计师在实验条件下的创意过程、想法选择、迭代和灵感搜索。研究人员在下面详细说明它们。

在创意自信方面,i. 创意所有权感、自我概念和效能感降低:尽管ChatGPT能够快速产生想法,但研究结果表明,它可能通过减少设计师的创意所有权感和自豪感(N=16)来削弱他们的创意自信。该工具详细的建议造成了一种创意约束感,可能使学生(N=8)在过程中更难感到有创造力。一些参与者(N=5)报告对自己技能的信心降低,特别是在写作方面。他们发现自己依赖AI来阐述想法,这导致了对自身能力的怀疑。

在创造性认知过程和体验方面,i. 对ChatGPT的过度依赖和缺乏迭代构思与创造性思维:参与者指出在构思过程中可能过度依赖ChatGPT,这似乎影响了他们迭代的创意过程。当ChatGPT可用时,传统方法如拼贴和草图的使用减少了。ChatGPT基于文本的特性,以及它能够比普通搜索引擎对更复杂的提示给出针对性回答,将灵感搜索转向了可能更具固定性和具体性的刺激。参与者主要提示该工具生成一个完整的概念,大多输入他们自己的“我们如何(HMW)”问题甚至设计简报。然而,参与者报告说获得有效的结果具有挑战性。此外,ChatGPT也通过减少参与者的主动角色来削弱创造性思维,导致更被动的参与(N=17)。参与者报告该工具现成的、完全成形的想法绕过了更深层次分析的关键阶段,从而减少了个人构思甚至动机的机会。这种过度依赖也影响了迭代过程。虽然在两种条件下都存在想法组合、选择和提炼(N=3),但ChatGPT条件的特点是普遍的“复制粘贴”(N=8)行为,参与者直接转移AI生成的想法而几乎没有修改。ChatGPT还通过其文本特性阻碍了模拟构思方法如草图和思维导图的使用,这些传统技术已知能支持迭代的视觉实验,并通过使设计师能够操作和重新解释复杂想法来帮助管理认知负荷。相反,ChatGPT厚重、详细的文本输出似乎增加了认知负荷,迫使新手设计师在心理上解析和整合大量文本信息,使概念可视化更加困难。这些因素可能导致了对创造性心流的显著负面影响。一些新手设计师表示希望获得更多开放式的刺激,但表示难以做到,选择了狭窄的、任务导向的请求。这表明新手设计师在如何利用该工具获得更抽象和引发发散的刺激方面存在知识差距。

在成果创意性方面,i. 快速产生想法但不新颖:参与者对ChatGPT快速产生大量想法的能力表示赞赏(N=7),这使他们能够浏览并选择多个方向。然而,参与者指出缺乏原创性,因为该工具经常重复相似的概念(N=11)。ii. 增强的清晰度和更容易的知识获取,但理解浅薄:与ChatGPT的互动可能通过提供技术知识和背景见解有助于参与者理解设计问题。它在探索技术、材料和功能方面特别有帮助(N=6)。ChatGPT影响了创意想法的彻底性。参与者(N=4)指出该工具通常产生清晰简洁的描述,有效地以结构化的方式阐述想法。另一方面,研究人员观察到依赖ChatGPT的一些不良影响,特别是在概念理解方面缺乏深度。在访谈中,参与者(N=3)在描述背景、目的和详细分解等关键元素时遇到困难,表明对他们提交的想法缺乏完整的把握。

讨论部分首先分析了创意自信。研究发现,在研究背景下,使用ChatGPT与新手设计师感知到的创意自信降低有关。参与者报告在使用ChatGPT时,对自己设计选择和产生创造性解决方案能力的自信显著低于不使用时。这种模式在将条件与实验前报告的创意自信进行比较时成立。这些关于创意自信的见解应结合研究的短持续时间(约2周)和该群体之前对ChatGPT的相当程度的接触来解释。此外,创意自信是通过单一项目指标而非多项目验证量表进行评估的,因此本研究没有足够的能力确认超越即时背景的持久变化。因此,研究人员将短期自信下降解释为一种情境相关的调整(学生在该课程环境中如何使用ChatGPT),而不是普遍或持久创造力潜力下降的证据。定量发现在定性回答中得到了呼应,参与者表达了对想法所有权感和感知创意自信的降低。一些参与者指出,ChatGPT详细的、现成的输出不仅限制了他们自己的构思,还使他们质疑自己创意贡献的真实性。同时,大多数参与者没有探索可能产生更远距离相关刺激的替代提示方法。对ChatGPT记录的分析显示,大多数参与者只是输入他们的“我们如何(HMW)”问题或设计挑战,并请求生成想法。多名参与者随后要求ChatGPT更有创意或提出更多“跳出框框”的想法,表明倾向于将创造力委托给工具,以及在制定能引出更抽象或创新反应的提示方面知识或兴趣有限。Karwowski等人强调积极参与创意过程对于维持强大的创意自信至关重要。研究结果同样表明,低参与度(第5.2.2节)与参与者创意自信的显著下降(第5.2.1节)之间可能存在因果关系。当新手设计师没有积极参与构思过程时,他们可能无法将自己视为有创造力的主体。可以合理地认为,这种缺乏参与会导致构建和加强创意自信的机会减少,但未来的研究应调查其长期影响。另一个担忧是,通过采取更被动的角色和过度依赖ChatGPT,设计新手可能无法充分发展独立于工具构建创意自信所需的技能。研究数据支持这样一种担忧,即如果参与者认为AI超越了他们,他们可能会对自己能力失去信心,这反过来又增加了他们对工具的依赖。这个问题在写作的背景下尤为明显,一些参与者承认在没有AI辅助的情况下对自身写作能力的信心下降。这些见解显然与Mei等人在创意写作背景下的发现相呼应。在本研究中,一位参与者甚至提到大约7个月以来,他没有一篇不受AI影响的写作作品。这一观察说明,被削弱的创意自信可能引发一个过度依赖的循环,其中自信度降低可能加强了对AI工具的依赖。图8提出了一个关于可能过度依赖AI工具和创意自信降低的推测性启发式循环。研究人员强调,这应被视为未来纵向研究的理论启发式,而非本研究的发现。因此,虚线箭头并不意味着因果关系,因为这是一项探索性研究,但用于指示理论上合理的方向。研究人员的假设是,增加对GenAI的过度依赖可能导致设计师在构思中采取更被动的角色,减少他们的参与度,并限制迭代探索和更深层次认知过程的机会。因此,设计师可能无法感受到对其创意过程的所有权,这可能会削弱创意自信。反过来,这可能进一步强化对AI工具的依赖,形成一个自我强化的循环。重要的是要考虑,研究并不意味着新手设计师认为ChatGPT在整体上超越了他们。事实上,五名接受采访的参与者中有四名表达了对未使用ChatGPT生成的想法有更高的信心,认为AI辅助的想法不太有用或精确。然而,随着GenAI工具的不断改进,以及新手设计师越来越多地依赖此类工具(无论是用于写作还是构思),这种情况值得进一步关注。因此,研究结果表明,虽然AI可以加速想法生成,但过度依赖工具——至少在短期内和在此背景下——无意中干扰了创造性自我的发展。这是连接创造潜力和创造行为的重要组成部分。研究人员有情境和时间限制的结果表明,过度依赖和低创意自信可能相互强化。鉴于这些短期发现,教育者和从业者可能希望关注生成式AI工具如何融入学习环境,特别是确保新手设计师积极参与创意过程,而不是默认接受AI生成的输出。学习背景和作业参数也应体现对ChatGPT在教育中有目的和审慎的整合,强调设计学生在创意背景下应该如果、如何以及何时使用该工具,并意识到其对创造力的可能限制。

在创造性认知过程和体验方面,定量结果显示大多数参与者认为ChatGPT是一个有用的构思工具。ChatGPT快速产生大量想法的能力因其使构思感觉更方便、更省时而受到赞赏。此外,定性分析显示参与者报告它特别有助于克服创意障碍和产生初步想法。然而,许多参与者对ChatGPT的输出表示沮丧,要么因为其通用性质,要么因为与设计目标不相关或无用,指出其倾向于产生过于详细、通用和紧密相关的想法,阻碍了他们的发散思维。研究人员从ChatGPT记录中分析表明,由于大多数参与者寻求的刺激类型,需要表达设计简报中细微差别的需求特别显著:偏好具体的刺激,经常使用ChatGPT生成完整的概念,而非距离较远的刺激。根据Gonçalves等人的研究,与设计问题太具体或太相关的刺激会通过促进设计固定行为来限制创造力。相比之下,中等距离相关的刺激鼓励更灵活和原创的思考。尽管少数参与者将ChatGPT建议中的概念或单词与自己的想法相结合,有助于缓解仅依赖AI的局限性,但这种做法很少,对灵感搜索的总体影响是负面的。给出接近提示的答案是该AI工具“本质”的一部分。因此,当没有提示经验时,ChatGPT会选择最可能相关的答案,从而可能限制设计师的探索空间。一个显著的结果是出现了“复制粘贴”的方法。虽然一些创造力模式在条件下保持一致,但ChatGPT条件的特点是普遍的“复制粘贴”行为,参与者直接转移AI生成的内容而几乎没有修改,他们解释说ChatGPT的语言和语调使他们能够比自己更好地阐述想法。在教育背景下,这种做法令人担忧,因为不受限制的“复制粘贴”行为会导致浅层认知处理和参与度降低,可能影响教育质量。在本研究中也观察到这一点,定量(第5.2.2节)和定性(第5.3.2节)数据均表明使用ChatGPT时缺乏创造性思维的刺激和创造性活动的参与度降低。此外,依赖ChatGPT的基于文本的提示和输出导致模拟构思方法如草图和思维导图的使用减少。ChatGPT厚重、详细的文本输出似乎增加了认知负荷,迫使新手设计师在心理上解析和整合大量文本信息,使概念可视化更加困难。这些因素可能导致了对创造性心流的显著负面影响。尽管ChatGPT支持了创造性认知的某些方面(例如通过产生大量想法促进流畅性,并偶尔充当记忆辅助),但总体效果被认为是负面的。一些新手设计师表示希望获得更多开放式的刺激,但表示难以做到,选择了狭窄的、任务导向的请求。这表明新手设计师在如何利用该工具获得更抽象和引发发散的刺激方面存在知识差距。此外,虽然ChatGPT确实提供了技术、材料和用户背景的概述,有助于问题空间的探索,但定量数据显示,参与者感知到在没有ChatGPT时对问题理解的改善更大。在此背景下,依赖ChatGPT似乎与减少对关键创造性认知过程的参与以及对其提供信息的理解更肤浅有关,这引发了关于他们在此特定任务和时间框架内学习深度的疑问。这突显了他们在使用ChatGPT时的脱离、缺乏参与和努力,导致他们没有深入发展和理解他们提交的想法。所有这些发现引发了更广泛的反思,即过度依赖AI可能如何长期影响创造力。先前的研究强调摩擦和不确定性对于创意探索至关重要。许多参与者将ChatGPT描述为克服创意障碍的一种方式,这提出了一个理论问题:AI是帮助新手设计师通过有意义的挑战,还是使他们能够避免支持创造性发展的生产性摩擦?在此背景下,通过消除这些挑战,依赖ChatGPT可能在短期内鼓励一种更被动的创造力方法,特别是对于那些不太愿意深入参与创意过程或缺乏创意自信的人来说,可能助长一种“捷径”。这种模式是否会持续超出单一课程任务或长期,仍然是一个开放的问题。虽然本研究无法观察长期的学习效果,但研究结果与这些更广泛的教育关切相呼应,并邀请研究人员反思在AI支持的环境中应如何教授创意过程。

在成果创意性方面,研究人员发现使用ChatGPT时产生的概念的总体创意性与不使用时相比没有统计学显著差异。研究样本由新手设计师组成,他们可能缺乏批判性评估、指导或完善AI输出的专业知识,从而导致更大的依赖性而没有更深入的探索。相比之下,经验丰富的设计师可能在使用工具方面更具创意,并能更好地将AI建议整合到他们的构思过程中,从而可能增强创意性。参与者认为ChatGPT辅助的成果总体上不太有用。虽然创意评估显示没有显著差异,但参与者的感知与获得量身定制的、细微差别的输出的困难一致。相反,参与者对未使用ChatGPT创建的想法更有信心,认为它们更相关、更有效。

最后是结论部分。在本文中,研究人员着手研究在设计构思中使用ChatGPT如何影响设计师的创意自信、创造性认知过程和体验,以及成果的创意性。研究人员对35名新手设计师进行了一项实验,他们为六个设计简报之一生成了六个设计方向:首先,在不使用GenAI的情况下生成三个概念,然后使用ChatGPT生成三个。通过对概念、ChatGPT记录以及通过定量和定性数据自我报告的经验的分析,研究人员发现,在此课程嵌入的背景下,在两周内,ChatGPT被认为加快了想法生成的流畅性,但与较低的自我报告创意自信、创造性刺激、参与度、心流和精力相关。在此背景下,过度依赖该工具似乎助长了“复制粘贴”行为、更浅层的认知处理以及减少了对创造性问题解决中富有成效的和内在摩擦的参与。研究人员不假设设计学科之间的一致性。在视觉综合和风格探索占主导地位的领域(例如,平面设计、插画),或者在组件库和微交互限制空间的领域(例如,用户界面设计),生成式AI的可供性和摩擦,以及学生的自信和体验,可能会有所不同。同样,在工程繁重或制造导向的环境中,可行性和彻底性标准显得更强,可能与AI支持以不同的方式相互作用。因此,研究人员的结论是特定于背景的,其应用到其他设计环境时应考虑到这一点。研究邀请我们考虑两个问题:如果任务可以越来越多地外包给AI,是否应该鼓励设计学生外包这部分设计创意?此外,如果AI最终在某些领域能够超越人类创造力,“教授”创造力是否仍然相关?虽然外包创意的概念很有趣,但研究结果与培养人类创造性技能至关重要的观点一致,不仅对于制定有效的创造性策略和创新性地利用AI至关重要,而且对于批判性反思和指导AI生成工作的成果也至关重要。尽管AI辅助设计教育的长期影响需要进一步的实证调查,但研究结果反映了需要促进元认知意识、批判性评估和主动人类输入迭代以与工具协同创造的教育策略。GenAI工具不可避免地会成为设计师实践和过程的固有部分(对许多人来说,这已经是现实)。然而,当研究人员发现新的技术突破并探索解决方案时,也应该反思工具如何改变了研究人员自身以及研究人员创造的方式。

生物通微信公众号
微信
新浪微博


生物通 版权所有