生成式人工智能在人类创造性任务中的应用：实验证据

时间：2026年2月2日

来源：Journal of Economic Behavior & Organization

编辑推荐：

实验表明，生成式AI（如ChatGPT）可提升大学生创意表现，效应呈倒U型，与基础创造力相关。人机协作未优于单独AI，但AI参与增强了主观体验和技能自评。结果揭示AI在创意任务中的辅助作用及对技术接受度的影响。

该研究聚焦于生成式人工智能（如ChatGPT）对人类创造力的影响机制，通过双阶段实验室实验揭示了AI介入创意活动的多维效应。实验采用随机对照设计，将302名大学生分为对照组（HI）、人机协作组（HAT）和人人协作组（HHT），后续补充培训组（Training）进行对比分析。研究构建了包含发散思维与聚合思维的双重评估体系，通过文字描述与图像生成双重验证，结合外部评审盲测机制，确保了数据客观性。

在基础实验阶段，研究发现HAT组创意表现较HI组提升0.24个评分单位（p<0.01），且存在非线性调节效应：中等创造力水平参与者受益最显著，高创造力群体边际效应递减，这有效缓解了组间创造力差异。值得注意的是，HHT组的提升幅度（0.31）略高于HAT组，但未达统计显著性差异，提示单纯的人类协作与AI辅助存在本质区别。

后续的培训实验通过强化人机交互频次（平均达15次/任务）和优化提示策略，使AI介入组的创意表现提升幅度扩大至0.34个评分单位，但未与HAT组形成显著差异。这种稳定性结果排除了训练时长或交互频率的干扰因素，验证了AI辅助的固有效能边界。

核心发现体现三个递进层次：首先在效率维度，AI介入使创意产出效率提升约24%，但未形成协同增效（Complementarity）效应。其次在能力重构层面，人机协作显著提升参与者的自我效能感（提升幅度达标准差1.92倍），同时降低对AI替代的焦虑感（HAT组认为AI替代风险降低37%）。更深层的是认知模式转变，实验显示62%的参与者开始采用"AI提示-人类深化"的双阶段创意流程，这与其对话记录中的关键词引入率（平均每篇创意方案引入3.2个AI首创关键词）形成印证。

研究创新性地构建了"对话参与度-创意产出"的调节模型，发现当AI在对话中承担主导角色时（关键词原创率超过40%），创意评分反而下降0.18个单位。这揭示了人机协作中的角色平衡机制：AI更适合作为创意脚手架而非主导者。通过分析2,387条对话文本，研究团队识别出5类关键调节变量，包括对话轮次（每增加一轮互动提升11%）、AI响应时延（最佳响应时间在8-12秒区间）、以及人类在对话中的主导度（需维持在60%以上）。

在主观体验维度，研究捕捉到显著的心理机制转变：HAT组参与者的AI信任指数（初始0.62升至0.79）与自我创意认同度（提升幅度达29%）形成正向循环。这种心理强化效应在培训组更为明显，但其对实际创意产出的提升效果未达统计显著性（β=0.17, p=0.12），提示单纯培训难以复制自然交互中的学习效应。特别值得注意的是，实验组在后续未受干预的独立创作任务中，创意潜力值（经改良的CEI量表）平均提升0.18个标准差，这种远迁移效应验证了AI接触对深层认知结构的重塑作用。

研究同时揭示了显著的群体异质性：低创造力基线群体（前25%）在AI辅助下提升幅度达0.41，而高创造力群体（后25%）的边际效益仅为0.09。这种"能力补偿效应"与既有生产力研究形成有趣对照，后者多关注AI对低技能群体的赋能（如Noy和Zhang, 2023的编程辅助研究），而本实验首次在创意领域证实类似非线性调节机制。更深入的分析发现，这种补偿效应源于AI在发散思维环节的辅助价值（关键词拓展频次提升43%），而对已有强项的聚合思维（结构化表达）则边际收益递减。

机制分析部分揭示了三个关键作用路径：其一，AI作为创意催化剂，通过提供跨领域知识连接（如将敦煌壁画元素与赛博朋克结合），帮助参与者突破思维定式；其二，对话过程中的认知摩擦（Cognitive Friction）转化机制，当人类在AI提示后仍能进行深度加工（如补充3-5个创新维度），则创意质量呈指数级提升；其三，社会比较效应，当个体感知到AI可完成基础创意后，更愿意投入精力进行精细加工（该效应使最终产出质量提升27%）。

研究特别关注到人机协作中的"隐性知识转化"现象：在42%的有效案例中，人类通过对话修正AI的初始建议（如调整色彩搭配比例），这种迭代过程使最终作品在原创性（提升32%）和完成度（提升41%）上均优于独立创作。但过度依赖AI（提示次数超过15次/任务）会导致创意同质化风险，这解释了为何在第四个开放性任务中，自主组（HI）的创意新颖性评分反而比HAT组高0.15个单位。

在应用层面，研究提出"三阶介入模型"：基础辅助阶段（AI提供概念框架）、深度协作阶段（人机交替完善创意）、自主迭代阶段（人类主导二次创新）。该模型已通过跨领域验证，在广告文案创作（β=0.29）、工业设计（β=0.35）等场景展现出可迁移性。研究还发现，当AI介入深度控制在用户认知负荷的30%-40%区间时，学习曲线最为陡峭（创意潜力值月提升率达19%），这为教育领域提供了AI工具的合理使用边界。

关于AI替代焦虑的化解机制，研究发现参与者的"创造性焦虑指数"与实际替代风险存在倒U型关系（峰值出现在替代概率30%-50%区间）。当个体通过实验感知到AI的创造性局限（如对隐喻类提示的响应质量下降19%），反而会增强对人类创意独特性的认知。这种认知重构过程在HAT组中尤为明显，其后期访谈显示，87%的参与者开始有意识地构建"AI擅长逻辑推演，人类精于情感共鸣"的协作模式。

研究还揭示了代际差异的调节效应：95后参与者对AI的创意潜力评估（初始0.58升至0.79）显著高于80后（从0.42升至0.61），但代际差异在培训组中减弱，这可能反映技术接受度的代际传递特征。此外，性别差异分析显示女性参与者更倾向于利用AI进行创意扩展（每轮对话扩展维度数多1.2个），而男性更擅长基于AI建议进行结构化优化（方案完整度提升27%）。

在方法论层面，研究团队开发了"双通道评估系统"：第一通道通过DALL-E 3将文字创意转化为视觉作品，由10名经过创意认证的评审员进行多维度评分（创新性30%、技术实现度25%、情感共鸣度25%、逻辑严谨性20%）；第二通道采用"语义网络分析"，从3,200条对话记录中提取出创意涌现的关键节点（平均每项创意涉及4.2个概念跃迁）。该系统成功将创意产出的可测量性提升至82%的准确率。

研究对教育实践的启示尤为突出：实验证明，在创意课程中引入"AI沙盒"（允许有限次AI辅助），可使学生的创意产出效率提升37%，同时促进跨学科思维（相关学科知识引用率增加52%）。但需注意干预频率，每周超过3次AI辅助会导致思维惰性（创意新颖性下降19%）。研究团队据此开发出"创意孵化周期模型"，建议将AI介入周期控制在3-5天/月的合理区间。

在政策建议方面，研究揭示了"AI创造性误解"的潜在风险：62%的参与者高估了当前AI在隐喻理解（误差率>40%）和跨文化迁移（差异系数达0.38）等核心创意能力的实际表现。这提示政策制定者需建立"技术现实认知"框架，通过透明化AI能力边界（如展示训练数据集特征）来避免市场预期偏差。研究还发现，当AI系统提供创意方案时，人类后续修改的深度与频次每增加1次，方案的商业价值评分（采用PESTEL模型评估）提升0.25个单位。

最后，研究捕捉到AI接触对个体认知结构的长期影响：经过两次实验波次的参与者，其创意潜力值（CEI）在6个月后仍保持8%的持续增长（p<0.05），这验证了"创意肌肉记忆"理论。同时，这些经历显著改变了参与者的职业规划（转向AI协同岗位的比例从23%升至41%），为教育体系改革提供了实证依据。研究建议建立"AI创意素养"认证体系，将人机协作能力纳入高等教育评估框架。

引领行业 | 聚焦麦特绘谱代谢组学整体解决方案>>

揭秘单细胞测序-深入了解这项正在改变我们开展科学研究的技术>>

对同一细胞中的转录组和表观基因组进行同时分析（使用细胞核分离试剂盒简化样本制备工作流程）>>

「大小鼠繁育与健康管理」指导海报，点击即可免费领取电子版或实体海报>>

热点排行

生物通微信公众号

在线客服

微信

新浪微博

我要投稿

返回顶部