人工智能(AI)在金融领域的应用通常按方法、数据类型或应用领域进行综述。这些视角至关重要,但未能充分揭示一个更深层的转变:人工智能正从预测工具演变为人类—人工智能混合金融决策系统(human–AI hybrid financial decision systems)的组成部分。本综述整合金融学、管理学、人机交互(HCI)及人工智能领域的文献,系统考察人类与人工智能如何在信息获取、预测、推荐、审批、执行、监控及学习等环节实现协同参与。研究人员认为,核心问题正从模型性能转向决策架构(decision architecture),即权力、监督与问责如何在金融工作流中进行分配。研究表明,金融领域的人机互补性是有条件的而非自动的,其取决于任务结构、私有信息、反馈质量、激励机制、解释设计及治理安排。此外,研究人员还指出,人工智能介导的金融决策具有反射性(reflexive):它们重塑组织工作流、价格、流动性、信贷配置以及后续决策所依赖的未来数据。本综述整合了关于方法、数据、场景、可解释性、信任、治理、金融大语言模型(FinLLMs)及智能体金融(agentic finance)的证据,并以一个整合的决策系统框架来组织该领域。该框架包含五个相互关联的构念——委托边界(delegation frontier)、依赖楔差(reliance wedge)、决策可用的可解释人工智能(decision-useful explainable artificial intelligence, XAI)、实质性监督(meaningful oversight)以及反射性人工智能循环(reflexive AI loop)——以支持对投资、交易、信贷、资产管理、风险、合规及金融监管等领域的累积性研究。
该综述围绕人工智能在金融领域中的角色演进展开,旨在从预测工具转向人机混合金融决策系统的核心视角进行系统阐述。
引言部分:从金融中的人工智能到人机混合金融
金融是在不确定性下做出决策的领域,数据只有在影响决策时才具有经济意义。人工智能在金融中的渗透不应仅被视为新预测模型的采用,更应被理解为金融决策架构的深层变革。人工智能系统已从结构化与非结构化数据中获取信息,将噪声观察转化为信号,生成推荐、触发警报、执行行动并从结果中学习。因此,分析单元正从单一模型转向人机混合金融决策系统——一种社会技术安排,其中人类、算法、组织、市场和监管机构共同产出金融结果。该综述定义人机混合金融为人类与人工智能在信息获取、解释、预测、推荐、批准、覆盖、执行、监控、审计和学习等一个或多个阶段共同参与决策的系统,并强调这一视角的重要性在于金融的高风险性、任务中预测与解释及升级的复合性,以及金融大语言模型和智能体正将人工智能转变为通信与执行层。
研究人员提出一个核心谜题:强大的人工智能本身并不能自动产生强大的人机混合决策。这一谜题揭示了以模型为中心的评估局限性,因为一旦人工智能嵌入金融工作流,结果不仅由模型性能决定,还取决于谁有权行动、人类如何依赖人工智能、模型输出是否可解释和质疑、人类监督是否实质性,以及人工智能介导的行动如何重塑未来数据、工作流和市场。
人工智能的崛起:金融中的工具与应用
该部分按方法、数据对象和应用场景三个维度追踪人工智能在金融中的演进,但目的并非提供技术综述,而是展示这些能力如何融入人机混合金融决策系统。
从方法看,人工智能经历了从传统机器学习到深度学习、强化学习,再到金融大语言模型和生成式人工智能的演进。传统机器学习(如支持向量机、随机森林、梯度提升等)在信贷评分、欺诈检测等表格数据场景中仍是基础,其优势在于可验证、可基准测试和可监控。深度学习通过表征学习处理序列、文本和高维非线性问题,扩展了可用信息集,但带来了表征漂移和可解释性挑战。强化学习将金融人工智能从预测推向顺序控制,在交易执行、做市和投资组合再平衡中输出行动策略,使委托变得不可避免,组织必须决定哪些行动自动、哪些需批准、哪些可覆盖。金融大语言模型和生成式人工智能则进一步将人工智能扩展至语言、交互和工作流层面,影响前端协作,并引入人工智能生成的决策产物(如摘要、检索痕迹、备忘录草稿等),使来源锚定、日志记录和审批门控变得尤为重要。
从数据对象看,金融人工智能的证据基础从结构化变量扩展至文本、网络关系和多模态信号。结构化数据仍是支柱,但文本数据(新闻、申报文件、财报电话会议等)通过情感、语调等信息改变了信息环境。网络和关系数据在小微企业信贷、反洗钱等场景中日益重要。多模态和替代数据(卫星图像、网络流量、地理位置等)拓宽了前沿,但也带来了隐私、来源、代理偏差和稳定性等更严峻的治理问题。该综述强调,预测信号与决策相关证据之间存在关键区别:一个变量可能提升违约预测,但若其代理受保护特征、违反隐私预期或无法向申请人解释,则不适用于信贷决策。
从应用场景看,最成熟的人工智能应用仍在信贷分配和风险管理中,包括破产预测、信用评分、承保、欺诈检测和早期预警。第二大集群涉及资产定价、收益预测和投资组合配置。第三大集群涉及市场微观结构和交易。第四大集群涉及研究、咨询、会计、投资者关系、合规和监管科技(RegTech)等文本密集型中介活动。第五大集群涉及保险、监管科技和系统性监督。该综述指出,人机混合金融问题具有领域特异性:银行业中个体层面后果最为可见;资本市场中人工智能不仅是预测技术更是均衡技术;机器人咨询和投资顾问的挑战在于确保适当性、可理解沟通和长期投资者福利;欺诈和反洗钱系统的价值取决于是否能改善稀缺人类注意力的排序;保险场景中预测提升必须与决策可用的解释、公平审查和实质性监督相结合。
人工智能的挑战:人机协作何时有效、何时失败
该部分探讨人机协作改善或恶化金融决策的行为与组织条件,提出人机混合金融谜题:如果人类和人工智能具有不同的优势,为何它们的组合往往未能超越最佳独立人类或人工智能决策者?答案在于互补性并非人类和人工智能的孤立属性,而是决策架构的属性。
研究人员定义委托边界(delegation frontier)为金融工作流中决策权在人类与人工智能之间转移的阶段特定边界。人工智能辅助可采取筛选辅助、第二意见、排序推荐、对话副驾驶或自主执行等不同范式,这些范式在谁先行动、谁保留自由裁量权、显示什么信息以及问责归属等方面存在差异。该部分强调,证据不能简单跨场景转移:作为筛选辅助有用的模型可能作为自主执行者危险;用于总结文件的对话副驾驶可能不足以为未验证的投资推荐提供支持。委托边界问题在金融大语言模型和智能体系统中尤为重要,因为相同模型在不同角色中风险等级不同:作为检索助手风险低,作为推荐代理风险中等,作为连接交易、贷款、合规或理赔工具的执行者风险高。因此,人机混合金融需要以行动为中心的评估,而非仅以文本为中心的评估。
该部分还讨论了交接失败(handoff failures)问题:模型可能在统计上准确,但被路由给错误的用户、在错误的时间呈现、以错误的置信度提示框定,或嵌入到不鼓励审慎审查的工作流中。金融领域的反馈往往延迟、删失或内生性,使得人类难以学习人工智能何时可靠,组织难以估计人类覆盖的价值。
研究人员定义依赖楔差(reliance wedge)为对人工智能的实际依赖与基于相对准确性、不确定性、激励和问责而应有的依赖之间的差距。过度依赖表现为用户接受超出人工智能可靠性保证的建议;依赖不足则表现为因不透明性、显著错误或界面设计不佳而拒绝有用的人工智能。目标是选择性依赖(selective reliance)而非全局信任,即用户在人工智能可能正确时依赖、可能错误时保留。设计干预如认知强制、置信度显示、解释、来源锚定和案例相似性指标可以缩小依赖楔差,但需要用户理解且有响应权限。
该部分总结了人机互补性的边界条件:当人类和人工智能错误相关性不高、人类拥有模型缺乏的信息、不确定性以决策可用的形式传达、人类有覆盖权限和激励、任务允许有意义的审查时,互补性更可能出现;反之,当人工智能已主导人类表现、人类无法检测模型错误、解释产生虚假信心、激励鼓励责任转移或时间压力使监督沦为橡皮图章时,互补性较不可能实现。
使能人机混合金融:可解释性、信任与治理
该部分转向使混合协作可治理的机制,认为可解释性、信任校准和治理是人机混合金融的核心设计要求,而非可选附加组件。
金融领域对黑箱人工智能敏感,因为许多决策分配稀缺机会、施加成本并产生法律或审慎义务。研究人员定义决策可用可解释人工智能(decision-useful XAI)为能够提升金融决策中的可操作性、可审计性、可质疑性和问责性的解释。金融可解释人工智能的关键标准不是技术优雅性,而是决策可用性:忠实性(对决策目的而言足够忠实)、可理解性(针对不同用户需要不同格式)、可行动性(支持质疑或救济时)和可审计性(支持后续审查)。研究人员指出,更多解释并非总是更好:解释可能增加理解,但也可能制造虚假安慰、使用户锚定于无关因素,或被操纵以塑造用户行为。大语言模型特别尖锐地加剧了这一问题,因为它们可能生成听起来权威但实际与决策过程无因果联系的流畅理由。
信任校准是解释和界面设计的行为目标,旨在实现有保障的信任(warranted trust)。研究人员定义实质性监督(meaningful oversight)为拥有充分信息、权力、时间、独立性和责任以影响结果的人类监督。有意义的监督需要三个操作条件:数据可信度(及时、具有代表性、定义明确、保护隐私并监控漂移)、模型可靠性(在分布偏移、策略适应和制度审查下保持校准、稳健、公平和安全)以及决策可行性(模型输出可转化为合法、可解释、工作流兼容、价值一致的行动)。该部分强调,仅从组织图表假设人类在环是不够的,必须通过工作流数据、覆盖记录、升级结果和审计追踪进行实证评估。
共生决策智能是该部分的终点概念,指人类判断、算法处理、组织惯例和治理控制共同产出金融决策的决策架构。其三个意涵为:认知被重构(专业人士日益借助人工智能生成的摘要、排名、警报和场景进行思考)、价值被共同生产(决策必须平衡预测准确性与风险偏好、公平性、客户待遇、监管期望和组织合法性)、系统与其环境共同演化(受治理的人工智能决策改变工作流、客户行为、市场信号和未来数据)。
人机混合金融的未来
该部分探讨未来工作流和市场层面的影响,认为未来将由决策架构塑造,而非孤立模型。
决策架构与权力分配可沿三个维度描述:阶段(信息获取、解释、推荐、批准、执行、监控和学习)、权力(谁有权行动、覆盖、升级或停止系统)和问责(谁对结果和过程文档负责)。研究人员建议区分启动(谁发起候选行动)、干预(谁可暂停、质疑或修改)和批准(谁有最终权力),并以反事实覆盖问题作为实践测试:如果人类不同意人工智能,会发生什么?
未来工作流中,生成式人工智能和人工智能智能体将重塑而非简单替代金融专业人士,导致认知重新打包(cognitive re-bundling):感知、解释、推理、验证、记录和行动在人、模型、工具和审批路径之间重新分配。分析师可能花更少时间收集和总结文件,更多评估假设、场景和战略意涵;信贷官员可能成为例外审查员和关系解释者;理赔员可能审查人工智能生成的损害估计和覆盖理由;合规调查员可能从筛选每个警报转向审计人工智能生成的分流和叙述。
金融大语言模型、生成式人工智能与智能体金融方面,研究人员提出智能体金融的五级能力分类:第一级检索信息和总结来源;第二级分析和比较替代方案;第三级推荐行动并解释权衡;第四级执行有界行动(如准备订单、路由案例、更新记录或经批准后发送草稿通信);第五级通过规划多步骤工作流、协调工具和学习结果来随时间适应。研究人员认为近期大多数可部署的金融系统应停留在第一至第四级,对外部行动保持强控制。关键控制变量为权限、记忆、锚定、批准和日志。
反射性人工智能循环(reflexive AI loop)描述人工智能介导的决策重塑未来人类和人工智能决策所依赖的信息、行为和市场环境的过程。在贷款中,借款人和平台可能适应评分规则;在保险中,投保人可能适应申请叙述;在披露和资本市场中,企业可能日益为机器读者写作;在交易和投资组合管理中,共同模型和共享数据供应商可能放大相关定位和拥挤。系统性风险监督同样具有反射性:若许多机构依赖相似的第三方人工智能模型,其对相同信号的反应可能变得相关。未来研究应结合历史验证与影子部署、部署后监控、模拟和多层次证据。
结论:从预测到委托
该综述认为人工智能在金融中的应用现已超越收集预测工具的狭隘框架。核心转变是从预测到委托:未来研究不应仅问人工智能能否预测违约、收益、欺诈、情感、理赔或风险,而应问人工智能何时应推荐、决定、执行、解释、学习和被覆盖。人机混合金融是决策权分配的问题,需要三个更广泛的转变:分析单元从孤立模型转向人机混合金融决策系统;性能应被理论化为多维而非可归约为准确性 alone;反射性应被建模为中心而非残余的。成功的财务决策系统不是人类始终同意人工智能,也不是人工智能始终主导人类,而是分歧具有信息价值、依赖经过校准、权力明确、解释具有决策可用性、监督具有实质性、反馈被用于改进模型和工作流的系统。
打赏