评估大型语言模型在自动化鱼叉式网络钓鱼攻击方面的能力

时间:2026年2月8日
来源:Expert Systems with Applications

编辑推荐:

大型语言模型(LLMs)在钓鱼攻击中的双重能力研究,显示其进攻端点击率达54%且成本降低92%,防御端检测准确率97.25%无误报。经济分析表明AI自动化使钓鱼攻击利润提升50倍。

广告
   X   

Fred Heiding|Simon Lermen|Andrew Kao|Claudio Mayrink Verdun|Bruce Schneier|Arun Vishwanath
哈佛大学肯尼迪学院,马萨诸塞州剑桥市,美国

摘要

在本文中,我们研究了大型语言模型(LLMs)在网络钓鱼领域中的双重用途,评估了它们的攻击性和防御性能力。首先,我们评估了LLMs自动化个性化鱼叉式网络钓鱼攻击的能力,并将它们的表现与101名参与者的表现进行了比较,这些参与者分为四组:对照组(点击率为12%)、人类专家组(54%)、完全由AI自动化的组(54%)以及AI与人类协同工作的组(56%)。自动化工具在88%的情况下生成了准确的目标信息。然后,我们评估了LLMs在网络钓鱼检测方面的防御潜力,对Claude 3.5 Sonnet模型进行了测试,该模型在381封电子邮件中的检测准确率为97.25%,且没有误报。经济分析表明,对于大规模的网络钓鱼活动,AI自动化可使利润提高多达50倍。这些发现突显了AI自动化网络钓鱼的威胁性,同时也展示了基于AI的防御措施的前景,强调了在AI驱动的威胁环境中需要平衡攻击与防御策略。

引言

网络钓鱼攻击仍然利用着研究人员近二十年前发现的相同的人类认知弱点。在他们的开创性研究中,Dhamija、Tygar和Hearst(2006年)解释了“为什么网络钓鱼有效”以及这些攻击是如何利用人类认知弱点的。不幸的是,网络钓鱼仍然是一个强大的攻击手段,随着人工智能(AI)的快速发展,其有效性 only 增强了(Begou, Vinoy, Duda, Korczynski, 2023; Roy, Thota, Naragam, Nilizadeh, 2024; Schmitt, Flechais, 2024)。现在,攻击者正在利用AI的进步,而人类的认知缺陷仍然可以被利用(Hadnagy, 2018; Vishwanath, 2022)。生成式AI模型,如语言模型,能够以最低的成本生成高质量、有说服力的文本(Alammar, Grootendorst, 2024; Raschka, 2024),这些模型在日常活动中变得越来越普遍(Breum, Egdal, Mortensen, Aiello, 2024; Karinshak, Liu, Park, Hancock, 2023; Pauli, Augenstein, Assent, 2024)。到2023年1月,ChatGPT成为历史上增长最快的消费者软件应用,在两个月内用户数超过了1亿(Hu, 2023)。据报道,截至2025年底,ChatGPT的每周活跃用户数约为8亿(Techcrunch, 2025),这反映了自2022年11月发布以来的爆炸性增长。与此同时,Google Gemini的用户数从2025年7月的4.5亿迅速增长到2025年10月的6.5亿以上(Pichai, 2025),并在包括搜索、Gmail和Android在内的Google服务中得到了广泛集成。这种广泛的采用表明,基于LLM的助手正在成为日常数字工具的一部分。
网络钓鱼攻击和其他类型的社会工程攻击对国家安全构成了重大威胁(国家安全局,2023年),FBI报告称从2019年到2023年网络钓鱼事件增加了200%以上(联邦调查局,2020年;2024a年,IC3)。由于网络钓鱼非常适合AI自动化,因此预计其威胁性将进一步加剧。
在这项研究中,我们通过比较四种类型电子邮件的成功率来评估大型语言模型(LLMs)进行个性化网络钓鱼攻击的能力:对照组诈骗邮件、人工制作的网络钓鱼邮件、完全由AI生成的网络钓鱼邮件以及有人类协助的AI生成的邮件。我们使用一个定制的AI驱动工具向101名参与者发送了这些邮件,该工具通过抓取数字足迹来创建和评估个性化网络钓鱼邮件。结果显示,AI生成的邮件和人类专家制作的邮件的表现相当。对照组的点击率为12%,人类专家制作的邮件达到了54%,完全由AI自动化的邮件达到了54%,而AI与人类协同工作的邮件达到了56%。
我们还评估了五种流行的LLMs(Claude 3.5 Sonnet、GPT-4o、Mistral、LLama 3.1和Gemini)在网络钓鱼检测方面的能力。Claude 3.5 Sonnet在初步测试中达到了100%的检测率,在更大的数据集中达到了97.25%的检测率,且没有误报。我们发现,当要求模型判断邮件是否可疑时,它们的表现显著更好。这种预处理并没有增加误报率,这为未来的应用提供了一种有前景的策略。
最后,我们进行了经济分析,表明AI自动化可以将网络钓鱼攻击的利润提高50倍,这突显了需要新的防御策略。我们的发现强调了由AI增强的网络钓鱼所带来的日益增长的威胁,以及在技术、组织和政策层面采取更强有力对策的紧迫性。
我们的研究旨在全面评估LLMs在网络钓鱼中的双重用途能力:既作为发起攻击的攻击性工具,也作为检测攻击的防御性工具。这种双重视角至关重要,因为仅了解攻击性能力将无法全面了解AI对网络安全领域的影响。如果AI仅增强攻击者的能力而提供的防御价值很低,组织将面临不对称的威胁。相反,如果LLMs在攻击和防御方面都表现出色,这表明可能会出现一场“AI军备竞赛”,其中防御系统有可能与AI增强的威胁保持平衡。
我们的研究解决了两个互补的问题:
  • 1.
    攻击能力:完全自动化的AI生成的网络钓鱼活动在有效性、个性化和经济效率方面与人工制作和AI辅助的活动相比如何?
  • 2.
    防御能力:LLMs能否有效检测复杂的网络钓鱼邮件,包括那些由AI系统生成的邮件,同时保持低误报率?
  • 在攻击性背景下,“完全自动化”意味着AI模型从信息收集到邮件制作和交付优化,完全独立地生成、执行和调整网络钓鱼活动。我们通过人类受试者测试、经济分析和与先前基准的比较来评估这些能力,以追踪AI欺骗能力的演变。

    相关工作

    相关研究

    近年来,语言模型取得了迅速的发展,它们在创建真实、连贯且有说服力的文本方面的能力使它们成为网络钓鱼的理想工具。因此,最近的研究广泛探讨了大型语言模型(LLMs)与网络钓鱼攻击的交集(Durmus, Lovitt, Tamkin, Ritchie, Clark, Ganguli, 2024; Guo, Chen, Wang, Leu, Fan, 2023; Heiding, Schneier, Vishwanath, Bernstein, Park, 2024)

    评估攻击能力:自动化网络钓鱼活动

    本节探讨了LLMs自动化端到端网络钓鱼活动的能力。我们开发了一个定制的AI驱动工具,用于进行侦察、生成个性化邮件并跟踪结果,然后对其有效性进行了101名参与者的评估。我们比较了四种方法:通用网络钓鱼(对照组)、人工专家制作的邮件、完全由AI自动化的邮件以及有人类监督的AI自动化邮件。这项评估为当前的AI能力提供了基准

    评估防御能力:AI驱动的检测

    在确定LLMs可以大规模自动化复杂网络钓鱼攻击之后,我们现在研究这些模型是否也可以作为有效的防御工具。这项调查对于理解AI对网络钓鱼威胁的全面影响至关重要。
    我们在第3节中展示的攻击性评估结果表明,AI能够实现高度个性化的、可扩展的攻击,其效果与人类专家相当。如果AI驱动的检测被证明无效,那么

    结果

    本节展示了我们的攻击性和防御性评估结果。在第5.1节中,我们首先报告了AI自动化网络钓鱼活动与人类专家相比的有效性。然后,在第5.2节中,我们研究了AI驱动的检测能力。这些结果共同描绘了AI在网络钓鱼领域中的双重用途潜力现状。

    AI增强型网络钓鱼的经济影响

    前几节的结果表明,LLMs在攻击和防御方面都非常有效。
    我们现在研究AI自动化网络钓鱼的经济影响,重点关注AI自动化如何改变攻击者制定AI自动化网络钓鱼的成本效益分析。尽管第5.2节表明AI驱动的检测具有潜力,但这项经济分析揭示了AI的攻击优势为何能够立即转化为实际利润,并且可能超越

    讨论

    在本文中,我们研究了LLMs在网络钓鱼领域的双重用途能力,评估了它们在自动化攻击方面的攻击潜力和在检测攻击方面的防御潜力。我们的发现揭示了一个复杂的图景:AI显著增强了攻击和防御能力,但在不同的时间线和经济激励下,短期内可能更有利于攻击者。
    攻击能力:我们的结果表明,前沿AI模型在

    结论

    我们的全面评估表明,前沿AI模型在攻击和防御网络钓鱼能力方面都达到了一个关键阈值。在攻击方面,AI自动化系统的点击率达到了与人类专家相当的水平(54%),同时成本降低了92%,并实现了前所未有的规模。在防御方面,当得到适当提示时,AI检测系统的准确率超过了97%,表明有效的AI驱动防御在技术上是可行的。
    然而,

    伦理考量

    在收集参与者和背景信息之前,大学的机构审查委员会进行了广泛的审查,以确保纳入人类受试者的行为是合乎伦理的,并且没有使用过多的个人信息。
    我们的研究提出了关于AI在网络安全中双重用途性质的重要伦理问题。我们强调需要与网络安全专业人士和政策制定者进行负责任的沟通和合作。研究设计已经

    资金支持

    本研究没有获得任何公共、商业或非营利部门的特定资助。

    数据可用性声明

    本研究遵循开放科学原则,在伦理指南的约束下尽可能透明地公开了我们的研究方法和数据。我们详细介绍了我们的研究方法,包括使用的AI模型、版本以及用于自动化网络钓鱼活动的提示技术(尽管没有公开提示内容)。我们还详细描述了招募过程、不同组的邮件生成过程和检测测试。第7节进一步讨论了

    写作过程中生成式AI和AI辅助技术的声明

    在准备这项工作时,作者使用了OpenAI的ChatGPT、Anthropic的Claude和Grammarly的网络应用程序来改进文章的语言和语法。作者审阅并编辑了所有内容,并对最终发布的文本负全责。

    CRediT作者贡献声明

    Fred Heiding:概念化、调查、方法论、项目管理、软件、初稿撰写、审阅与编辑。Simon Lermen:概念化、调查、方法论、软件、初稿撰写、审阅与编辑。Andrew Kao:方法论、调查、初稿撰写、审阅与编辑。Claudio Mayrink Verdun:监督、调查、方法论、软件、初稿撰写、审阅与编辑。

    利益冲突声明

    作者声明他们没有已知的财务利益或个人关系可能影响本文报告的工作。

    生物通微信公众号
    微信
    新浪微博


    生物通 版权所有