
一文讲清楚大模型在网络空间安全里的应用
AI相关的技术诞生已久,在安全领域里也有非常多的应用,从深度学习开始,在流量检测、反垃圾邮件,用户行为分析等,都取得了非常好的效果。大语言模型(LLM)出现后,尤其是自ChatGPT3.5之后,由于其自然语言理解,知识掌握,逻辑分析等出色的能力,加上Agent的能力增强,更是掀起在安全领域的应用热潮。目前安全公司都在谈AI,大模型。本文将从大模型,智能体,场景应用,安全运营,典型厂商等方面,对大模
AI相关的技术诞生已久,在安全领域里也有非常多的应用,从深度学习开始,在流量检测、反垃圾邮件,用户行为分析等,都取得了非常好的效果。
大语言模型(LLM)出现后,尤其是自ChatGPT3.5之后,由于其自然语言理解,知识掌握,逻辑分析等出色的能力,加上Agent的能力增强,更是掀起在安全领域的应用热潮。目前安全公司都在谈AI,大模型。
本文将从大模型,智能体,场景应用,安全运营,典型厂商等方面,对大模型在安全领域里的应用作详细介绍。
01
安全大模型
虽然大模型在通用领域表现出很强的语言理解和生成能力,但模型本身目前仍然有不少缺陷:包括
-
知识静态化:知识仅限于训练数据截止日期
-
信息获取受限:无法主动获取实时信息
-
执行能力缺失:不能直接与现实环境交互
-
无临时记忆:每一次API调用都是完全独立的,连Session能力都没有
-
幻觉问题:可能产生虚假或不准确的信息
解决这些问题的方法,有两条路径:
一是大模型本身在进步,包括整体的进步的发展方向的细化:
安全领域,各种垂直大模型是重点的发展方向。
这是一个安全大模型扩展的典型类型:
这是一个完整的反馈过程
经过专业训练过的安全大模型,在实战中表现出更好的效果。
02
安全智能体
大模型安全应用的重点方向就是智能体(AI Agent),AI Agent是一种以大模型为核心,能够感知环境、做出决策并采取行动来实现特定目标的智能系统。它的核心特点是具备自主性和目标导向性。
简单地说,智能体就是通过外围技术的增强,来弥补大模型本身的不足,形成完整的系统。
目前大模型在网络安全领域的应用,都是以智能体为表现形式。结合安全的场景、数据、知识、工具、流程等构建完整的应用服务。
主要应用场景
安全智能体的主要应用场景包括:
每个场景都各有特点及厂商。这里边,流量检测一般不用GPT类的模型,目前BERT类的为主。其它的场景基本是利用GPT大模型对代码,自然语言等的理解能力,做深入的分析。
比如,这是一个供应链安全的场景:
03
安全运营
目前安全大模型(智能体)应用最大的场景是安全运营。
安全运营是当前甲方最难解决的问题。这个工作,对人才的能力和数量要求都非常高,以至于基本所有甲方都难以满足:
安全运营难度的核心,是数据获取能力,数据分析能力,基于经验的判断能力,及响应的方法,而这些,恰好是安全智能体擅长的,于是,安全大厂都在安全运营上发力。
安全智能体用于安全运营,主要是整合安全的数据获取能力,工具调用能力,综合分析规划能力,以及自然语言的人机交互能力。以下是一个典型的例子:
这个例子表现出以下特点:
-
大模型与现有产品之间的关系,不是取代关系,而是配合关系。大模型能够调用安全产品的数据,也可能通过API等接口指挥协调安全产品的动作。这既是数据获取能力,也是响应能力。
-
大部分本地个性化数据不适合直接以训练的方式进入大模型,原因包括数据安全问题,及部分数据的频繁变化,所以,用RAG增强的方式比较好。
-
实时变化的数据,如威胁情报,外部新的信息等,用实时查询的方式更合适。
-
运营工作会经常调用工具,比如资产扫描,样本分析等,原来非常需要专业能力的工作,大模型可以直接调用,并对结果作出分析。
-
大模型或Agent之间,可以做更多交互,以增强能力。毕竟,垂直类的大模型不是全能选手。
-
自然语言的人机交互能力,使得对人员的能力要求及数量要求更低。相对原来的命令行或菜单方式,学习成本低,使用效率高。
注:大模型的特点,训练完成即学习结束,已经训练的结果较难准确修改,无权限管理,这些特点决定大模型适合处理知识类数据,不太适合处理经常变化或者有权限管理要求的信息类数据。
要实现以上能力,需要大量的开发和数据对接工作。
沿着上述思路,国外的微软,CrowdStrike,国内的深信服,奇安信等公司,都做了比较好的实现,比如,下面的一些例子:
微软
微软的Security Copilot和相关安全产品作了整合:
-
与 Microsoft Defender XDR 集成,提供事件摘要和脚本/代码分析等优势。该平台还提供威胁情报并利用生成式 AI 进行调查,增强对不断演变的威胁的安全性。
-
与 Microsoft Sentinel 无缝集成,可通过 Defender 门户在一个位置管理 SIEM、XDR 和威胁情报任务。此集成包括 Microsoft Intune,结合这些平台可提供设备保护、数据安全、改进的合规性和简化的流程,可实现全面的安全系统。
-
与Entra结合,可以处理ID信息及实现访问控制
-
与Microsoft Purview结合,可以获得有价值的数据和用户风险洞察,以帮助识别攻击来源和任何可能存在风险的敏感数据,同时可以解决数据安全和合规性问题。
-
与Priva结合,处理隐私问题。
深信服
这是国内深信服的,强调数据联动能力。
360
不仅强调外部数据,工具对接,对模型本身作为分区强化。
数据对接
数据对接是个非常麻烦的事情,安全的SIEM类产品,对接一直是个大麻烦,这包括如何接入数据,如何分析数据。
在数据对接上,微软使用Plugin和Graph的技术
- 插件(plugin) 通过在 Microsoft Copilot 中使用自然语言与 Web 服务交互来扩展用户的技能。使用插件,可以:
-
访问实时信息 ,例如查找产品发布的最新新闻报道
-
检索关系数据 ,例如报告分配给给定团队成员的服务票证
-
跨应用执行操作 ,例如在组织的工作跟踪系统中创建新任务
2. 图形连接器(Graph) 将数据深度集成到 Copilot for Microsoft 365 体验中,从而提高企业数据的可发现性和参与度。使用 Graph 连接器,可以:
-
通过让 Copilot 能够访问和汇总来自不同源的各种数据集,从而获得更全面的见解,充分利用外部数据
-
使用 Copilot 作为研究辅助工具,让 Copilot 通过利用所选数据集以本机方式查找、汇总和分析。
意图识别
除了数据对接,由于是自然语言交互,意图识别也非常重要,微软还有双AI模型机制,实现准确的意图理解及数据收集,功能调用的能力,如下图
它除了使用OpenAI 的GPT*作为主模型以外,在上图的Microsft Security Copilot中还有一个模型,重点用于意图识别,及数据收集,产品响应的能力,与主模型及用户交互。
04
产品表现形式
目前对大模型的应用,在用户界面上各有特点,但总结下来,不外乎两种:
一种是在传统界面上增加人机交互能力,比如微软的XDR的sidebar形式,
在sidebar里可以继续追问
第二种则是完整的自然语言交互界面,即直接与AI对话,剩下的问题由AI完成。
以上两种方法也被国内厂商广泛应用。
具体特点上,深信服强调检测与运营结合,奇安信则强调数据分析与降噪能力,以解决告警疲劳的问题。但各家在技术原理上基本趋同。
05
总结
大模型在快速发展,基于大模型的安全应用也得到了快速发展。
基于以上内容,您基本可以了解目前的发展情况,但离真正应用还有距离。
本号还有一些更具体的内容,以及部分内容还在持续更新中,关注本号,可以延伸阅读。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。点击下方蓝色字 即可免费领取↓↓↓
**读者福利 |**
👉2024最新《AGI大模型学习资源包》免费分享 **(安全链接,放心点击)**
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】或点击下方蓝色字 即可免费领取↓↓↓
**读者福利 |**
👉2024最新版CSDN大礼包:《AGI大模型学习资源包》免费分享 **(安全链接,放心点击)**
更多推荐
所有评论(0)