安天廿五载,创新有图腾
时间:2025年06月09日
2025 年两会期间,一件特殊的“龙江礼物” 引发关注 (参见黑龙江电视台《“箱” 遇两会》节目)一个相框中,放置着两个金属切削的标志和一个二维码。相框的复制品在2025年6月6日,安天25周年创业纪念日,被安天档案馆正式归档。从反病毒引擎到垂直大模型,从病毒命名到病毒百科全书,LOGO方寸之间是对自主研发创新的坚持,在安天成立25周年之际,就让我们一起来解密这组“神秘”符号吧!
【两会龙江礼物】带有logo及金属标牌的特殊相框
网络安全的“发动机”——AVL SDK反病毒引擎
L战斧标志是安天AVL SDK反病毒引擎的注册商标
在相框左侧,形似战斧的标志便是安天核心产品 AVL SDK 反病毒引擎的注册商标。反病毒引擎顾名思义,就是支撑病毒和恶意代码检测能力的“发动机”。二十五年过去,AVL SDK引擎赋能产业生态,已累计嵌入全球130 万台网络设备和网络安全设备、40亿部智能终端,是国产手机的 “安全标配”。
L战斧标志下这串字符“2004SR07169”是安天AVL SDK的最早的著作权编号。安天在2001年,正式开启了AVL SDK反病毒引擎的研发,并在当年完成最初版本,当时病毒库规则只有五千多条,也只能检测以PE为主的格式分支。引擎嵌入到了安天的第一个产品,杀木马软件Antiy Ghostbusters V1.0当中。当时引擎未申请著作权,直至 2004 年申请科技部中小企业创新基金时,才为反病毒引擎首次申请软件著作(2004SR07169)。
AVL SDK反病毒引擎全面成为适配各种主流体系结构、操作系统、业务场景的全场景安全中间件。支持X86、ARM、MIPS、PowerPC等多种架构,兼容Windows、Linux以及中标麒麟、银河麒麟等国产操作系统,检测对象覆盖文件对象、内存对象、网络流等多种类型。
AVL SDK反病毒引擎可精准检测全量已知恶意代码,将其精准归类到8个分类、超过5万个家族和1800万个变种中。同时可识别351种文件格式、44种编译器版本、477种壳版本,对重点格式均可进行深度预处理和元数据化。其检测平均速度可达约200个PE文件/秒(基于内存盘测试),精准检出率超过99%,误报率始终控制在0.009%以内。
安天反病毒引擎技术指标
安天联合创始人、安天技术委员会主任张栗伟
“2001年安天开始研发反病毒引擎时,团队开发人员只有4、5个人。Seak决定暂时放弃感染式病毒、宏病毒等检测分支开发,专攻蠕虫木马,因此我们的第一版引擎并不是全能力的,但准确地判断了恶意代码的演进趋势。我当时主要的攻关任务就是解决恶意代码的自动化特征提取问题。安天用了十多年的时间逐渐追赶上了国际前辈的检测能力,并在部分能力分支上建立了优势。”
“安天引擎的几个关键特色能力,一个是将精准的威胁检测与信誉识别结合在一起,二是可以支持用户自行扩展向量级威胁情报的消费,三是将澜砥端侧大模型作为一个选件。”
威胁检测的“人工智能+”——澜砥威胁分析垂直大模型
在相框右侧,是安天澜砥威胁分析垂直大模型的标志。澜砥威胁分析垂直大模型基于安天赛博超脑20余年积累的海量样本特征工程数据训练而成,训练数据涵盖文件格式信息、判定信息、属性信息、结构信息、内容向量、以及行为信息、主机环境信息等。
该模型支持对不同场景下向量特征进行威胁判定,并输出详实的知识理解,从而形成适应不同需求和场景的多形态检测方式,极大地提升了后台隐蔽威胁判定能力,进一步为安全运营赋能。澜砥威胁分析垂直大模型成功解决了大模型二进制理解能力衰减问题、上下文长度限制问题,突破了传统生成式大模型依托文本语料的限制,能够直接理解二进制上下文,检测威胁,实现了强大的威胁泛化处理能力。
常见模型上下文处理长度对比表(以 DeepSeek 为基准,对比值为模型长度处以基准)
基于澜砥威胁分析垂直大模型的生成式威胁检测分析算法,改变了传统基于低阶静态特征或简单规则的检测手段,同时突破了人工智能分类模型的家族数量限制。在学习了千万级别样本的知识后,该算法取得了出色的泛化能力,在面对新型和动态变化的恶意代码时,实现了强鲁棒性与传统检测方法的良好互补。同时,安天澜砥威胁分析垂直大模型,可作为端侧大模型模块跟随引擎部署,具有极强的抗免杀变换能力、可输出与安天技术规范一致的精准分类命名、特别适合内网无法常态更新病毒库的场景用户,有效解决检测能力衰减问题。
澜砥威胁检测生成式算法于2024年底通过国家网信办备案,备案号为网信算备230109026778501240017,也就是在相框中澜砥大模型标识下的那串数字。成为首个获得威胁检测垂直领域备案的威胁检测类生成式算法。
安天首席技术官关墨辰
“澜砥模型的自主研发,源自我们发现开源模型对样本二进制分析效果不佳,但同时我们也很清楚,我们不可能用恶意代码检测分析这样的局部需求,去研发一个通用的模型。我们首先是把创新的问题明确,那就是突破通用模型对二进制分析的局限性,其中一个关键点则是要突破上下文长度限制。我们最初设想只是用其进行辅助分析,但检测能力、精准度和误报控制方面都比较理想后,我们就编写了端侧大模型的版本,来作为引擎的增值模块,提供给生态伙伴。”
网安业界的“公共知识库”:计算机病毒百科
在相框的右下角,一个小小的二维码指向——计算机病毒分类命名知识百科,这个被称为“病毒百科”(域名Virusview.net)的公共知识资源,是安天研究院向业界、研究机构和公众提供的垂直专业知识。
安天计算机病毒分类命名知识百科(域名Virusview.net)
它基于严格的分类命名索引展开,以安天的恶意代码八个基础类别作为一级分类,按照现有恶意代码家族的环境前缀逐层深入,目前颗粒度已经精确到病毒家族一级。家族知识词条超过5万个,完整覆盖了全部已知计算机病毒恶意代码已知家族,并且跟随安天AVL SDK反病毒引擎迭代更新。研究人员可以通过该百科快速查询到某种新型病毒的相关信息,包括所属家族、传播方式、危害程度等,为防范和应对病毒攻击提供有力支持。同时还提供了僵尸网络档案、攻击组织档案、文件格式档案等,并每日更新恶意代码的统计信息。
计算机病毒百科病毒样本分类命名索引
安天技术委员会副主任李柏松
“计算机病毒百科的第一版始于Seak的个人主页‘病毒观察’,后来与安天最早的杀毒软件Antiy Ghostbusters配套,手工维护了近百种流行木马的信息,坚持了两年多,就没有精力维护了。第二版是在06年后,将病毒样本分析自动化流水线的分析结果,用网页的方式呈现,这一次也没有坚持下来。我们在前年重启这个项目时,已经构建了对恶意代码的全新的、系统的理解,而且有充分数据和算力资源支持。安天反病毒引擎是我们为业界提供的共性核心能力,而病毒百科是我们的提供的共性知识,我们在反恶意代码领域提供面向生态产品和面向用户的完整赋能。”