项目背景
随着信息技术的飞速发展,计算机和互联网已成为日常办公、通信交流和协作互动的必备工具和途径。但是,信息系统在提高人们工作效率的同时,也对数据的存储安全及传输安全提出了更高要求。当前各企事业单位对内网的安全解决方案,还停留在采用防火墙、入侵检测、存储加密系统等保护网络、限制数据访问或全网数据加密的被动、枷锁式防护手段上。
纵观近年来国内外数据泄露事件,互联网接入单位由于内部重要机密通过网络途径泄露而造成重大损失的事件中,只有 1%是被黑客窃取造成的,而 99%都是由于内部员工有意或无意的一些泄密行为导致的。
DLP数据防泄露系统是技术团队构筑在最新一代 64 位多核硬件平台基础之上,采用业界先进的内容指纹匹配、计算机视觉、语义分析等核心智能算法,同时结合先进的多核高速数据包并发处理技术,研发而成的企业级数据防泄露系统。其核心理念是立足于用户内部网络,建立起以数据内容为核心的智能识别策略和集中安全管理为显著特征的全方位数据内容智能识别体系。
本数据防泄露系统通过深度内容分析和事务安全关联分析来识别、监视和保护静止、移动和使用中的数据,并能联动其它传统安全产品形成整体数据安全解决方案,满足客户的全方位安全需求。
核心价值:外传数据内容智能深度识别,防止敏感信息外泄自动发现、梳理并识别企事业单位存储设施内的敏感数据内容,并能对所有发现的敏感数据计算其数据指纹,针对性制定不同密级、不同类型的敏感数据监管和保护策略,智能化防止敏感信息的外泄。
敏感数据文件自动发现,落实责任到人自动扫描内网所有敏感数据,同时多维度制定敏感数据分布地图。详细展现敏感数据的所在部门、所在存储设施及其存储路径。还能周期性自动更新地图,实时掌握敏感数据的分布,详细记录终端、服务器设施敏感数据存储情况。
支撑IT管理,优化组织IT环境本数据防泄露系统可以有效支撑企业的IT 管理,帮助规范内部网络,减少IT管理人员工作量、工作复杂度,优化IT环境。并结合企业的相关规章制度,把数据安全监管要求落地。
优化企业流程习惯,提高核心竞争力数据防泄露系统可在不改变文件的前提下智能深度识别文件内容,对不同文件采取不同监管措施,不影响企业的现有业务流程及用户操作习惯,实现数据分区、分类、分级治理目标。同时还能个性化监管,一定程度上提高了用户在同行业的竞争力。
为合规性要求提供落实依据,轻松应对监管规定为行业合规管理和审计的时候提供内控相关的证据,提供基于合规审计的资料,轻松应对审查及行业规范要求。
DLP系统组成
该数据防泄露系统由管理平台、网络监控、网络保护、邮件保护、终端保护、数据发现及应用系统保护六大安全模块组成。各模块功能如下:
管理平台模块:提供可视化的日志报表呈现及敏感信息分布地图,同时负责敏感信息保护策略规则的制定和推送。
网络监控和网络保护模块 :负责对通过在线网络途径的泄露行为进行审计/阻断。
邮件保护模块:提供敏感邮件人工审批功能,主要供有敏感邮件收发需求的企事业单位使用。
终端保护模块:能够自动发现各终端存储的敏感数据,防止其通过终端外设接口泄露。
数据发现模块:能够自动、周期性增量发现内网所有服务器、个人终端上的敏感数据存储情况,记录并统计每部门、每终端、每类型敏感数据的详细分布,并绘制敏感信息分布地图。
应用系统保护模块:它位于本地 WEB 服务器和Internet 之间,处理所有对 WEB 服务器的请求并实时监测保护,阻止了 WEB 服务器和 Internet的直接通信,增加了网络的安全和保护内部网络上的重要数据。
数据防泄露系统安全模块
DLP系统核心技术
1.内容指纹匹配 技术
1.1索引内容指纹匹配
??技术应用
索引内容指纹又称索引数据匹配(IDM),是一种对于数据内容进行模糊匹配的算法技术。该技术主要用于检测各种非结构化储存的文档与样本文档的相似度。
??实现过程简述
通过对非结构化存储的数据采取分段指纹提取措施,可以实现对待检测文档内容的模糊匹配。文档经过数据预处理之后,获得与内容有关的标准化数据(统一的字符编码、内容标准等),之后采用窗口切割方式进行指纹计算。通过这样的方法可以获得一串压缩率 10%左右的内容指纹。
Prism Technology Co Ltd对于待检测文档,使用上述的计算方式得到其指纹信息,然后根据自定义的相似度阈值对待检测文档的内容进行模糊匹配,如果达到设置的相似度阈值则认定该文档中的内容满足匹配条件,系统将根据设置采取后续动作。
1.2精确内容指纹匹配
??技术应用
精确内容指纹又称精确数据匹配(EDM),是一种对于结构化数据(各类表格)进行精确匹配的算法技术。该技术主要用于匹配待检测数据是否命中结构化数据中某一行的算法技术。
??实现过程简述
通过对表格数据的行列进行预分析,计算出最能代表数据复杂性的列进行索引编制,并扩展到每行,以达到快速查询并匹配的效果。
精确数据匹配技术具备以下特性:
无序性:对目标中的敏感信息顺序不作要求;
精确性:数据必须唯一匹配原始数据的某行;
计算效率:具备高速匹配效率。
2.计算机视觉技术
??技术应用
计算机视觉,是指对图像进行识别判断,并理解其中的含义。中颖智超围绕数据内容,具备以下技术:
Prism Technology Co Ltd
光学字符识别(OCR):对图片中的文字进行识别辨认;
图章识别:对图片中的公章进行识别辨认;
物体识别:通过大量样本训练后,对图片中的物体进行识别辨认;
标志识别:通过大量样本训练后,对图片中的标志或 Logo 进行识别辨认
人脸识别:通过大量样本训练后,对图片中的人体脸部特征进行辨认。
??实现过程
由于光学字符识别、物体识别、标志识别和人脸识别有很多公开论文进行描述,此处不一一赘述。其中,图章识别技术是中颖智超经过大量研发投入所具备的独特技术,其计算定位通过以下步骤完成:
采用基于机器学习 神经网络的标志识别,模糊匹配出圆形图章;
文字拉直,对图章区域内的文字进行图片处理,使文字能够水平排版;
OCR 文字识别,对水平排版的文字进行识别。
3.语义分析技术
3.1文件聚类
??技术应用
文件自动聚类是一种典型的无指导机器学习方法,用机器学习算法将不同文档分别映射到特征向量空间中,以实现将未分类文档集合自动分成若干Prism Technology Co Ltd类文档的目的。
??实现过程
利用中文分词、主题分析、特征降维去噪等技术,将不同文档分别映射到特征向量空间中。根据文档空间向量的聚集程度,将文档聚集成某些特定类别。在特征空间中,同类文档往往集聚在同一个空间区域中,从而实现将未分类文档集合自动分成若干类文档。
3.2文件自动打标
??技术应用
为存储于终端电脑或文件服务器的敏感文件,按照文件内容的类别和内容敏感程度,对每一个文件标注分类、分级标签。该标签将伴随文件整个生命周期,可在数据存储、使用、传输、销毁过程中,通过识别文件的分类、分级标签来对其进行可视化展示和监管。
??实现过程
DLP管理平台逻辑部署示意图
技术积累
对于网络安全有多年的积累,有IDS\病毒\防火墙\IDC\数据安全等相关专业技术沉淀;
在DPI领域有多年的积累,在流量处理引擎、业务/协议识别等专业有多年的沉淀;
对于数据应用和大数据处理有多年积累,专长于大型数据处理、数据建模分析;
团队积累
核心技术人员均来自于国内外知名通信厂家,多年从事DPI数据采集和大数据应用、网络安全与防护等领域;
对于运营商互联网和军队专网比较熟悉,了解客户需求和应用方向;
技术优势
设备多形态,支持机架式、ATCA框式、也支持以软件模块形式进行多平台部署;
特有的底层数据处理引擎技术,产品性能处于业内最高水平;
所有技术自主可控,且支持国产自主可控硬件平台;