中孚互联网网站监控系统
随着Internet的普及和政府上网工程的建设,互联网网站已经成为政府信息公开的一个主要途径,每天都有大量的政府信息在互联网上公开发布。但由于一些工作人员的保密意识淡薄和工作疏忽,很多敏感、甚至涉密的信息和文件被放在互联网上,最终导致泄密事件的发生。对辖区内互联网网站执行保密检查,及时发现泄密问题,是各级保密主管部门的重要职责之一。目前普遍采用的纯手工检查及搜索工具查询等方法,很难保证全面、准确、及时的要求。
中孚互联网网站监控系统基于前沿搜索引擎技术、自然语言处理技术、智能分析技术设计开发,能够帮助各级保密主管部门对辖区网站进行有效的涉密检查与监控,及时发现泄密隐患,控制敏感信息在互联网网站的传播。
系统功能:
网站信息抓取
应用网络爬虫(WebSpider)技术,自动抓取指定互联网网站信息。通过网页变化预测算法,能够实现增量网页抓取功能,有效缩短系统后续处理与索引时间,提高系统响应速度。
信息处理与索引
对抓取到的网页、文档等信息进行分类、存储和索引,能够对网页、Office文档、永中办公软件、PDF文档、压缩包(RAR、ZIP)、图片(TIF/JPG)等多种格式信息进行处理。提供全文检索和实时索引服务,便于对信息的进一步筛选和管理。
保密检查与展现
根据预先定义好的嫌疑关键字进行判定,并将判定后的信息展现给监控人员。
数据接口与系统运维
实时监控爬虫和索引服务器集群工作状态,提供上下级数据联动等功能。
系统组成:
外网服务器
外网服务器用于网站信息抓取、信息处理与索引、信息初筛与管理、数据接口与系统运维等。
单向导入设备
用于连接外网部分与内网部分,利用数据二极管技术,将外网部分筛选的嫌疑网页等数据传入内网,并确保传输过程中内网无任何反馈,保障内网数据的安全。
内网服务器
内网服务器用于初筛结果二次分析、保密检查与展现等。
系统特点:
海量网页信息抓取,全面采集
系统采用分布式并行抓取设计,支持亿级别网页监控;海量数据处理能力,充分发挥服务器资源,节省硬件投资。
判定准确率高
通过信息排重、非涉密关键字筛选、涉密嫌疑关键字判定等多级过滤,提高系统判定准确率。
网页变化智能预测,实时分析
系统采用业界领先的网页变化预测算法,可快速获得网站更新内容,缩短系统处理时间,提高系统运行效率。
定向监控网站
运用定向监控技术,控制网站信息抓取范围,减少系统资源浪费。
实时元搜索
系统采用最新技术,对百度贴吧、微博(新浪、搜狐、腾讯、网易)等进行实时搜索,及时发现违规发布信息行为。
自动化设计
系统采用全自动化设计,从网站录入、网页抓取,到涉密嫌疑判定、系统报警,全生命周期无需人工参与,大大提高网站监控响应速度,降低泄密事件危害。
支持多级监控
支持多级监控节点,各级节点分别对辖区网站执行保密检查,上级节点可实时查看下级节点运行及监控情况。
支持集群部署
可根据监控网站规模,对系统各模块进行动态扩展,实现集群部署模式,满足各单位网站监控需求。
清晰统计分析报告,实时报警
系统对网页数量、嫌疑网页数量等按月份分组展示;当发现嫌疑网页手机软件开发
时,最终判定结果将通过监控平台等多种方式向监控人员报警。报警取证
系统支持报警网页取证功能,取证准确、方便,处理、批示一目了然。
内外网隔离
独有的单向传输设备将敏感信息导入内网,防止二次泄密。
“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
热门文章
使用“扫一扫”即可将网页分享至朋友圈。