加载中 ...
首页 > 解决方案 > 基础软件 正文

TBS政府门户网站解决方案

2019-03-25 12:48:40 来源:沈阳软件公司 作者:沈阳软件开发

4.1 电子邮件系统

金信桥电子邮件系统是金信桥公司研发并推出的具有自主版权的邮件服务器软件,具有如下功效特点:

 ● 具有完整的邮件系统功效,支持POP3收取和SMTP发送; 
 ● 具有完善的系统宁静,用户密码经加密后存入用户认证服务器,邮件系统用户和操作系统用户无关,可以实现和门户网站的统一身份认证; 
 ● WEBMAIL界面支持加密SSL 传输; 
 ● 具有完善的WEBMAIL邮件处置惩罚功效; 
 ● 具有完善的可治理特征,利便的举行用户治理和参数设置; 
 ● 具有强盛的日志治理功效,便于对使用情形举行详细的统计; 
 ● 具有强盛的抗灾难能力和恢复手艺,保证了系统的宁静运行;
 ● 具有开放的系统系统结构,提供了开放的接口和其他系统对接,同时利便了用户自界说界面。 

 

4.2 站内检索系统

对于一个网站的评估,往往所做的第一个事情就是检察该网站是否有站内检索功效及站内检索功效的有用性。对于政府门户网站来讲,一个有用的站内检索工具能够让群众更利便的找到所体贴的内容,使政府网站真真正正地施展其作用,真正成为政府和群众之间的一道桥梁。

TBSSITESE站内检索系统是金信桥公司研发的一款用于针对网站页面及文件举行内容抓取并建设索引的专业检索引擎。

专业的搜索引擎一直专注于提升用户的体验度,其用户体验度则反映在三个方面: 准、全、快 。用专业术语讲是:查准率、查全率和搜索速率(即搜索耗时)。其中最易到达的是搜索速率,由于对于搜索耗时在1秒以下的系统来说,会见者很难分辨其快慢了,更况且另有网络速率的影响。因此,对搜索引擎的评价就集中在了前两者:准、全。中文搜索引擎的“准”,需要保证搜索的前几十条效果都和搜索词十分相关,这需由“ 分词手艺 ”和“ 排序手艺 ”来决议。

中文分词手艺属于自然语言处置惩罚手艺领域,就是通过盘算机对一句话当中的一连文字是否为词的判断历程。众所周知,英文是以词为单元的,词和词之间是靠空格离隔,而中文是以字为单元,句子中所有的字连起来才气形貌一个意思,能否准确的对中文信息中的内容举行准备分词,很大水平上决议了检索效果的准确性。现有的分词算法可分为三大类:基于字符串匹配的分词要领、基于明白的分词要领和基于统计的分词要领,TBSSITESE融合了以上三种分词算法,同时联合歧义词识别手艺和新词识别手艺,大大的提高了中文分词的准确性。

对于搜索引擎来说,最主要的并不是找到所有效果,由于在上百亿的信息中找到所有效果没有太多的意义,没有人能看得完,最主要的是把最相关的效果排在最前面,这也称为相关度排序,即排序手艺的现实应用。

中文搜索引擎的“全”则需保证不遗漏某些主要的效果,而且能找到最新的网页,这需要搜索引擎有一个强盛的网页网络器,一样平常称为“网络蜘蛛”,也有叫“网页机械人”。 网络蜘蛛即Web Spider,是一个很形象的名字。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个网页(通常是首页)最先,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。

在抓取网页的时间,网络蜘蛛一样平常有两种计谋:广度优先和深度优先。广度优先是指网络蜘蛛会先抓取起始网页中链接的所有网页,然后再选择其中的一个链接网页,继续抓取在此网页中链接的所有网页。这是最常用的方式,由于这个要领可以让网络蜘蛛并行处置惩罚,提高其抓取速率。深度优先是指网络蜘蛛会从起始页最先,一个链接一个链接跟踪下去,处置惩罚完这条线路之后再转入下一个起始页,继续跟踪链接。这个要领有个优点是可以网络蜘蛛在抓取的时间抓取的内容更全。TBSSITESE可以凭据抓取站点的差别,让用户凭据站点情形自主的选择抓取计谋,从而尽可能地知足了性能与效果之间的平衡。

通过TBSSITESE对抓取回来的内容举行剖析,抓取的内容是文本文件。对于网络蜘蛛来说,抓取下来网页包罗种种花样,包罗html、图片、doc、pdf、多媒体、动态网页及其它花样等,通过对文件信息(包罗网页所在URL、编码类型、网页内容包罗的要害词、要害词位置、天生时间、巨细、与其它网页的链接关系等)的提取,并凭据一定的相关度算法举行大量庞大盘算,获得每一个网页针对网页内容中及超链中每一个要害词的相关度(或主要性),然后用这些相关信息建设网页索引数据库。

“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。