加载中 ...
维思比智能网络信息采集系统
网络信息采集系统
VSP Spider与通用搜索引擎的区别
通用搜索是面向公众的水平搜索系统,VSP Spider是更适用于行业应用的垂直搜索系统。通用搜索覆盖的网站范围非常广,如Google的网页数量就超过了100亿,而VSP Spider只是针对一些领域相关的网站或栏目,网页数量一般在千万以内。
VSP Spider更加关注采集网页的质量,需要避免采集任何无用的垃圾网页。通用搜索只需要分析出网页中的文字内容,而VSP Spider则需要精确提取应用系统所关心的网页中指定的元数据信息。
对于VSP Spider已采集网页的分类、标引等数据加工的要求更加专业和精确
通用搜索提供基于关键词的全文检索,结果只提供TOP的若干个,而VSP Spider需要提供包括元数据、全文、智能扩展等全方位检索功能,并要求返回全部的查询结果。
维思比智能网络信息采集系统(VSP Spider)的主要功能:实时监控和采集特定主题或领域内的目标网站的相关网页,分析采集网页的源文件内容并精确获取主题相关的正文和元数据信息,对获取的信息进行过滤、转义、消重和自动分类等数据加工处理,将结果存储到指定的数据库系统或XML格式文件中,提供自动获取信息的数据通道。
维思比智能网络信息采集系统的目标:全面获取主题或领域内的所有主题相关网页,精确分析并获取所有描述主题需要的元数据信息沈阳微信小程序
VSP Spider与通用搜索引擎的区别
通用搜索是面向公众的水平搜索系统,VSP Spider是更适用于行业应用的垂直搜索系统。通用搜索覆盖的网站范围非常广,如Google的网页数量就超过了100亿,而VSP Spider只是针对一些领域相关的网站或栏目,网页数量一般在千万以内。
VSP Spider更加关注采集网页的质量,需要避免采集任何无用的垃圾网页。通用搜索只需要分析出网页中的文字内容,而VSP Spider则需要精确提取应用系统所关心的网页中指定的元数据信息。
对于VSP Spider已采集网页的分类、标引等数据加工的要求更加专业和精确
通用搜索提供基于关键词的全文检索,结果只提供TOP的若干个,而VSP Spider需要提供包括元数据、全文、智能扩展等全方位检索功能,并要求返回全部的查询结果。
“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
热门文章
分享到微信朋友圈
×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。
使用“扫一扫”即可将网页分享至朋友圈。