招聘信息采集分析系统
目前互联网已经成为计算机、营销、金融等行业重要信息的推广平台。各个行业的企事业单位以及各个行业的人才,除在平面媒体发布招聘与应聘材料之外,更多是通过网络来完成企事业单位的人才引入或个人的求职。如何能够在众多的招聘信息网站中,按照行业的划分、需求的划分进行信息的采集与分析就显得尤为重要。
中讯数网公司的招聘信息采集分析系统主要分为两个部分,一是信息采集器,二是信息分析。具体如下:
信息采集器
中讯数网公司自主研发的招聘采集器是集数据采集与数据分解、导入功能于一体。不但具有强大的采集功能,同时也有强大的数据分解与导入功能。具体特点如下:
• 网站信息采集信息定制;
• 支持自动采集,可定义采集规则,支持静态网站和动态网站数据抓取;
• 至少支持 HTML / MS OFFICE / PDF / XML /TXT 文件的处理与采集;
• 能够自动进行增量采集和定时采集;
• 支持带有用户名 / 密码验证的网站信息采集,支持 Proxy 方式的网站采集;
• 支持不同采集文档的自动编码转换,例如繁简转换、 GB2312 (或 GBK 、 Big5 )与 Unicode 互转等;
• 网站采集支持元数据自动抽取、目录过滤、链接过滤、关键词过滤等多种过滤策略;
• 自动采集支持多种方式的排重功能,例如 URL 、标题等;
采集系统图介入下:
分析系统
主要功能介绍
信息检索
• 支持关键词检索及布尔表达式,支持多种高级检索语法,支持通配符的使用
• 支持二次检索(逐次逼近检索)。可逐步缩小搜索范围,直至达到最小、最准确的结果集
• 搜索结果能够显示文档与检索串的匹配度、标题、所在网址、时间、编码、摘要,并用彩色突出用户的检索串,便于用户判断是否阅读原文
• 至少支持中文、英文、两种语言,搜索结果能够在不同编码之间进行切换
• 支持字段检索及数据库全文检索
• 支持远程建立索引功能
• 在建立索引的同时,系统能够正常访问
• 支持自定义分词
信息自动分类
• 与依赖严格的分类定义规则的传统关键字和布尔操作不同,本架构是建立在基于概念的模式匹配处理之上的,它可以对文档进行分类,自动插入数据标记,发送内容或将其提示给用户,让用户了解与其档案密切相关的信息
• 支持按照企业单位、个人简历、行业信息、特定关键字等属性进行智能分类
信息统计
• 时间趋势统计
• 专题信息统计
“沈阳软件公司”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服QQ:55506560,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
热门文章
使用“扫一扫”即可将网页分享至朋友圈。