什么是垂直搜索引擎?
的有关信息介绍如下:是通过对专业特定的领域或行业的内容进行专业和深入的分析挖掘、过滤筛选,信息定位为更精准的专业搜索。实际上是搜索引擎的细分和延伸,有针对性地为某一特定领域、某一特定人群或某一特定需求提供的专门信息检索服务,以满足用户个性化的信息需求。
垂直搜索引擎能够定向采集与垂直搜索范围相关的网页,对内容相关的以及适于进一步处理的网页进行优先采集。其信息采集可以通过人工设定网址和网页分析等方式共同进行,在定向分字段抽取出所需要的数据并处理后再以某种形式返回给用户。
扩展资料:
垂直搜索引擎主要有四大关键技术
1、聚焦、实时和可管理的网页采集技术
垂直搜索只对局部来源的网页进行采集,采集的网页数量适中。但其要求采集的网页全面,必须达到更深的层级,采集动态网页的优先级也相对较高。在实际应用中,垂直搜索的网页采集技术能够按需控制采集目标和范围、按需支持深度采集及按需支持复杂的动态网页采集。
2、从非结构化内容到结构化数据的网页解析技术
由于垂直搜索引擎服务的特殊性,往往要求按需提供时间、来源、作者及其他元数据解析,包括对网页中特定内容的提取。
3、精、准、全的全文索引和联合检索技术
垂直搜索由于在信息的专业性和使用价值方面有更高的要求,因此能够支持全文检索和精确检索,并按需提供多种结果排序方式。另外,一些垂直搜索引擎还要求按需支持结构化和非结构化数据联合检索。
4、高度智能化的文本挖掘技术
垂直搜索是以结构化数据为最小单位。基于结构化数据和全文数据的结合,垂直搜索才能为用户提供更加到位、更有价值的服务。整个结构化信息提取贯穿从网页解析到网页加工处理的过程。
参考资料来源:百度百科-垂直搜索引擎