• 互联网上的信息急剧膨胀,在这DOWNET的信息中,各类信息混杂在一...
  • 垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等...
  • 全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立...
      

中文分词more

    互联网上的信息急剧膨胀,在这DOWNET的信息中,各类信息混杂在一起,要想充分利用这些信息资源就要对它们进行整理,如果由人来做这项工作,已经是不可能的,而如果面对中文信息不采用分词技术,那么整理的结果就过于粗糙,而导致信息结果不可用,例如:“制造业和服务业是两个不同的行业”和“我们生产和服比去年有所增长”中都有“和服”,而被当作同一类来处理,结果是检索“和服”的相关信息,会将他们都检索到,在信息量少的情况下,似乎还能够忍受,如果是DOWNET信息,这样的结果就会出现与“制造业和服务业“不符的信息,令人厌恶。

    通过引入分词技术,就可以使机器对DOWNET信息的整理更准确更合理,在“制造业和服务业是两个不同的行业”中“和服”不会被当做一个词来处理,那么检索“和服”当然不会将它检索到,使得检索结果更准确,效率也会大幅度的提高。


垂直搜索(或信息采集)产品more

    垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的DOWNET信息无序化,垂直搜索引擎则显得更加专注、具体和深入。


跨数据库全文检索more

    全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。


联系电话:(8610)88437103    E-mail: