展会信息港展会大全

什么是用搜索引擎搜不到的
来源:互联网   发布日期:2006-11-21   浏览:542次  

导读:搜索引擎9238 没有搜索引擎是万万不能的,但搜索引擎不是万能的; 有些内容,网上明明存在,但是你用搜索引擎搜不到。如果事先理解搜索引擎能做的和不能做的,你就可以设计更佳的搜索策略。而搜索之前思考一下搜索策略,是搜索成功最关键的一步。 ......

搜索引擎9238

没有搜索引擎是万万不能的,但搜索引擎不是万能的;

有些内容,网上明明存在,但是你用搜索引擎搜不到。如果事先理解搜索引擎能做的和不能做的,你就可以设计更佳的搜索策略。而搜索之前思考一下搜索策略,是搜索成功最关键的一步。

这样的内容,主要有3类:======================

1、网上有,但是搜索引擎库里没有------------------------------------------------------

1.1 spider未能正确处理的网页性质及文件类型(如flash、script、ps、某些动态网页及frame、数据库)1.2 没有指向链接的孤岛网页1.3 spider访问时因为某些原因正好是死链接1.4 被认为是劣质网页而不抓1.5 因为/色情/反动/spam/等问题而不抓的非法网页1.6 需要输入用户名、密码方可打开的网页1.7 网站用robots协议拒绝搜索引擎抓取的网页1.8 搜索引擎还未来得及抓取的新网页1.9 gopher、newsgroups、Telnet、ftp、wais等非http信息1.10 网站数据库做得太差劲,spider一抓就宕,只好不抓

2、搜索引擎库里有,但是未能正确索引网页中信息------------------------------------------------------

2.1 分词引起误差2.2 图型中的文字信息你看得懂但搜索引擎看不懂2.3 停用词等搜索引擎故意不索引的信息2.4 搜索引擎对某些网页有选择的索引,未索引全部网页信息

3、搜索引擎正确索引了网页中信息,但和你用的关键词不同-------------------------------------------------------

3.1 你用的搜索关键词中含有错别字3.2 网页作者用了错别字3.3 没有错别字,但网页作者用的词汇和你的关键词不同,毕竟,文字的特性,允许有n种方式表达同一种信息3.4 简体繁体不同编码

赞助本站

人工智能实验室

相关热词:

上一篇:搜索例举
相关内容
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港