3. 减除无关资料
如果要避免搜索某个词语,可以在这个词前面加上一个减号(“-”, 英文字符)。但在减号之前必须留一空格。Sogou查询非常简洁方便,只需输入查询内容并敲一下回车键 (Enter),或单击“搜狗搜索”按钮即可得到最相关的资料。
4. 在指定网站内搜索
如果想知道某个站点中是否有自己需要找的东西,可以把搜索范围限定在这个站点中,提高查询效率。在想要搜索指定网站时,使用site语法,其格式为:查询词+空格+site:网址。例如,只想看搜狐网站上的世界杯内容,就可以这样查询: 世界杯 site:sohu.com 。搜狗也支持多站点查询,多个站点用"|"隔开,如: 世界杯
site:www.sina.com.cn|www.sohu.com (site:和站点名之间,不要带空格。 )
除了基本站内查询外,搜狗还为站长和网站管理员们提供了更加强大的功能,使用的时候不加关键词,只需要输入“site:站点域名”,就可以查找你的网站在搜狗的收录量。提供的功能包括: 收录查询:输入“site:网站域名”,可以查到站点在sogou的收录情况,如果博客地址,就可以知道你的博客在搜狗的收录情况,比如:17173 Good Feel MC的共享空间
域名后缀:你可以查看一个域名或者子域名下的内容,结果按照重要性排序。比如 “site:cn”是指在所有网站域名最后为cn的收录情况,您可以试着查询一下这些网站:国内公司 政府机关 教育机构
支持https:所有以https:// 开头的网站链接也都能使用站内查询查找,比如: 招商银行一网通主站
端口查询:大部分网站使用80端口,不需要特别指定,但有些开在其他端口,这个时候使用“site:站点域名:端口号”进行查询即可。 海量数据支持:搜狗的站内查询内容丰富,针对您的查询站点,提供全面的数据
5. 文档搜索
在互联网上有许多非常有价值的文档,例如DOC、PDF等,这些文档质量都比较高、相关性强,并且垃圾少。所以在查找信息时不妨用文档搜索。其搜索语法为:查询词+空格+Filetype:格式,格式可以是DOC、PDF、RTF、ALL(全部文档)(搜狗即将支持PPT、XLS格式)。例如:市场分析 filetype:doc,其中的冒号是中英文符号皆可,并且不区分大小写。filetype:doc可以在前也可以在后,但注意关键词和filetype之间一定要有个空格。例如:filetype:doc 市场分析。 filetype语法也可以与site语法混用,以实现在指定网站内的文档搜索。例如在中国农业大学和清华大学网站内搜索有关“中国”的文
档,就可以用:site:www.cau.edu.cn|www.tsinghua.edu.cn filetype:all 中国
五、四大搜索引擎高级语法总结 语法 Link Domain Site Info 功能 查询反向链接 查询反向链接 限定在特定站点中 显示与某链接相关的一系列搜索 Cache 搜索结构内容方面相似的网页 Related 搜索GOOGLE服务器上的缓存 Intitle 标题 Intext inurl Title 正文 URL 针对标题进行搜索 √ √ √ × × √ × × × √ × × × √ × × × × × × √ × × × √ × × × Google √ × √ √ 百度 Yahoo Sogou × √ √ × √ × √ × × × √ × Hostname 限定在特定站点中 URL “” 《》 - 精确搜索url 精确搜索 精确搜索 减去 × √ × √ √ √ √ √ √ √ × √ × √ × × √ × √ √ Filetype 非HTML文件的搜索
√代表支持该功能,×代表没有该项功能
从上面的表格,很容易看出,Google的搜索语法最丰富,其次是百度和yahoo,Sogou的最少。
site——把搜索范围限定在特定站点中
如果你知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。
例如,想查询“豆苗网”网站中关于搜索引擎的内容,就可以这样查询:搜索引擎 site:www.doumiao.net
你可以搜索整个网站,也可以将搜索范围限制在特定的子域或子目录,例如 site:doumiao.net/bbs。
在操作符前放置减号,可从您的搜索中排除网页。 例如,site:doumiao.net -site:doumiao.net/bbs这个搜索可提供 doumiao.net 域上所有已编制索引的网页,但是不包含 doumiao.net/bbs下面的网页。
目前国内的五大搜索引擎百度、Google、Yahoo、有道、搜狗都支持site语法。 注意:
? “site:”后面跟的站点域名,不要带“http://”; ? “site:”后面的冒号是英文输入法中的冒号“:”,不要在中文输入模式下输入“:”
? “site:”和站点名之间,不要带空格。