如何让爬虫不爬某特定页面。很简单,在页面
<head>部分添加<meta name="robots" content="noindex">即可,如果仅仅想屏蔽google的爬虫,则为<meta name="googlebot" content="noindex">SEO学习。比较好的网址是SEOWHY论坛
- sitemap过了20天还是没被收录。要保证sitemap在网站上有入口能访问到,不然是不会收录的。
- 查询收录情况用
site:...,查询某个目录下的收录情况用site:... inurl:...,排除某个条件-inurl:...,仅搜索某个类型的文件filetype:doc OR filetype:pdf,更多参见Search Protocol Reference
未完待续
国外资源:
- SEOMoz.org
- seochat.com
- searchenginewatch.com
- digitalpoint.com
- seobook.com
- webmasterworld.com
- 黑帽SEO: seoblackhat.com/
- Matt Cutts: mattcutts.com/blog/
国内资源:
- SEO每天一贴:www.chinamyhosting.com/seoblog
- 点石互动:www.dunsh.org或者www.dunsh.org/forums
- 关键字密度检测: http://keywords.zzbaike.com/
- 百度指数: http://index.baidu.com
- SEO搜索引擎优化基础教程电子书(PDF) http://doc.zzbaike.com/seo/book/seojcjc.pdf
