<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>LBS007在线网赚研究室 &#187; SEO搜索引擎优化</title>
	<atom:link href="http://www.lbs007.com/category/seo%e6%90%9c%e7%b4%a2%e5%bc%95%e6%93%8e%e4%bc%98%e5%8c%96/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.lbs007.com</link>
	<description>研究与推广网赚知识:风险投资、菜鸟培训、SEO搜索优化、营销推广、博客论坛营销、项目策划、高手进阶、理财指导、计算机技术支持。</description>
	<lastBuildDate>Sun, 02 Oct 2011 13:26:42 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>如何写robots.txt一分钟教程 Robots META标签写法使用教程</title>
		<link>http://www.lbs007.com/2010/03/11/%e5%a6%82%e4%bd%95%e5%86%99robots-txt%e4%b8%80%e5%88%86%e9%92%9f%e6%95%99%e7%a8%8b-robots-meta%e6%a0%87%e7%ad%be%e5%86%99%e6%b3%95%e4%bd%bf%e7%94%a8%e6%95%99%e7%a8%8b/?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=%25e5%25a6%2582%25e4%25bd%2595%25e5%2586%2599robots-txt%25e4%25b8%2580%25e5%2588%2586%25e9%2592%259f%25e6%2595%2599%25e7%25a8%258b-robots-meta%25e6%25a0%2587%25e7%25ad%25be%25e5%2586%2599%25e6%25b3%2595%25e4%25bd%25bf%25e7%2594%25a8%25e6%2595%2599%25e7%25a8%258b</link>
		<comments>http://www.lbs007.com/2010/03/11/%e5%a6%82%e4%bd%95%e5%86%99robots-txt%e4%b8%80%e5%88%86%e9%92%9f%e6%95%99%e7%a8%8b-robots-meta%e6%a0%87%e7%ad%be%e5%86%99%e6%b3%95%e4%bd%bf%e7%94%a8%e6%95%99%e7%a8%8b/#comments</comments>
		<pubDate>Thu, 11 Mar 2010 12:39:26 +0000</pubDate>
		<dc:creator>admin</dc:creator>
				<category><![CDATA[SEO搜索引擎优化]]></category>
		<category><![CDATA[META]]></category>
		<category><![CDATA[Robots]]></category>

		<guid isPermaLink="false">http://www.lbs007.com/?p=798</guid>
		<description><![CDATA[robots.txt基本介绍 robots.txt是一个纯文本文件，在这个文件中网站管理者可以声明该网站中不想被robots访问的部分，或者指定搜索引擎只收录指定的内容。 当一个搜索机器人（有的叫搜索蜘蛛）访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果存在，搜索机器人就会按照该文件中的内容来确定访问的范围；如果该文件不存在，那么搜索机器人就沿着链接抓取。 另外，robots.txt必须放置在一个站点的根目录下，而且文件名必须全部小写。 首先要说： robots.txt很简单 学习robots主要搞明白下面3个问题： 1. robots是什么？ 2. robots有什么作用？ 3. 如何写robots.txt？ robots是什么？ kyw的回答： robots就是一个必须放在网站根目录、让搜索蜘蛛读取的txt文件，文件名必须是小写的”robots.txt”。 robots有什么作用？ kyw的回答：通过robots.txt可以控制SE收录内容，告诉蜘蛛哪些文件和目录可以收录，哪些不可以收录。 如何写robots.txt 用几个最常见的情况，直接举例说明： 1. 允许所有SE收录本站：robots.txt为空就可以，什么都不要写。 2. 禁止所有SE收录网站的某些目录： User-agent: * Disallow: /目录名1/ Disallow: /目录名2/ Disallow: /目录名3/ 3. 禁止某个SE收录本站，例如禁止百度： User-agent: Baiduspider Disallow: / 4. 禁止所有SE收录本站： User-agent: * Disallow: / 5. 加入sitemap.xml路径,例如： Sitemap: http://www.seotest.cn/sitemap.xml 参考资料：常见搜索引擎机器人Robots名字 名称 搜索引擎 Baiduspider http://www.baidu.com Googlebot http://www.google.com MSNBOT http://search.msn.com ia_archiver http://www.alexa.com robots meta的一些介绍： Robots META标签则主要是针对一个个具体的页面。和其他的META标签（如使用的语言、页面的描述、关键词等）一样，Robots META标签也是放在页面的＜head＞＜/head＞中，专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。 [...]]]></description>
			<content:encoded><![CDATA[<p><strong>robots.txt基本介绍</strong></p>
<p>robots.txt是一个纯文本文件，在这个文件中网站管理者可以声明该网站中不想被robots访问的部分，或者指定搜索引擎只收录指定的内容。</p>
<p>当一个搜索机器人（有的叫搜索蜘蛛）访问一个站点时，它会首先检查该站点根目录下是否存在robots.txt，如果存在，搜索机器人就会按照该文件中的内容来确定访问的范围；如果该文件不存在，那么搜索机器人就沿着链接抓取。</p>
<p>另外，robots.txt必须放置在一个站点的根目录下，而且文件名必须全部小写。</p>
<p><span id="more-798"></span></p>
<p>首先要说：</p>
<h1>robots.txt很简单</h1>
<p>学习robots主要搞明白下面3个问题：<br />
1. robots是什么？<br />
2.  robots有什么作用？<br />
3. 如何写robots.txt？</p>
<h3>robots是什么？</h3>
<p>kyw的回答：  robots就是一个必须放在网站根目录、让搜索蜘蛛读取的txt文件，文件名必须是小写的”robots.txt”。</p>
<h3>robots有什么作用？</h3>
<p>kyw的回答：通过robots.txt可以控制SE收录内容，告诉蜘蛛哪些文件和目录可以收录，哪些不可以收录。</p>
<h3>如何写robots.txt</h3>
<p>用几个最常见的情况，直接举例说明：<br />
1.  允许所有SE收录本站：robots.txt为空就可以，什么都不要写。</p>
<p>2. 禁止所有SE收录网站的某些目录：</p>
<p><code>User-agent: *<br />
Disallow: /目录名1/<br />
Disallow: /目录名2/<br />
Disallow: /目录名3/<br />
</code><br />
3.  禁止某个SE收录本站，例如禁止百度：</p>
<p><code>User-agent: Baiduspider<br />
Disallow: /<br />
</code><br />
4.  禁止所有SE收录本站：</p>
<p><code>User-agent: *<br />
Disallow: /<br />
</code><br />
5.  加入sitemap.xml路径,例如：</p>
<p><code>Sitemap: http://www.seotest.cn/sitemap.xml<br />
</code><br />
<strong>参考资料：常见搜索引擎机器人Robots名字</strong><br />
名称  搜索引擎<br />
Baiduspider http://www.baidu.com<br />
Googlebot http://www.google.com<br />
MSNBOT http://search.msn.com<br />
ia_archiver http://www.alexa.com</p>
<p><strong>robots meta的一些介绍：</strong></p>
<p>Robots META标签则主要是针对一个个具体的页面。和其他的META标签（如使用的语言、页面的描述、关键词等）一样，Robots  META标签也是放在页面的＜head＞＜/head＞中，专门用来告诉搜索引擎ROBOTS如何抓取该页的内容。</p>
<p><strong>Robots META标签的写法：</strong></p>
<p>Robots  META标签中没有大小写之分，name=”Robots”表示所有的搜索引擎，可以针对某个具体搜索引擎写为name=”BaiduSpider”。  content部分有四个指令选项：index、noindex、follow、nofollow，指令间以“,”分隔。</p>
<p>INDEX 指令告诉搜索机器人抓取该页面；</p>
<p>FOLLOW 指令表示搜索机器人可以沿着该页面上的链接继续抓取下去；</p>
<p>Robots Meta标签的缺省值是INDEX和FOLLOW，只有inktomi除外，对于它，缺省值是INDEX,NOFOLLOW。</p>
<p>这样，一共有四种组合：</p>
<p>＜META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”＞<br />
＜META NAME=”ROBOTS”  CONTENT=”NOINDEX,FOLLOW”＞<br />
＜META NAME=”ROBOTS”  CONTENT=”INDEX,NOFOLLOW”＞<br />
＜META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”＞</p>
<p>其中</p>
<p>＜META NAME=”ROBOTS” CONTENT=”INDEX,FOLLOW”＞可以写成＜META NAME=”ROBOTS”  CONTENT=”ALL”＞；</p>
<p>＜META NAME=”ROBOTS” CONTENT=”NOINDEX,NOFOLLOW”＞可以写成＜META NAME=”ROBOTS”  CONTENT=”NONE”＞</p>
<p>目前看来，绝大多数的搜索引擎机器人都遵守robots.txt的规则，而对于Robots  META标签，目前支持的并不多，但是正在逐渐增加，如著名搜索引擎GOOGLE就完全支持，而且GOOGLE还增加了一个指令“archive”，可以限制GOOGLE是否保留网页快照。例如：</p>
<p>＜META NAME=”googlebot” CONTENT=”index,follow,noarchive”＞</p>
<p>表示抓取该站点中页面并沿着页面中链接抓取，但是不在GOOLGE上保留该页面的网页快照。</p>
<p>非LBS007在线原创，LBS007在线只是参考网络信息做收集整理。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.lbs007.com/2010/03/11/%e5%a6%82%e4%bd%95%e5%86%99robots-txt%e4%b8%80%e5%88%86%e9%92%9f%e6%95%99%e7%a8%8b-robots-meta%e6%a0%87%e7%ad%be%e5%86%99%e6%b3%95%e4%bd%bf%e7%94%a8%e6%95%99%e7%a8%8b/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

