txt中为Drupal托管的最佳机器人
每天,数以百万计的人使用谷歌图片搜索查找图片,产品和人。如果您使用Drupal的,机会是你没有得到任何这样的流量。
Drupal的robots.txt文件中包含一个重大失误。令人惊讶的是,这个错误已经有好几年了,很少人似乎知道这件事情。
看看从默认的Drupal robots.txt文件的摘录。你能发现这个问题?

默认情况下,每次你上传到您的Drupal站点图像获取“地王”目录中存放的地方。而且,默认情况下,Drupal是从您的“网站”目录中寻找阻止每一个搜索引擎。换句话说,您的影像未获得索引!
如果你有与图像,你希望其他人也找到了Drupal站点,这是一个严重的问题。 (我上周意外发现了这一点,当我发现没有我的Photoshop文字特效的网站上的图像都拿到由谷歌索引)。
为了说明这个问题是多么常见,让我们快速浏览一下德里斯·布塔特的博客。干了,当然,Drupal的创造者,但他也是一个非常好的摄影师。事实上,德赖斯上传了数千张照片到他的博客,其中包括来自DrupalCon几百张照片和几十个精辟的各种图表。但如何将这些图像有许多谷歌实际上索引?
只有13.遗憾的是,德赖斯的robots.txt文件中包含了标准的“不允许:/网站/”行。
如果德赖斯受到影响,你可能是,太。运行的电子商务网站?你的整个产品线可从谷歌图片搜索丢失。有一个摄影博客?雅虎和Bing都可能忽略了您发布的一切。
如果没有一个可以搜索你的形象,你从字面上转身离开的流量。而且不只是图像搜索流量:高品质,可转位图像是任何高级网站的一个重要特征。如果你的图片不是可转位,你正在做一个大的搜索引擎优化的错误。
更糟的是,这个问题不只是影响图像。 PDF文件,Flash文件,文本文档,以及其他所有上传进入同一个“网站”文件夹中。谷歌知道如何索引这些文件,但您的robots.txt文件Googlebot的停止冷。
幸运的是,解决办法很简单:从您的robots.txt文件:只是删除“/网站/不允许”。该文件位于你的主目录的Drupal,可与标准文本编辑器进行编辑。谷歌应该拿起在几天之内的变化,并开始后不久索引文件。
固定robots.txt文件应该是未来的Drupal点释放优先。这是一个简单的解决方案的一个主要问题。幸运的是,有人已经在Drupal.org所造成的问题。不幸的是,一直得不到解决一年多了。让我们来改变这种状况。

更新:一个为Drupal 6补丁发布于12月12日。如果你正在运行的Drupal 6.20或更高版本(包括Drupal的7),这个问题不再影响你。
你有没有发现这篇文章有帮助吗?看看我的Drupal代管审查。
作者:John于2010-08-30