‘站内SEO’ 分类的存档
前一段时间,Google的搜索结果中,部分网站原本展示URL的地方被换成了面包屑。如图:
以往显示 www.dhgate.com/wholesale+dresses.html 的地方,被Google用面包屑代替了:www.dhgate.com > Apparel > Women’s Clothing。这样一来,用户可以选择点击进入的页面就从单一的一个搜索结果页面增加到了与这个搜索结果页面相关的上级目录页面。而且这样也让用户更加清楚的了解这个搜索结果页面在整个网站中的定位。
那么Google的这次调整需要我们注意什么呢?
1. 所有页面都应该加上面包屑导航。
2. 网站应该有清晰的目录结构。
3. 无论是目录名称还是文件命名,在准确的基础上,尽量简短。
以敦煌网的wholesale dresses为例,这个搜索结果展示了首页(www.dhgate.com),一级目录(Apparel),二级目录(Women’s Clothing)和搜索结果(Wholesale Dresses)这4个不同的链接入口。如果二级目录的名称为Wholesale Women’s Clothing,那么Google搜索结果可能因为面包屑过长,而无法显示一级目录的入口了。
Google的这次搜索结果展示的调整并不因为用面包屑代替了URL,而说明URL的重要性下降。首先只有权重高,目录清晰的网站才有机会直接展示面包屑。此外,一个网站有此调整的网站,也不是所有的目录页面都直接展示面包屑。如图:
总体来说,Google在不断的改善用户体验。作为SEOer,我们也应该随时拥抱变化,提供给来访者更好的用户体验。
网站地图 sitemap 对于网站,特别是大型网站来说,是非常有必要的。网站地图 sitemap 一般有两种格式,一种是html静态页面的形式呈现,一种是以xml的格式直接提交到搜索引擎,比如说Google Webmaster Tool. 它们的目的都是为了更有效的提高网站页面的收录。
如果没有网站地图 sitemap,搜索引擎会顺着首页和来自其他网站的反向链接,一页一页的,一个链接一个链接的,带有随意性的爬取页面。而网站地图sitemap的作用就是告诉搜索蜘蛛集中注意力,快速有效的直接抓取你认为最有意义的页面。收录的速度提高了,排名更新也就加快了。
制作网站地图sitemap的时候需要注意一下几点:
1. Sitemap.html静态页面的入口应该出现在你的网站的每个页面。
2. 每一个sitemap页面最好不要超过200个链接,控制在100个链接内是更好的。
3. Sitemap页面的代码应该尽量的朴实无华,用最简单的代码,清晰的结构展示页面链接。
4. 不用专门为网站地图sitemap页面添加反向链接。
最后补充一点sitemap对SEO的好处:
Sitemap页面内包含的链接,将被Google搜索引擎作为有权威的页面。(因为sitemap链接都是站长主动制作和提交的)所以,当遇到重复内容页面的时候,Google将以sitemap里面的链接的页面作为权威页面。这样,sitemap相当于在一定程度上起到了canonical的作用。
关于SEO关键词的使用,很多人认为只要关键词重复得越多就越好,其实不是这样的。首先,一切标题和内容都应该自然和准确。用户喜欢自然,独特,有价值的内容,所以从用户体验上来讲,在标题和文字内容里面堆积SEO关键词是很不好的。此外,单从Google搜索引擎优化的角度讲,过多的关键词使用也未必是好事。
在Canonical 链接标签和重复页面问题中,我对比了Canonical和301重定向,这里我再针对301重定向说几句。
1. 能不搬家最好不要搬家,能不用301重定向,就最好不要用。
2. 301重定向是搜索引擎公开推荐的将一个网页指向另外一个网页的最有效的方法,但是301重定向仍然会导致1%-10%的PageRank的损失。就好像将一锅粥倒到另外一个锅里,始终会有贴在锅底的粥被浪费了。
3. 302重定向不仅仅是临时性的301重定向,302重定向传递非常少的甚至不传递任何PageRank值。
4. 使用Meta刷新有着和301重定向非常类似的传递Page Rank的功效,但是Google并没有官方推荐它。
以前,我写过一篇博客关于如何写好标题,今天再强调一下关于标题的SEO注意事项。
一个好的SEO标题一般为如下格式:
第一关键词 – 第二关键词 | 网站品牌
或者
网站品牌 | 第一关键词 – 第二关键词
如果用一个自然的短语将第一关键词和第二关键词结合起来当然是最好的了,这里我们主要是讨论关键词和品牌摆放的位置。首先要明确的是,所有的页面标题里面应该出现该网站的品牌,比如说 SEOmao – 搜猫 是本网站的品牌。那么这个品牌到底出现在标题的最前面还是最后面呢?参考以下几个方面:
1. 该页面所针对的优化关键词是否有非常强的竞争?
如果此关键词在Google排名中竞争非常激烈,那么建议主打关键词最好放在标题的最前面,因为这对SEO排名的确有正面影响。如果该关键词在Google排名中竞争不太激烈,而你的网站品牌有一定影响力,那么最好把品牌放在最前面,以提高用户的注意力和信任度。
2. 该页面的标题有多长?
比如说一个产品描述页面,一般来说站长会用该产品的标题作为这个页面的标题,那么如果这个产品的标题本来就很长,这个页面的标题也会很长。但是Google只读取网页标题的前65-70个字符,所以最好把网站的品牌放在最前面,不然搜索结果完全没有足够的位置显示它。
PageRank Sculpting是一种高级SEO手法,通过对Page Rank流向的操控,来得到最大SEO效果。从字面上理解,Sculpting是雕刻,雕塑的意思,这里主要是指对于Link Juice的操控。
如果从SEO的角度来筛选一个好域名呢?
1. 域名最好是一个完整的搜索关键词或者搜索关键词组。
特别是这个域名如果刚好是完整的一个关键词或者词组,比如说diamond.com, shopping.com或者SEObook.com的话,那么当用户在搜索”diamond”, “shopping”, 或者搜索”seo book”的时候,Google会给与该域名非常高的权重。
2. 如果不是完整的搜索关键词,这个关键词也最好能够出现在域名中。
比如说SEOmao.com,如果光从SEO的角度分析,会比somao.com还要更容易针对SEO这个关键词进行优化。
3. 不要为了节约钱,而选择.info的域名.
除非域名是一个非常好的完整关键词,比如说SEO.info,不然最好不要为了节约几美金而选择便宜的域名。从各种测试结果来看,Dot Com的域名的SEO表现任然是最好的。Dot Gov 和 Dot Edu 当然更好了,但是我想一般的朋友是没有注册的机会吧。
4. 不要为了SEO,而选择过长的关键词组,并且用大量的中划线隔开。
类似于www.chinese-google-search-engine-opitmization-service.com的域名,几乎不用打开网站,就会被用户和搜索引擎当做spamming site来对待。如果希望使用中划线和关键词组,最好关键词不要超过3个,中划线不要超过2个。
5. 注册的时候,一次性多注册几年。
就好像告诉搜索引擎你是非常认真的,有长期的规划一样。如果你注册一个新域名,如果多注册几年,那么更容易得到搜索引擎的信赖。
关于Robots.txt的几点常用SEO资料:
1. 搜索蜘蛛都是贪婪的。原则上讲,除非搜索蜘蛛被事先告知,不然它们认为它们可以爬取和收录任意它们可以访问的页面。
2. Robots.txt文件就是是用来告诉搜索蜘蛛对于一个网站的页面,哪些可以收录,哪些不可以。
3. 每个搜索蜘蛛都有自己的名字,而星号(*)代表所有的搜索蜘蛛。如果你对某一个搜索蜘蛛,比如说GoogleBot采取了与其他搜索蜘蛛不同的指令的时候,这个指令优先于星号(*)指令。
User-agent:*
Disallow: /admin/
Disallow: /pr/
User-agent: googlebot
Disallow: /admin/
如上所示,一段指令禁止所有的蜘蛛收录pr文件夹,第二段指令没有禁止GoogleBot收录pr文件夹,那么当GoogleBot来访的时候,它会忽略你的第一段指令。
4. Robots.txt不能完全的避免你的页面显示在Google搜索结果页面中,因为这些页面可能存在其他外部反链接。最好的避免某些页面显示在Google搜索结果页面的方法是在每页代码中使用 robots nonindex meta tag。如:
<meta name=”robots” content=”noindex”>
<meta name=”robots” content=”noindex,nofollow”>
5. 如果你没有Robots.txt文件,那么当搜索蜘蛛抓取Robots.txt文件的时候,你的服务器会自动反馈404错误。所以,如果你不想使用Robots.txt来引导搜索蜘蛛,你也最好上传一个空白文件作为你的Robots.txt。
6. 此外,你还可以在Robots.txt中指定你的Sitemap地址。
7. 就算使用了Robots.txt不让Googlebot收录这些页面,它们任然为消耗Page Rank。避免这些没有被收录的页面消耗Page Rank,最好的办法是使用 rel=nofollow。
常用Robts.txt 格式:
允许所有的搜索蜘蛛收录所有页面:
User-agent:*
Disallow:
禁止所有的搜索蜘蛛收录任何页面:
User-agent:*
Disallow:/
禁止所有的搜索蜘蛛收录一个文件夹,但是允许收录该文件夹里面的一个文件:
User-agent:*
Disallow:/folder1/
Allow:/folder1/file1.html
如果你想用Robots.txt文件禁止GoogleBot收录你网站上任何一个以.php结尾的页面,那么你可以用如下格式:(后面跟着$符号)
User-agent: Googlebot
Disallow: /*.php$
如果你想禁止所有搜索蜘蛛收录任何链接里面带问号(?)的页面,那么你可以用如下格式:
User-agent: *
Disallow: /*?
如果你想禁止所有搜索蜘蛛收录任何带private单词的链接,那么你可以使用如下格式:
User-agent: *
Disallow: /*private*
如果你想禁止所有带问号(?)并且带参数的链接,但是允许搜索蜘蛛收录以问号(?)结尾的链接,那么你可以使用以下格式:
User-agent: *
Allow: /*?$
Disallow: /*?
更多关于Robots.txt的写法,请参考 Googlebot 资料。
大型网站的站内SEO的优化主要注意2个方面:
1. 页面针对关键词的优化。
2. 站内内部链接结构的优化。
关于页面针对关键词的优化:
整个网站应该有一个终极目标关键词,然后针对这个关键词设置一个关键词云,或者是关键词金字塔。我们首先要明确:
1. 整个网站针对每个关键词只选择一个页面来进行优化,集中资源。
2. 被选中的页面针对那个关键词的优化必须准确。
达到页面针对关键词的准确优化,我们必须做到:
1. 标题 Title: SEO标题里面关键词最好自然的重复2次. 2次重复不要连在一起,也不要单纯的重写一次。标题的前4个关键词很重要。短语比单词重复更好。
2. Meta Description: Meta Description不会影响页面的排名,但是会影响CTR。Meta Description是完全为用户写的,搜索关键词会被显示成粗体。所以这个必须要写得吸引人。使用带有关键词的句子。
3. <h1>:<h1>是这个页面内容的标题。非常的重要。我们非常多的页面以前没有<h1>,所以关键词的相关性始终上不去。这次改版的成效中<h1>的明确起到了很大的作用。<h1>最好只用一次。
4. <h2>,<h3>,<h4>: 这些属于副标题。作用在<h1>之后。最好是使用<h1>关键词的Cloud来显示。比如说<h1>是 Wholesale Clothing,<h2>可以为Top Wholesale Clothing Categories. 副标题可以为多个,但是不要重复。
5. 静态页面: 页面应该是某种程度的静态页面,而且有充足的文字内容和链接。避免过多的图片和Flash.页面如果有500-800字左右的文字叙述,Google收录 性特别好。每页的第一段文字(前100个单词)对于这个页面非常重要,确保里面有足够的该页面所针对的关键词。页面html代码显示的前100个文字单词 中,关键词至少出现2次。整篇文章按照长度的不同,关键词至少重复出现3-5次以上。但是keyword density 本身不是一个至关重要的指标,也没有人能够给出准确的keyword density。
5.链接关键词: 链接关键词Anchor应该是有意义的关键词,最好包括这个页面所针对的关键词的cloud,但不是完全的关键词本身。更不是像“点击这里”, “Click Here”之类的无意义的单词。此外,关键词需要准确。“Apparel, Clothing”如果和在一起作关键词,的确既包含了Apparel,又包含了Clothing,搜索这两个关键词的时候都有可能出现在Google搜 索结果里面。但是因为关键词不准确,所以和只针对一个关键词的竞争对手比较,处于弱势。
6. URL改写:网站页面的链接应该是某种程度上的静态链接。页面的url链接SEO要避免使用下划线,需要用中划线来代替空格,加号是第二最佳选择。千万不要在链接中包含空格。关键词应该出现在url里面。
7. Alt标签:确保网站的图片使用alt 标签。Alt标签不能反复堆积关键词,很有可能将被认为是作弊。
8. 文字vs图片: 能用文字链接的地方尽量不要用图片链接,能用文字叙述的地方也不要用图片或者flash。虽然Alt标签对图片有一定程度的解释,但是肯定没有文字链接有效果的。比如:factory.dhgate.com的那个大标题应该用背景图片+文字。
关于站内内部链接结构的优化:
理解链接结构的优化,首先要理解PR算法。
关于Page Rank:
1. Page Rank代表的是重要性和受欢迎程度。
2. Page Rank和排名没有直接的关系,因为它没有相关性。
3. 每一个页面只能针对另外一个页面进行一次投票。
4. 页面不能对自己投票。
就好像一个不知疲倦的小机器人不停的点它访问过的页面的链接,在这种随即的点击下被访问的次数越高,说明这个页面受欢迎的程度越高。所以这个页面以外的指向它的链接,所谓反链接对一个页面的PR至关重要。
综合以上知识,我们需要注意的站内链接结构的优化:
1. 每个页面的链接数量需要有控制,一般页面的导出链接数量最好控制在80-100以内。
2. Nofollow可以帮助调控一个页面的导出链接数量。
3. 面包屑导航意义重大,链接关键词也很重要。
4. 同一个页面不要有多个链接指向同一个页面。
5. 页面自身加上自我链接的关键词,不会有任何SEO作用,而且用户体验非常不好。
6. 懂得什么地方使用javascript。
7. 用robots.txt来指导搜索蜘蛛。
8. [...]
