站长必知的SEO实用技能
此文章答案提供者为百度负责抓取收录的工程师,以及ITSEO创始人夜息,可谓题题经典!新站必看,老站也未必知道这么详细哦!
01
问:在使用百度统计进行广告追踪的时候,配置的URL链接会很长。这个追踪会不会影响SEO?
答:这种存在多个URL版本的统计代码,SEO肯定有影响。针对这种情况有两个建议,一个是真正Spider爬行和用户显示使用两套url。还有一种是不使用百度统计了,可以改使用谷歌里面的追踪,他可以使用#号链接,事件追踪,参考美团网。所有链接加上事件追踪。如果产生的话,也是通过#号产生,不增加额外参数。
02
问:假如一个页面开始是不符合百度的SEO标准,后来将它改成符合标准,百度多久可以反馈很好的结果?
答:不同的站,贡献流量可能不一样。所以Spider爬行的重点不一样,有的站可能更多去发现新链接,有的站可能去看旧链接。建议推送给百度,像首页这种抓取的话一般没有问题。
03
问:推送多久会有审核,一个星期或者半个月?
答:推送如果说是能够达到抓取标准,立即能抓。
04
问:网站有新老两种URL,交替大概有两年时间,现在旧的URL,跳转到新的URL。因服务器问题,出现半小时断网,之后搜索关键词出现老的url,现在基本用所有的手法恢复不过来,这种情况我们怎么做?
答:用改版工具重新提交一下,确保是改版成功就不会有问题。再发现有问题截屏然后反馈给工程师这边追查。
05
问:因为网站使用境外域名(暂时变换不了),不知道有没有什么办法可以更好的提高搜索量或者抓取量?
答: 如果是pc页面的话 会算到pc的索引量里面。和使用什么工具打开没有关系。
06
问:有的网站注册使用了很多域名,很多域名是并不想用户搜索出来的。现在取消了这些域名,但是还能搜出来,关掉过一次,后来没有效果,不知道这个怎么处理?
答:如果不需要那些站吗?可以把那些关掉就可以了。新域名在短暂时间的关闭,可能给用户调起一个老域名,当这一个域名关闭的情况下,我们不会给用户做长线。也不会找到这些东西。
07
问:网站是母婴类网站,在PC端上搜索流量很差。想问有没有方法?
答:类似像医疗、养生、保健、母婴这样的问题,百度对搜索结果的展现是非常谨慎。百度只给优质网站开放他们的展现可能性,网站在很长时间内拿不到流量都非常有可能。如果网站在SEO上没有出现很大问题,可以审视内容方面是否都在竞争一些热门词。建议整个网站的权重和流量达到一定规模之后,再做热门词。如果一开始做这样的关键词,在网站信誉度不是很高的情况下,就会出现没有流量的情况。这种情况下,网站最好找到自己的一个差异化跟相关的词可能会更好。
08
问:网站是教育行业的,现在通过官网的认证,就是安全或者权威性的认证,认证之后会不会有潜在的特殊看待或者是无所谓。
答:认证这事比如说你是真的,还有一个假的,从用户的感知来讲你是官网。
09
问:数据化的问题,软件和PDF和Word展示,包括什么类型,多大资源?放出来要以文章的内容放出来,还是PDF和文章是一样?还有个矛盾点,产品和运营希望用户下载完之后是直接可用,不会对PDF和WORD产生一些压缩或工具化处理,有些用户会经意或者不经意之间引导去下 Word,应该怎么做?
答:百度搜索条现在默认叫网页搜索,顾名思义是我们给用户展现都是一个网页。后面还有一个文库的文件格式。搜索出来都是让用户下载用的,可以去好好研究,在文库里面把内容展现出来。
10
问:有没有一个通道告诉搜索引擎我们的页面内容发生变化了,通常怎么处理?一个旧的页面已经被收录、被排序,一定周期之后他发动新的资源的补充和变化?
答:现在还没有这样的通道。首先Spider这边会check一些东西,他发现网站经常出现这种状况,他相关的check流量会增加,不放心的话还是把他放到sitemap里。
11
问:网站本来只是一个首页,就是一个APP下载。我们现在把内容放出来,以前这些内容不可抓取,现在用目录或者子域名放出需要提交改版么?
答:这个就放在域名下,用一个子目录把分门别类的东西放进去,不存在改版。首页改一下,其他不存在改版的问题。使用主动推送的工具效果还是非常明显,如果内容质量很OK,可以把配额都用光。
12
问:自动推送的份额是多长的周期调一次?因为我觉得对我们海量千万级或者是百万级数据量来说你那个份额太少。
答:我们也关注一个网站是否有这种爆发性,突然增量这么多,我们认为这很不正常。你还是循序渐进,别短平快,一夜吃成个胖子。第二个,你有这么多优秀的数据,你可以关注百度另外一个平台,你变成API让别人使用你的数据。别人对你的数用量做付费,可以关注这个。
13
问:超链接做URL的绝对路径和相对路径会有影响吗?改版之后,我们页面有翻页,翻页链接是12345,上面带标签。每次抓的时候不会抓到12345里面去。模拟抓取,感觉抓取不到里面。页面上的A标签,Spider都会去抓么?
答:没有太大的影响,正常可以访问就OK。不管是绝对路径还是相对路径,只要说这个地址对于Spider或者是对于用户来讲都是畅通的,在页面呈现的时地址是完整,这个路径都是能够顺畅来做抓取。
不收录的问题,可以参考其他的一些点,比如是不是本身页面就没被访问到还是目录层级比较高。页面首页推送的链接百度都会去抓,一层一层的。路径如果正常Spider路径都是从首页开始抓取。
首先就要看不被收录的链接志有没有被抓获,如果被抓获没有被收录,可能是页面本身的问题。也可以看一个周期,因为我们用一天时间。第二个是看日志里面有没有长尾,是不是隐藏或者层级搭建的时候没有做有效的抓取或者是有效推荐。如果能看日志,可以看日志去分析一下。
可以调整首页的变化,做一个推荐,做一个测试,看是链接的问题还是蜘蛛没有抓的问题。还有推送等等方式都可以解决,从而判断不收录的原因是什么。学院有一个文档解决关于诸多的问题题,类似于流程图一样。当这环做到了,原因是什么?如果够长,就可以走下面的分支看看。
14
问:站点之前是所有框架通过JS展现,后来百度不收录,又进行了PHP改版。样子是一样,现在感觉这个PHP写的不太规范,百度对这个不太规范收录是什么样的?
答:很多酒店行业的的内容都通不是实时加载出来,是通过JS慢慢获取页面上的内容。搜索引擎抓的话就是一个导航,就是这样的问题。以前空白页面收录很多,质量很不好。关于Pattern认为这就低质量的Pattern,内容可能也就这样,所以考虑换一个目录。