网页抓取和建立索引是不等同的.这些网页会经过一些必要的chk过程之后才会被建入索引.
百度对海外站点没有歧视.但百度从国内爬出去的蜘蛛,会严格遵守国家的政策和法令,所以国内普通用户访问受限的内容,百度蜘蛛一样会搞不定.任何对站点价值分析有贡献的要素,都有可能被搜索引擎使用.并且这些要素的使用方式,也不是一成不变的.至于具体有哪些要素已经被使用以及如何使用,这个无法详述.一个普通用户,如果用你的关键词去搜,怎样的结果是合理的?如果你不喜欢的结果,恰是用户所喜欢的,那么除非版权问题之类,否则很难得到解决;如果你不喜欢的结果,也是普通用户所不喜欢的,那么这是一个会被百度关注的问题.其实百度没啥神秘的,用这个逻辑可以解决一堆的猜想.
搜索引擎的技术思路都是一样的,找好内容的特征,把它们排上来,找不好内容的特征,把它们降下去.
现在网站被黑的问题,百度网页搜索工程师们也很头痛,平均每天会有几百个网站出现这种情况.我们正准备尝试着给域名的注册信箱发信通知,提醒一下站长,不知道有没有效果.我们也曾想在搜索结果里提示安全,也找过几家专业做安全的公司,但准确率和召回都很有问题.网站因作弊而被惩罚,百度会监控这些网站,修正了作弊内容,或者网站的质量指标达到某种层次,会降低惩罚力度,直至完全放开.也就是说,完全解除惩罚的消极结果还是有一个逐渐时间累积和行为改善的过程.如果网站改邪归正,百度会完全放开.
百度搜索框提示功能将向广大站长全面开放啦!!该功能的有效使用将帮助站长提升服务质量和用户黏性,进而获得更大的利益回报与成长空间.了解详情:
百度暂时还没支持通过robots提交Sitemap.一般情况下,spider能处理大多数网站的数据抓取和更新,而无须借助sitemap.
Robots 掉的网页,如果互联网上其他网页链接并描述了这个网页的内容,我们会把这些描述信息建入索引,但 Robots 掉网页我们不会抓取,网页内容也不会收录.当你网站上的内容对用户有用时,用户会推荐给别人,推荐的形式可能多种多样:IM软件上推荐给自己的朋友、在论坛里发帖推荐、写博客介绍等.这些推荐,都会被搜索引擎用来判断网页/网站价值的高低.
不把 Meta Description 当做权值计算的因素,这个标签存在与否不影响网页权值,只是摘要的一个选择目标.