SEO是一个多边生态,“用户”、“您的站点”、“竞争站点”、“搜索引擎”,这4点随机发生变化可能导致波动 在您网站上的 SEO 流量中。 其实,新浪、知乎等“流氓网站”也应该包括在内,但“流氓网站”从不同行业获得流量的比例几乎是固定的,所以不是那么重要。
在任何行业,判断任何方法有效的前提都是“有反馈”,反馈时间越长,越会影响判断的准确性。
例如,如果网站访问量增加了,这可能并不意味着 SEO 做得很好。 可能是因为竞争网站的流量下降了。 例如,在一些竞争激烈的行业和巨头网站,第二梯队网站的流量变化主要取决于巨头网站的流量变化。 如果下降,你可以增加,如果没有,你就没有机会增加。 因此,除非行业整体搜索量变大,否则只能放弃行业流量竞争,寻找行业内相关性弱的流量。
但是,在从事SEO的过程中,很容易将大部分注意力集中在“自己的网站”上,而忽略了“用户”、“竞争网站”和“搜索引擎”的变化。 之前广为流传的SEO公式“综合收录量×综合排名×综合点击率×综合搜索量”现在感觉很尴尬。
比如几个子因素:
整体收录率 = 搜索引擎抓取量 × 页面质量
排名 = 页面排名 × 网站权重增益
“页面质量”是如何定义的? 什么样的页面可以称为优质页面? 如何计算体重增加?
如果能得到有效的“反馈”,前提是能够对结果指标及其影响因素进行清晰及时的数据量化。 能够量化意味着不能使用“页面质量”、“体重增加”等含糊不清的术语,应该换成“XX率”、“XX量”、“XX比例”等。 数据计算的明确指标。
基于此,SEO学院对这个公式做了如下修改:
全网唯一页面的比例这是一个反映竞争程度的指标。 公式为:
全网唯一页面占比=本站包含关键词的页面数/关键词搜索结果总数
比如我抽了1180个词,有 是3400页,标题1180个字,这1180个字的百度搜索结果总数为1341722539
那么:
3466 / 1341722539 = 0.0000025 = 2.5/1000000 = 1/400000
我们比较一下4和5之间的竞争程度,大约是4.4。 这种竞争程度几乎是10%。 网页可以进入倒排。
收集内容的滞后时间
标识了所收集网页的最粗略的特征,即查看网页在线的时间。 搜索爬虫抓取A网页。 2天后,抓到B网页,B网页的body和A网页的body几乎一样。 假设两个权重相同,哪个更有可能留下?
因此,如果网站内容的采集比例较大,则应尽量缩短采集页面与来源页面之间的时间间隔。 比如12点20分发出的A网页,我12点25分抓取,12点30分上线,接近实时同步采集。 这种收藏可以增加收藏内容按一定比例收录的概率。
那么为什么一个定期收集的站很容易挂掉呢? 这应该是一个更重要的因素。
真实用户用特性
现在有些网站,不管怎么做SEO,反正什么词、聚合页、链接结构都打不通,所以我觉得高竞争行业的网站可以用传统的方法 搞SEO。 它不再起作用了。 在没有人的阶段,我们为流量而战,有的时候,我们为留存而战,依靠产品体验。 那么直到现在,搜索引擎机器学习会根据真实用户使用和体验过的网页的共同特征来参考其他网页吗? 比如我看到阿里巴巴的一个关于流量分配的SEO专利,可以理解为一个电商网站产品词条的SEO搜索页面。
电子商务网站有B端和C端用户。 如果一个电商网站被大量的真实用户使用,那么在网页产品的设计中,就要考虑尽可能公平地分配给B端用户的流量。
大量真实用户使用的电子商务网站会考虑流量分布。 同一个B端用户发布的产品在列表中只能出现一次,不能多次出现,即出现在列表中的产品都是不同B端发布的。
这也意味着,如果一个电子商务网站,其产品词SEO搜索列表页面,列表中存在同一B端用户发布的多个产品,则该列表规则意味着其他B端用户的 不公平。 但是,一个真实用户少或者纯粹靠广告赚钱的网站,在网页设计过程中是没有考虑流量分配的。
路径搜索量
用户在搜索框中输入关键字并点击“百度”。 此流量是直接搜索流量。 然后到上一步,跳转到搜索结果页面,看到下拉框中推荐的词符合你的需求,点击这个词,这个流量就是路径搜索流量。 用户搜索行为更加多样化的行业,路径搜索流量占比更高。 比如娱乐圈,每天都有新的热点出现,围绕这个热点有很多衍生词。
在少数行业,路径搜索产生的流量可以接近总搜索流量的50%。