新平台持续未获收录,如何应对?
首先、检视网站日志,判断是否被搜索引擎爬取
作为网站管理者,必须掌握网站日志的分析技巧,日志中能够揭示表面难以察觉的问题。具体如何分析网站日志,可参考小编先前撰写的一篇《SEO网站优化每日必行事项:网站日志分析》。
1)、若未被收录的页面未遭搜索引擎爬取
若页面未受到Baiduspider的爬取,那么可以适当增加该页面的外链,以引导蜘蛛进行爬取,或者向搜索引擎提交该页面。例如,某每日吐槽页面已经很久未被百度收录,那么我们可以采取以下措施:
2)、若页面已被Baiduspider爬取过
页面被爬取却未被收录,可能的原因包括:
1、初次被Baiduspider爬取,从百度综合算法来看,该页面的价值性极低,正在考虑是否创建索引。
2、第二次被Baiduspider爬取,该页面始终未有任何变动,决定暂停对该页面的分析。
3、第三次被Baiduspider爬取,该页面依然没有变动,且长时间未出现其他附加价值(附加价值:评论、分享、转发等),决定不予收录。
要知道Baiduspider也是忙碌的,没有那么多时间去爬取这些未收录的页面。因此,当页面长时间不被百度收录时,应适当增加页面的附加价值或对页面进行修改。例如,可以添加图片、视频或内容,也可以重新编辑标题。总之,要让Baiduspider再次爬取时,页面返回的状态码不再是无变化的状态,这样页面被收录的概率就会大大提高。
其次、检查robots设置是否错误,是否主动屏蔽Baiduspider
robots的设置同样至关重要,许多人可能对这方面不太了解。建议前往百度站长工具资讯部分查看详细教程,这里不再赘述。若robots设置存在问题,则需自行纠正,并在百度站长工具后台更新robots,以便百度蜘蛛重新调整状态。
第三、页面是否存在敏感词
如今,越来越多的词汇对搜索引擎来说具有敏感性,敏感词可能导致页面不被收录,有时甚至会导致网站被降权或被K。因此,站长们在建设内容时务必注意不要在文中出现敏感词。
第四、页面内容是否为采集
百度曾明确表示,数据库中必然存在完全重复的内容。但也会有一定的限制。例如,一篇文章最多被收录20篇,当已被收录20篇时,无论是你还是他人转载更新,都不会被收录。
希望对您有所帮助,如有其他网络问题,欢迎咨询。
敬请采纳
网站为何持续未被收录
域名问题:
在建设网站时,可能由于SEO知识的不足,随意选择域名并将其绑定到网站上,也许这个域名有被K的历史记录,因此导致网站一直不被收录。解决方法是更换一个新的域名。
网站质量问题:
如果域名没有问题,那么需要检查网站设计是否存在问题,例如网站源码中存在许多无效的js文件或网站打开速度慢等问题。解决方法是优化网站源码部分。
内容问题:
随着百度算法的更新,最重要的是体现在网站内容的质量上。如果你的网站经常发布采集或不健康的文章,百度肯定不会收录。解决方法是删除这些文章,专心撰写原创文章。
robots.txt文件屏蔽:
需要打开网站根目录下的robots.txt文件,检查是否将百度蜘蛛屏蔽了,导致内容不被收录。
外链快速增加:
新网站上线后,有些站长会使用群发软件或去多个平台发布外链,导致网站短时间内出现大量垃圾外链,这会使网站被百度的“绿萝算法”重点关注。解决方法是删除这些外部链接,重新优化。
内容频繁改动:
有些站长发布文章后觉得不满意,就想重新编辑修改,这种情况是不合适的,因为这会导致搜索引擎误判,从而延长审核期。解决方法是安心写文章,不要随意修改。