网站仅收录首面却遗漏内页的成因分析:
1、首页权重较高,故收录迅速,内页虽已索引却未展示,处于与百度建立信任的阶段。
2、网站结构不理想,过多的JavaScript代码、Flash以及iframe框架等,使得收录变得困难。
3、robots.txt设置错误,如:User-agent:* Disallow:/,即禁止抓取。
4、服务器问题,不稳定,导致访问中断。
5、静态或伪静态设置不当,若未设置而使用动态链接,内页将无法收录。
6、网站遭受惩罚,内页收录减少,全站排名下滑。
内页遭受惩罚的原因:
(1)内页频繁变动或改版
(2)服务器不稳定
(3)同IP网站遭受惩罚
(4)外链垃圾过多
针对网站仅收录首页的问题,以下提供几种解决方案:
1、确保网站服务器或空间的稳定性,以保证快速访问。
2、减少内页JavaScript代码溢出,减少Flash使用,并在图片中添加ALT标签,方便蜘蛛爬取图片内容。
3、检查友情链接,移除存在风险的链接,如对方快照停滞一个月以上、被惩罚或降权、作弊等,同时让对方删除你的友情链接。
4、修复网站程序漏洞,提高空间及程序安全性。
5、增加内页外链。
6、多更新原创内容,适当使用高质量伪原创。
7、修改ROBOTS设置,优化301重定向及404页面引导,重新赢得搜索引擎信任。
8、向百度提交未收录链接。
如何解决网站页面不收录的问题:
网站收录问题一直困扰着我们,因为一旦百度不收录,我们所有努力都将白费,因此网站收录至关重要。以下提供提高收录率的三个要点:
第一:增加蜘蛛访问频率;
第二:建立良好的站内结构;
第三:让蜘蛛了解网站价值。
第一、增加蜘蛛访问频率
蜘蛛访问网站越多,被收录的可能性越大。通常操作方法分为站内和站外:
站内:保持固定频率、固定量更新内容,但内容质量必须保证,否则适得其反。
站外:在高权重网站投稿,提升网站权重,吸引蜘蛛访问。
第二、建立良好的站内结构
仅吸引蜘蛛是不够的,要确保站内结构合理,让蜘蛛顺利爬行所有网页。可利用面包屑导航、网站地图等,保证蜘蛛顺利爬行。
注:避免使用JavaScript、Flash以及iframe框架,因为蜘蛛无法识别。
通常站内结构以树形结构为主,小型网站建议扁平化:
①主页链接至所有频道主页
②所有频道主页互链
③频道主页链接至网站主页
④频道主页链接至所属内容页
⑤所有内容页链接至网站主页
⑥所有内容页链接至上一级频道主页
⑦内容页可链接至同一频道其他内容页
⑧内容页一般不链接至其他频道内容页
第三、让蜘蛛了解网页价值与意义
要让搜索引擎收录网站内容,首先证明内容价值。
①原创度:写作水平不高时,可适当伪原创,利用“原创度检测工具”检测,力求原创度高。
②降低网站内部信息重复率。
③网页文字不少于300字,越多越好。
此外,站长们可以利用内页外链,引导百度抓取内页,效果显著!