Google search console抓取错误处理方式

近期更新了博客的目录,删除了建站初期为了SEO而更新的文章,Google search console随即出现了大量的404抓取错误。小站有过一次类似的经历,当时google的索引量直接从500左右降到了50左右。为避免重蹈覆辙,我准备主动处理这些404错误。

“未找到”错误 (404)

Google search console帮助中这样解释“未找到”错误:Google是通过跟踪网页间的链接来查找内容的。一般情况下,当Googlebot尝试访问不存在的网页(因为您删除或重命名了网页且没有将旧网址重定向到新网页,或者链接中存在拼写错误)时,就会出现“未找到”状态错误(通常是404 HTTP状态代码)。

移除网址

虽然Google search console中也说明:404 网页在网络中是完全正常的(且在很多方面是必需的)组成部分。但是这些404错误会给访客带来不愉快的体验,而且大量的404错误会对影响搜索引擎的索引。因此我准备根据Google search console帮助中的提示来移除404错误的网址。

登录Google search console,进入”抓取”–>“抓取错误”,将404错误全选后以”Google Docs”形式下载。

select download format

下载完成后,我对这些错误逐一进行确认,这些404错误主要分为四类:
1. 已删除的目录链接
2. 已删除的文章链接
3. 已删除的图片链接
4. 文章中添加的外链
小站的文章链接都是固定链接,因此修改目录不会影响到文章页面,这应该是固定链接的一大优势吧。前三项基本合理,第四项不合理。

经过验证,我发现Kindeditor For WordPress编辑器在添加超级链接是会做如下处理:若添加的链接为http://www.livezingy.com,则显示为正常的链接;若添加链接为livezingy.com,编辑器会自动变成http://www.livezingy.com,也是正常链接;若添加链接为www.livezingy.com,那访客访问的链接会变成http://www.livezingy.com/www.livezingy.com,这样就会变成404的链接。

发现这个问题点后,我提醒自己:发布文章时,每一个外链都要确认;每过一段时间都要到Google search console去确认是否有不合理的404错误。

确认大部分404错误均合理后,我开始准备从网络上移除这些链接。从Google search console的界面进入“Google索引”–>”移除网址”,输入网址后点击”继续“。

remove 404 website

在新弹出的页面中选择”使网页暂不显示在搜索结果中并从缓存中移除“,然后”提交请求“。

submit remove request

Comments

  1. By 路人甲

    回复

    • By livezingy

      回复

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据

Fork me on GitHub