361 361Sale WordPress Care by Openbyt · WordPress 修复与运维
修复笔记

WordPress sitemap 被旧文章、标签和购物车污染时怎么清理?

WordPress 服务站改版后,sitemap 和 noindex 要先收窄索引范围:核心服务页、问题页、案例页和精选笔记保留,旧数字文章、标签、分类、作者、购物车和结账页默认退出索引。

中高风险

如果旧站已有大量收录和外链,清理时要保留高价值 URL、按主题迁移或 noindex,不建议无清单批量删除。

常见现象

  1. sitemap 中出现大量旧数字文章、tag、category、author 页面
  2. robots.txt 指向 404 的 sitemap
  3. cart、checkout、my-account 被收录
  4. 搜索结果仍显示旧品牌或无关教程
  5. 新服务页抓取慢、主题信号不清晰

可能原因

  1. SEO 插件和 WordPress 默认 sitemap 同时输出
  2. 旧内容没有 noindex 或没有从 sitemap 排除
  3. 电商系统页没有设置 noindex
  4. 改版后没有处理 robots、canonical、redirect 和缓存
  5. 精选内容与旧内容没有明确区隔

不要先做

  1. 不要把全站一刀切 disallow
  2. 不要把所有旧 URL 都 301 到首页
  3. 不要让 noindex 页面继续出现在 sitemap
  4. 不要在没有清单时批量删旧文章
  5. 不要同时启用多个 sitemap 输出

安全排查顺序

  1. 先导出当前 sitemap、索引页面和高价值旧 URL
  2. 确认 robots.txt 指向可访问的 sitemap
  3. 关闭重复 sitemap,只保留干净自定义 sitemap 或单一 SEO 插件 sitemap
  4. 给旧文章、tag、category、author、电商系统页设置 noindex,并从 sitemap 移除
  5. 只保留核心服务页、问题库、案例、工具、政策页和精选修复笔记
  6. 清缓存后提交 Search Console / 百度,并持续观察覆盖率

常见问题

noindex 和 robots disallow 可以一起用吗?

一般不要用 disallow 阻止搜索引擎看到 noindex。需要退出索引的页面应允许抓取并输出 noindex。

旧文章要全部删除吗?

不需要。无关旧内容可保留但 noindex;有价值内容可以改写成精选修复笔记再进入 sitemap。