中高风险
如果旧站已有大量收录和外链,清理时要保留高价值 URL、按主题迁移或 noindex,不建议无清单批量删除。
常见现象
- sitemap 中出现大量旧数字文章、tag、category、author 页面
- robots.txt 指向 404 的 sitemap
- cart、checkout、my-account 被收录
- 搜索结果仍显示旧品牌或无关教程
- 新服务页抓取慢、主题信号不清晰
可能原因
- SEO 插件和 WordPress 默认 sitemap 同时输出
- 旧内容没有 noindex 或没有从 sitemap 排除
- 电商系统页没有设置 noindex
- 改版后没有处理 robots、canonical、redirect 和缓存
- 精选内容与旧内容没有明确区隔
不要先做
- 不要把全站一刀切 disallow
- 不要把所有旧 URL 都 301 到首页
- 不要让 noindex 页面继续出现在 sitemap
- 不要在没有清单时批量删旧文章
- 不要同时启用多个 sitemap 输出
安全排查顺序
- 先导出当前 sitemap、索引页面和高价值旧 URL
- 确认 robots.txt 指向可访问的 sitemap
- 关闭重复 sitemap,只保留干净自定义 sitemap 或单一 SEO 插件 sitemap
- 给旧文章、tag、category、author、电商系统页设置 noindex,并从 sitemap 移除
- 只保留核心服务页、问题库、案例、工具、政策页和精选修复笔记
- 清缓存后提交 Search Console / 百度,并持续观察覆盖率
常见问题
noindex 和 robots disallow 可以一起用吗?
一般不要用 disallow 阻止搜索引擎看到 noindex。需要退出索引的页面应允许抓取并输出 noindex。
旧文章要全部删除吗?
不需要。无关旧内容可保留但 noindex;有价值内容可以改写成精选修复笔记再进入 sitemap。