找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 111|回复: 0

让我们确保没有任何

[复制链接]

2

主题

0

回帖

9

积分

新手上路

积分
9
发表于 2024-2-17 03:06:32 | 显示全部楼层 |阅读模式
本帖最后由 JoyuUKhop56 于 2024-2-17 03:08 编辑

站点地图分解得越多,就越能发现问题。如果您看到总索引计数确实在增加,或者您知道它太大了(您的网站有 个页面, 已对 个页面建立了索引),那么这可能是 参数失控和重复内容的迹象。 最后,明显的抓取错误。转到 抓取 抓取错误 ,您应该会看到如下所示的概述: 我有两个 未找到 错误,这确实一点也不坏。我有点担心我最初的 帖子会弹出,所以让我们点击它: 错误详细信息 在这里并不是特别有用,因此我。

将直接转到 链接自 ,可以看到错误的 位于页面本身(不是问题)和主页上。查看主页源代码,这个链接现 易趣编号数据 在已经消失了。所以,谷歌只是过早地抓取了该网站,这个问题应该会自行解决。 莫兹分析 虽然 网站管理员工具有很多有用的信息,但仅从一个角度(尤其是 的角度)获取故事可能会存在陷阱。让我们从 搜索 抓取诊断 开始查找 中的任何抓取问题。在页面底部,我得到了以下摘要: 问题从高优先级到低优先级排序(从左到右),但这次。

GGhZrD3aoAAsVWp?format=png&name=small.jpg

的工作非常简单。我出现了 次 缺少元描述标签 这一错误。这是有问题的,不仅仅是因为错误,还因为我真的不希望抓取该网站的 个页面。所以。让我们深入查看一些示例页面 对网站的快速抽查显示,这些页面实际上没有自定义元描述。虽然这还不是关键任务,但我应该尽快将它们添加到我的主页中。 至于 个爬行页面,看起来 正在爬行我的评论 回复页面。查看源代码,这些页面有两个 指令和一个 标签,这可能会给爬虫带来一些麻烦。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|芝加哥华人服务中心

GMT-5, 2024-11-18 01:46 , Processed in 0.070066 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表