谷歌推出爬虫扩展代理 网站管理员可以屏蔽谷歌抓取内容用于训练AI – 蓝点网
[热点] 时间:2024-11-23 20:00:37 来源:燃眉之急网 作者:百科 点击:56次
在 OPENAI 公布 GPTBot 爬虫的谷歌管理谷歌相关信息后,今天谷歌宣布在 GoogleBot 基础上推出 Google-Extended 爬虫扩展代理,推出允许网站管理员使用 robots.txt 文件屏蔽谷歌抓取网站内容用来训练 AI 模型。爬虫屏蔽
谷歌没有推出单独的扩展 AI 爬虫,AI 爬虫仍然使用 GoogleBot,代理但网站可以声明是网站网否拒绝其抓取内容后训练 AI,如果要声明那就需要使用 Google-Extende代理令牌。员可用于
谷歌称,内容Google-Extended 是训练一种新控件,网络发布商可以使用它管理其网站是蓝点否有助于改进 Bard 和 Vertex AI 等生成式 AI 模型,在博客中谷歌多次提到网站可以帮助谷歌改进 AI,谷歌管理谷歌比如网站管理员可以选择是推出否帮助这些 AI 模型随着时间推移变得更准确和强大。
不过最终还是爬虫屏蔽网站管理员自己决定是否允许谷歌拿内容去训练 AI,如果不愿意的扩展话,可以在 robots.txt 中添加以下内容:
User-Agent: Google-ExtendedDisallow:/
需要提醒的代理是谷歌对于 robots.txt 的处理遵循了多种原则,而且 Google Bot 本身有一大堆用于不同用途的 bot,例如常规的 GoogleBot、GoogleBot-News、GoogleBot-Image 等,这些 bot 是可以在 robots.txt 里混用的。
例如要允许谷歌搜索抓取网站内容、不允许谷歌抓取内容用于训练 AI,那么 robots.txt 可以这么写:
User-Agent: GooglebotAllow: /User-Agent: Google-ExtendedDisallow: /
(责任编辑:探索)
相关内容
- Redmi A3将于情人节在印度发布 圆形影像模组神似小米Ultra
- 不内卷,只抱团?日产、本田、三菱组成新联盟
- 真我手机官宣320W超光速秒充技术,5分钟充满电
- 采用纯视觉方案!问界M7 Pro部分信息曝光
- 格力年会惹争议,董明珠怒怼职场马屁:很烦吹捧我的员工
- 领克首款手机即将发布,是双向奔赴,还是魅族21 Pro再度“换皮”?
- 高通噩梦到来!传iPhone 17将搭载自研基带芯片
- 对标仰望U9,标配4电机!Battista Targamerica圆石滩车展首发
- 格力年会惹争议,董明珠怒怼职场马屁:很烦吹捧我的员工
- 得益于开源社区的力量 已经推出20多年的ATI R300/500显卡还在获得驱动更新 – 蓝点网
- 说好的MPV呢?疑似鸿蒙智行尊界新车谍照曝光
- 封印开始解除:AMD锐龙9000系处理器将采用新TDP
- iPhone 16 Pro Max影像大升级,配备近1英寸大底,还或将告别直屏
- 可能是最便宜的合资中大型MPV?2024款现代库斯途亮相