如何禁止 AI 抓取网站内容用于其训练
目前各大 AI 公司都通过抓取网站内容用于其 AI 训练。搜索引擎抓取内容后会给网站流量,AI 抓取内容用于训练后,像 ChatGPT 和 Google Gemini 基本不给出处,所以网站得不到流量。因此,我们要让网站禁止 AI 蜘蛛抓取。 怎样禁止 AI 抓取网站内容?目前看,还是用 robots 文件禁止访问最方便。 8月份,OpenAI 发布了他们 ...
目前各大 AI 公司都通过抓取网站内容用于其 AI 训练。搜索引擎抓取内容后会给网站流量,AI 抓取内容用于训练后,像 ChatGPT 和 Google Gemini 基本不给出处,所以网站得不到流量。因此,我们要让网站禁止 AI 蜘蛛抓取。 怎样禁止 AI 抓取网站内容?目前看,还是用 robots 文件禁止访问最方便。 8月份,OpenAI 发布了他们 ...
Google 开始在搜索结果中加入互联网档案馆(Internet Archive)的 Wayback Machine 链接,此举旨在为搜索结果中的链接添加历史背景。 Google 搜索让用户可以轻松找到信息,但有时需要了解最近更新的页面的历史背景(historical context)。以前,通过 Google 搜索的网页快照功能可以实现这一点,但该功能已于今年早些时 ...
Google 官方博客宣布,将于 2025 年 8 月 25 日关闭链接缩短服务,任何使用 Google URL Shortener 构建链接的开发者都将受到影响,这些链接将不再返回响应。 Google URL Shortener 短链接服务(网址为 https://goo.gl/*)在 2018 年宣布将停止生成新的短链接,但会继续支持现有的短链,现在 Google 将彻底关闭这项服务。 ...
Google 宣布, 从今天开始关闭桌面版 Google 搜索结果的持续滚动加载功能,用户将在 Google 搜索结果的页脚看到经典的分页栏。 持续滚动功能于 2021 年 10 月在 Google 移动搜索中推出,并于 2022 年 12 月在桌面版上推出。Google 将在下个月从移动搜索结果中删除持续滚动功能。因此,持续滚动在桌面搜索中仅持续了大约 ...
Google 搜索的“网页缓存”功能,长期以来一直是加载已关闭或已更改的网站的替代方式,但现在 Google 正在取消它们。 搜索引擎爬虫在索引网页时会创建一个备份,从某种程度上相当于备份了互联网的历史,因为在用户查询相同网页时有种种原因会导致网页无法访问,比如链接改变,网页删除,或者可能网站都关闭了,有了缓存用 ...
今天看到几则与搜索引擎相关的报道,结合自己网站的收录和访问情况,发表点看法。 Google 将调整搜索排名以遵守欧盟的监管规定 近日,为了遵守欧盟的监管规定,Google 宣布将调整搜索排名,在搜索结果中突出与其有竞争关系的比价网站的排名。 欧盟的数字市场法(Digital Markets Act,DMA),要求搜索引擎对竞争对手的产 ...
自 Google(谷歌)退出中国后,国内一直不能正常使用 Google 搜索。但搞 IT 或学术的网友经常需要求助 Google 查询一些科学文献或者技术资料,因此国内许多 Google 爱好者创建了 Google 镜像网站,不定期爬取 Google 搜索中的合法数据,部署到其他的云服务器上,给国内的网友提供合法的搜索和查询服务。 我们收集分享最 ...
Google Registry 今天宣布开放注册后缀名为 .meme 的顶级域名,目前已开通抢先体验通道。 在抢先体验阶段,用户可以率先注册 .meme 的顶级域名,但需支付“额外的买断费用”,费用会随着正式发布而降低。 抢先体验期(EAP)截至 12 月 5 日。12 月 5 日 16:00 UTC(北京时间 12 月 6 日 0 点)之后全面开放,任何人都可以 ...
据彭博社报道,知情人士透露苹果公司与搜索引擎 DuckDuckGo 进行了谈判,希望将 Safari 浏览器无痕模式的默认搜索引擎从 Google 替换为 DuckDuckGo。 据悉,苹果此举与 Google 反垄断案件有关,负责该案的联邦法官预计本周稍晚会披露相关的谈判细节。届时将解封 DuckDuckGo 的 CEO Gabriel Weinberg 和苹果高管 John Gia ...
我们都知道,互联网账号长时间不登录,是会被删除收回的,但各大公司的政策不尽相同,从接触的情况看,多数是一年时限。 近日,Google 更新了其《闲置 Google 帐号政策》,将所有 Google 产品和服务中的 Google 帐号闲置期上限调整为 2 年。即从 2023年12月1日开始,连续 2 年无人登录或无人使用的 Google 帐号。Google ...
Google 最近更新了非活动帐户政策,宣布从2023 年 12 月起,将删除两年未被使用或登录的 Google 帐户及其内容,以提高产品和服务的安全性,节省存储空间,并减少个人信息的保留时间。 根据 Google 公告,如果一个 Google 账户在至少两年内没有被使用或登录过,Google 将删除该账户及其内容。这意味着,该账户的电子邮件 ...
11 月 3 日,Z-Library 的两位创始人 Anton Napolsky 和 Valeriia Ermakova 在在阿根廷科尔多瓦被捕,大概同一时间网站的域名被美国政府机构查封。现在美国政府正式对两人提起诉讼,指控他们犯有版权侵犯、电信欺诈和洗钱的罪行。 Z-Library 是世界最大的盗版电子书网站,提供超过 1200 万本电子书供下载。Z-Library 大 ...
Google 在 2010年宣布退出中国之后,仅在中国保留了翻译服务和不含搜索的地图服务,后来地图服务关闭了,但现在看来它也要关闭翻译服务了。 近期有网友发现,当访问 Google 翻译的中国站点(translate.google.cn)时,大概率会看到和搜索主页相同的重定向到 translate.google.com.hk 页面 。 目前尚不清楚这一现象的缘由 ...
据消息,Telegram 正在增加绑定邮箱的验证功能。目前在 Telegram 隐私政策页面,关于账户邮箱的内容进行了更新,内容如下∶ 当您启用两步验证或使用 Telegram Passport 功能存储文件时,您可以选择设置一个密码恢复邮箱。此邮箱只适用于忘记密码时发送密码恢复代码。这个邮箱不会收到营销邮件或"我们想念你"之类的废话。 ...
我们中的许多人都经历过访问一个网页时的挫败感,该网页似乎具有我们正在寻找的内容,但没有达到我们的期望。内容可能没有您想要的见解,或者它甚至可能看起来不像是为一个人创建的,甚至不是由一个人创建的。 我们希望在搜索中显示的页面尽可能有用且相关。如果内容似乎旨在吸引点击而不是告知读者,那么人们不会觉得内 ...
搞IT或学术的网友都有这样的体验,光靠度娘有时真的解决不了问题,所以时不时的就需要求助 Google。自谷歌退出中国后,因为大家都明白的原因,国内一直不能正常使用 Google 搜索。 因此,国内许多 Google 爱好者创建了 Google 镜像网站,不定期爬取 Google 搜索中的合法数据,部署到国内的云服务器上,给国内的网友提供 ...
近日,百度搜索悄然关闭了快照功能。原本网站名称后方的“百度快照”按钮消失不见,点击下拉箭头时只有“收藏”和“举报”按钮。 百度快照是什么? 不知大家有否用过“百度快照”功能,它是百度搜索保存的被收录网页的纯文本备份。当搜索引擎派出蜘蛛去对网站进行索引的时候,会对网站页面进行拍照抓取,同时生成一个临时的缓存 ...
Google 宣布将 Meet 和 Duo 整合到一个用于语音和视频通话的应用程序中,它被称为 Meet,但 Duo 的 DNA 仍然存在。 看起来 Duo 死了而 Meet 走到了最后,然而 Google 令人困惑的做法是 Meet 将在晚些时候更名为 Meet Original,最终会被弃用,而 Duo 应用将更名为 Google Meet,成为两者的唯一应用。 Meet 是 Google 未 ...
Google 上周宣布扩大用户可要求从搜索结果中删除的数据类型,以保护自己并保持敏感的个人身份信息的私密性。 以前 Google 允许未成年人要求从搜索结果里删除他们的肖像,以及允许用户要求删除银行账号或信用卡号码等敏感数据,现在 Google 扩大到了电话号码、电子邮件地址和家庭地址等个人联系信息。 Google 表示它会对 ...
网站投放了 Google AdSense 联盟广告,系统提示建议安装 Site Kit by Google 插件,一个供 WordPress 用户使用 Google 系列服务的工具。 Site Kit 是 Google 的官方 WordPress 插件,用于分析人们如何找到和使用您的站点。Site Kit 是一种一站式解决方案,用于部署、管理和从关键的 Google 工具中获得数据,使站点在网络 ...