原文:Strava declares war on scrapers ahead of IPO

人工智能公司已经发展成为数据匮乏的实体,因为他们的模型需要更大的数据集来训练。为了满足这一需求,许多人工智能初创公司违背了长期存在的互联网惯例——比如尊重 robots.txt 文件,该文件向自动爬虫发出信号,告诉自动爬虫网站的哪些部分是禁止访问的——并积极地抓取数据。这迫使网站限制对其数据的访问,并在某些情况下与人工智能公司达成许可协议。健身和社交跑步公司 Strava 正在朝这个方向迈进,限制其网站并向开发者收取访问费用。

为了停止抓取,该公司正在提高其网站的安全性,现在只允许经过身份验证的用户查看某些数据。早些时候,用户无需登录即可查看公开资料和健身俱乐部列表等详细信息。该公司将所有这些数据置于身份验证之后,以防止未经授权的人工智能抓取。

在 API 方面,开发人员之前可以通过免费的分层访问计划开始在 Strava 上构建应用程序 - 首先申请基本访问权限,然后随着应用程序的增长请求更多访问权限。现在,该公司向所有开发商收取每月 11.99 美元的固定费用,不过该公司指出,价格可能会因地理位置而异。

Strava 表示,其开发者社区成员已从去年的 185,000 名成员增加到今年的 241,000 名,公司计划继续为他们提供支持。作为其中的一部分,Strava 还计划增加对模型上下文协议 (MCP) 的支持,这是一种新兴标准,允许人工智能助手和应用程序以结构化方式访问外部数据,从而使 Strava 能够更好地控制共享内容和共享方式。

该公司还计划停用一些 API 端点(允许外部应用程序提取特定数据(例如俱乐部详细信息)的离散访问点)以保护用户数据。 Strava 已于 2024 年收紧了 API 规则,禁止将其用于人工智能训练,并限制第三方应用程序显示其他用户的数据。这些变化引起了强烈反对

阅读原文 →