Strava 在 IPO 前向爬虫宣战

原文：Strava declares war on scrapers ahead of IPO

人工智能公司已经发展成为数据匮乏的实体，因为他们的模型需要更大的数据集来训练。为了满足这一需求，许多人工智能初创公司违背了长期存在的互联网惯例——比如尊重 robots.txt 文件，该文件向自动爬虫发出信号，告诉自动爬虫网站的哪些部分是禁止访问的——并积极地抓取数据。这迫使网站限制对其数据的访问，并在某些情况下与人工智能公司达成许可协议。健身和社交跑步公司 Strava 正在朝这个方向迈进，限制其网站并向开发者收取访问费用。

为了停止抓取，该公司正在提高其网站的安全性，现在只允许经过身份验证的用户查看某些数据。早些时候，用户无需登录即可查看公开资料和健身俱乐部列表等详细信息。该公司将所有这些数据置于身份验证之后，以防止未经授权的人工智能抓取。

在 API 方面，开发人员之前可以通过免费的分层访问计划开始在 Strava 上构建应用程序 - 首先申请基本访问权限，然后随着应用程序的增长请求更多访问权限。现在，该公司向所有开发商收取每月 11.99 美元的固定费用，不过该公司指出，价格可能会因地理位置而异。

Strava 表示，其开发者社区成员已从去年的 185,000 名成员增加到今年的 241,000 名，公司计划继续为他们提供支持。作为其中的一部分，Strava 还计划增加对模型上下文协议 (MCP) 的支持，这是一种新兴标准，允许人工智能助手和应用程序以结构化方式访问外部数据，从而使 Strava 能够更好地控制共享内容和共享方式。

该公司还计划停用一些 API 端点（允许外部应用程序提取特定数据（例如俱乐部详细信息）的离散访问点）以保护用户数据。 Strava 已于 2024 年收紧了 API 规则，禁止将其用于人工智能训练，并限制第三方应用程序显示其他用户的数据。这些变化引起了强烈反对

阅读原文 →