Foresight 据 Cointelegraph 报道,Pantera Capital 和富兰克林邓普顿的数字资产部门已加入开源 AI 平台 Sentient 推出的生产级基准测试平台 Arena 的首批参与者名单,该平台旨在评估 AI 智能体在企业级工作流程(如分析、合规和运营)中的表现。Arena 通过模拟企业条件的标准化任务(如处理长文档、不完整信息和矛盾来源)运行智能体,并追踪幻觉、证据缺失、引用错误和推理缺陷等故障类别。