返回列表
Clarifai 删除 300 万张来自 OkCupid 的照片:因 FTC 和解协议而起的 AI 人脸识别数据风波
行业新闻人工智能数据合规隐私保护

Clarifai 删除 300 万张来自 OkCupid 的照片:因 FTC 和解协议而起的 AI 人脸识别数据风波

根据最新报道,AI 公司 Clarifai 已删除 300 万张由约会软件 OkCupid 提供的照片。这些照片最初被用于训练人脸识别 AI 模型。此次删除行动是 Clarifai 与美国联邦贸易委员会(FTC)达成和解协议的结果。法庭文件显示,Clarifai 在 2014 年请求 OkCupid 提供数据,而当时 OkCupid 的高管已对 Clarifai 进行了投资。

TechCrunch AI

核心要点

  • 数据删除:Clarifai 删除了 300 万张用于训练人脸识别 AI 的 OkCupid 用户照片。
  • 监管干预:此次行动是执行与美国联邦贸易委员会(FTC)达成的和解协议。
  • 历史背景:数据共享始于 2014 年,由 Clarifai 向 OkCupid 发起请求。
  • 利益关联:法庭文件披露,提供数据的 OkCupid 高管当时也是 Clarifai 的投资者。

详细分析

FTC 和解协议的执行

根据 TechCrunch 的报道,Clarifai 此次大规模删除照片并非自愿行为,而是履行与美国联邦贸易委员会(FTC)达成的法律和解义务。这一行动标志着监管机构对 AI 训练数据来源合法性的审查日益严格。FTC 的介入强调了科技公司在收集和使用生物识别数据(如人脸照片)时,必须遵循明确的合规标准,否则将面临强制性的数据清理要求。

跨平台数据共享的起源

法庭文件揭示了这起数据风波的源头。早在 2014 年,Clarifai 就向约会平台 OkCupid 寻求数据支持,以优化其人脸识别算法。值得注意的是,这种合作关系背后存在深层的利益关联:当时 OkCupid 的部分高管已经对 Clarifai 进行了投资。这种投资关系与数据共享请求的重合,引发了外界对于用户隐私是否在商业利益交换中被牺牲的质疑。

行业影响

该事件对 AI 行业具有重要的警示意义。首先,它明确了“追溯性合规”的可能性,即多年前获取的训练数据如果存在合规瑕疵,在多年后仍可能被监管机构要求强制删除。其次,这加剧了 AI 公司在获取第三方数据时的审慎态度,尤其是涉及敏感生物识别信息时。最后,此案例突显了投资者关系与数据治理之间的潜在冲突,促使行业重新评估数据获取渠道的透明度。

常见问题

问题 1:Clarifai 为什么要删除这些照片?

这是因为 Clarifai 与美国联邦贸易委员会(FTC)达成了和解协议,该协议要求公司清理不合规的训练数据。

问题 2:这些照片最初是如何获得的?

在 2014 年,Clarifai 请求 OkCupid 提供用户照片用于 AI 训练,当时 OkCupid 的高管持有 Clarifai 的股份。

问题 3:这次删除涉及多少数据?

根据报道,共有 300 万张由 OkCupid 提供的照片被 Clarifai 删除。

相关新闻

ACL 2026美团论文精选:从能力评测到推理优化,构建生成新范式
行业新闻

ACL 2026美团论文精选:从能力评测到推理优化,构建生成新范式

美团技术团队在自然语言处理领域顶级会议ACL 2026中共有6篇论文被收录。这些研究成果涵盖了大模型评测、复杂流程推理、竞赛级数学思维优化、强化学习优化以及生成式推荐等前沿技术方向。本文将深度解析美团如何通过这些技术创新,在提升大模型逻辑推理能力与实际应用效果方面构建生成式AI的新范式。

美团LongCat发布General 365推理评测集:Gemini 3 Pro仅获62.8分,多数模型不及格
行业新闻

美团LongCat发布General 365推理评测集:Gemini 3 Pro仅获62.8分,多数模型不及格

美团LongCat团队正式推出General 365推理评测基准,旨在为大语言模型的推理能力树立新标尺。在对26款主流模型的实测中,目前表现最强的Gemini 3 Pro准确率仅为62.8%,而绝大多数模型未能达到60分的及格线。这一结果揭示了当前顶尖AI模型在复杂推理任务上仍存在显著局限性,为行业评估模型真实性能提供了重要参考。

美团技术团队实践:利用Agent评测思路管理AI Coding,完成31万行代码重构
行业新闻

美团技术团队实践:利用Agent评测思路管理AI Coding,完成31万行代码重构

美团技术团队分享了在AI生成代码占比超过90%的背景下,如何通过Agent评测思路进行31万行代码的重构实践。文章核心介绍了通过技术债梳理、Rule建设、重构SOP及Pre-PR机制,将高成本的重构工作转化为日常迭代动作,旨在解决AI生成代码可能带来的混乱,提升系统稳定性与开发效率。