突遭封禁!字节跳动ChatGPT API企业账户涉嫌违规使用,官方已承认并发布声明试图澄清与OpenAI的误会
据外媒报道,在生成式AI竞争中处于落后的字节跳动企图“抄近道”。
该公司被曝光一直在秘密使用OpenAI的技术来改进自家大语言模型,这违反了OpenAI商用接口的服务条款。目前,字节跳动的企业API账户已被OpenAI封停。
据悉,字节跳动利用他人产品来直接改进自家大模型的这一做法,在业内通常被视为“失礼”。虽然没有法律规定不可以这么做,但却直接违反了OpenAI的服务条款。
OpenAI的服务条款规定,该公司所提供的模型不能被用于“开发任何与OpenAI的产品和服务竞争的AI模型”。字节跳动通过微软方面购买了OpenAI API的访问权限,微软也执行与OpenAI相同的API政策。
字节跳动被披露的内部文件证实,该公司在大模型开发的每个阶段都依赖OpenAI的API来测试自家大模型,这一计划被称为“种子计划”(Project Seed),包括训练和评估模型的表现。
参与“种子计划”的员工都深知这一行为的不良影响。根据外媒曝光的字节跳动海外员工内部通讯聊天记录,他们讨论了如何通过「数据脱敏」来粉饰证据。
所谓「数据脱敏」,也就是对不便于公开的敏感信息进行伪装处理,常见于产品开发阶段对于个人隐私信息的处理,比如用户的姓名、电话和地址等。
外媒报道称,“种子计划”长期访问OpenAI API接口,以至于字节跳动员工的企业账户经常达到OpenAI API的最大访问上限。内部文件显示,字节跳动在“种子计划”的早期阶段最大化地调用OpenAI API接口。
几个月前,该公司命令该团队停止使用ChatGPT生成文本。
大约就在这个时候,字节跳动自家大模型“豆包”正式上线。
虽然字节跳动已经拥有了自家的AI大模型,但是该公司继续使用OpenAI API来评估“豆包”的模型性能。
体验豆包大模型,可以点击下方卡片:
字节跳动海外发言人Jodi Seth承认,ChatGPT生成的数据在“种子计划”的早期开发中用于注解模型。
但是他强调,在今年年中时候,ChatGPT生成的数据已经从字节跳动的模型训练参数集当中删除。
他对此还回应,字节跳动从合法途径购买微软提供的OpenAI API许可,API被用于驱动海外地区的产品和功能;在中国地区,字节跳动自研的“豆包”模型用于服务中国用户。
OpenAI发言人Niko Felix发表声明,确认字节跳动的企业账户已被暂停使用。
声明中提到,所有API客户必须OpenAI的的使用政策,以确保我们的技术被用于有益于用户的一面。
虽然近期字节跳动很少调用我们的API,但我们决定在调查期间暂停了他们的账户。
OpenAI保留要求所有用户做出必要改变或永久禁用他们账户的权利。
微软发言人Frank Shaw在一份声明中表示:
由微软Azure驱动的OpenAI API服务属于有限访问协议框架,我们制定了标准并提供算力资源,帮助客户负责任地使用大模型技术
微软有权在发现客户滥用API行为出现的时候停止他们的访问。
北京时间12月17日,字节跳动官方发布了一份详细声明解释关于使用OpenAI AI服务的相关情况:
公司在使用OpenAI相关服务时,强调要所有参与者遵守其使用条款,也正与OpenAI方面联系沟通,以澄清外部报道可能引发的误解。
✅今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPT API调用规范检查后,这种做法已经停止。
✅早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。
✅今年9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型输出结果与GPT的相似度,避免数据标注人员私自使用GPT。
✅未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。
截止EVA发稿前,OpenAI与微软方面暂时没有恢复字节跳动的账号访问权限。