禁止白嫖!知名程序员问答网站Stack Overflow将收费提供数据训练AI – 蓝点网
最近禁止白嫖的禁止将收据训公司还挺多,继 Reddit 宣布调整 API 计划并要求训练 AI 的白嫖公司必须签订单独的商业协议才能获取 Reddit 的数据,获取的知名站数据可以用于商业目的包括训练 AI 模型,之前 Reddit 并未限制这种商业目的程序的数据使用。 今天另一个大型网站 Stack Overflow 也宣布了类似的员问政策,Stack Overflow 是答网点网程序员圈子里最知名的网站之一,是费提聚焦于技术开发的问答网站,上面有各种代码类、供数技术类的练AI蓝提问和高质量的回答。 显然对于 AI 公司来说 Stack Overflow 的禁止将收据训数据肯定是个宝库,上面数以亿计的白嫖提问 / 帖子不仅可以训练 AI 的语言能力,还可以训练编程能力。知名站只不过后来者不能再白嫖了,程序必须付费才能使用。员问 Stack Overflow 将在今年年中推出适用于大型 AI 开发公司的专属 API,要开通该 API 并用于模型训练需要付费,具体费用未知,不过付费套餐包括 5000 万条提问 / 回答,这个数据量对模型训练来说也是至关重要的。 Stack Overflow 首席执行官 Prashanth Chandrasekar 表示:为 LLMs 提供动力的社区平台绝对应该因其贡献而获得补偿,这样像我们这样的公司就可以重新投资我们的社区,继续让社区蓬勃发展。 Prashanth Chandrasekar 将付费 API 计划描述为确保该网站能够吸引用户和是保持高质量信息的关键,这反过来也有助于未来的 LLMs 训练。 此外 Prashanth Chandrasekar 还强调任何开发者现在都可以通过 API 抓取 Stack Overflow 上的内容,但是!LLM 开发者已经违反了服务条款,正如 Stack Overflow TOS 所说,该网站提供的所有内容均采用知识共享许可,这意味着使用数据必须注明来源且开源。 而 AI 公司向客户销售他们的模型时,他们无法将数据归因于具体的问题和答案因此无法提及对应的帖子和作者,所以这是违反知识共享许可的。(言外之意就是诸如 OPENAI、微软、谷歌等公司实际上都是侵权的)
-
上一篇
-
下一篇
- 最近发表
- 随机阅读
-
- 绝区零折枝剑歌搭配攻略分享
- 熬炼健身没有供人 三星Galaxy Watch5系列去帮手 -
- 开霆锋吐槽流量明星场面大年夜:他觉得本身是谁?
- 时髦与温馨兼瞅 三星Galaxy Buds2 Pro让您凸出秋季最in中型 -
- 《长安幻想》听说长安来了位绝世舞姬...
- 成龙收文记念陈木胜:最大年夜遗憾是此逝世无缘再开做
- GAI分享战老婆了解经历 王斯然用那句话表bai ?超苦
- 赵炳弟:“企业是社会公器”是松下ESG工作的核心理念
- 个人上半年工作总结【热】
- 综艺大年夜姐大年夜bai ?冰冰自曝曾患神经麻痹 好面爆血管
- 海尔智家徐萌:一心一意,冲刺千亿
- 育碧颁布收表:停止对《刺客疑条2》等游戏的多人游戏支撑
- 中油测井成功举办2024年测井仪修工技术技能竞赛
- 兰州周终带孩子往哪玩 带娃玩的好处所
- 逆势增长15.7%!海尔专卖店延续两位数增长冲刺千亿
- Angelababy七夕辱粉晒自拍腮白惹眼 粉丝催进组
- 追尾仅轻微损伤,领克06安全奥秘何在?
- 上市公司宜从三方面着手践行ESG理念
- 好国歌足贾斯汀回天 民圆收文证明:我们会驰念您
- GAI分享战老婆了解经历 王斯然用那句话表bai ?超苦
- 搜索
-
- 友情链接
-