这个其实跟之前有人讨论过的“AI 侵犯著作权”问题的本质是一样的:
AI 提供了既有信息既有知识的新排列组合,在实践当中有所裨益,但是并没有新东西,没有提供新的信息,没有扩展已知的知识边界。
而这个“重新排列组合”的过程,用到的“既有信息”“既有知识”又是从哪里来的呢?这些都是历史上“人”来完成的,AI 使用这些来排列组合这就涉及到著作权问题了。而现在的 AI 使用了这些涉及到著作权的“既有信息”“既有知识”来进行排列组合作为产品,用产品攫取了商业利益,同时基本上没有给原始著作权人足够的回馈,这在实质上这就是吸血了。
当然,“著作权”角度在表述上可能严谨程度不够,但是意思还是没问题的。
把这个跟 stackoverflow 再联系起来,这不就是这么一个场景么:AI (例如 chatgpt )使用了 stackoverflow 的数据来训练(训练如何进行“排列组合”),之后作为商业产品上线服务,攫取了各种商业利益,把用户也都给吸引过去了,stackoverflow 的“流量”不就暴跌了么。
@
liuliuliuliu #12
这就是刚刚说的“AI 没有扩展已知的边界”的问题。
但是 stackoverflow 现在的收入是来自于过去的积累,这种模式是不可持续的。