过去互联网的运作逻辑是:
用户需要要获取信息 ——> 搜索引擎 ——> 点击网页 ——> 平台靠广告或订阅赚点钱(内容创作者有收获 或收益)。这种模式虽然不能堪称完美,但能持续运转下去。
而现在 AI 逐渐在重建新的模式:
AI 需要数据 ——> 联网数据来自网页 ——> 网页需要流量 ——> 流量来自用户。
逻辑的悖论在于用户使用 AI 越多,网页就越少有人看;网页越少人看,流量越小;流量越小收益越少,最终导致新增数据越来越少。而就目前的体验来看,AI 的回答质量很依赖“源源不断活水”,否则就会开始出现重复、模糊、空洞,因为它们本身也依赖用户输入带来的反馈,而不仅是闭门造句(除非那些不依赖新数据的 AI 应用场景,比如古籍资料知识库)。
AI 白嫖了网页的数据,还把网页的流量给“斩断”了,颇有种吃光抹净的恶人感。
这显然是不可持续的,且亟待解决。AI 不能坐等互联网的活水慢慢变成死水之后再讲回报。
有担当 AI 公司在意识到自己不能再像早期那样“吃白食”后已经付出行动了。 OpenAI、Google 等 AI 巨头已经陆续和多家媒体和内容平台签署了内容授权协议。
未来 AI 公司也可将部分订阅费或广告收入,根据数据的贡献度,分配给内容创作者。这类似于 YouTube 和创作者的分成模式。这是一个复杂但可行的方向,而且似乎只会照顾到大型平台。
再加之技术标准还没统一,不同的 AI 公司有不同的抓取策略,网站根本无法一视同仁地设置权限;即使阻止了 AI 爬虫,也不代表能立刻获得收入,还要等协议、分润机制、合作模式一套套谈好。所以前景还不容乐观。
互联网的生态和大自然的生态虽然有着硅基与碳基这样的生殖隔离,但其运转机制却有着本质的相同——循环。能量的循环,物质的循环…循环让内容和生命的周期可以持续更新下去。
AI 给用户提供了获取直接答案的快感,代价是答案背后的内容载体隐隐作痛,摇摇欲坠。
如果一直都没有新的协议和机制来保证内容平台能得到回报(小网站起码覆盖软硬件支出),未来的 AI 可能就找不到什么值得学习的内容。