AI 烟花,失去了特定时空的灵魂,只剩下过目即忘的好看

X 上看到一位博主拍的日本烟花大会视频,很美。

他强调了一句「为了拍这六秒,我开了六个小时车…」。6 秒,6 个小时,便是我标题所指的时间。

过程与结果在时间上的反差勾勒了一种非理性的「投资收益比」。

而要论成本收益比,AI 在人类面前似乎占尽优势。这 6 秒的视觉效果,可能也就花它个顶多几分钟。

一场廉价的电子烟花,除了过目即忘的好看,连一个可让人津津乐道的时空坐标都没有。它可以在网络的各处重复绽放,它可以在任意的时间重复绽放。

它的美就像《阿凡达》系列利用尖端技术对电影画面极致的突破,首映惊艳,再来平平,三顾乏味;而真实的烟花呢,必须是《碟中谍》系列,阿汤哥用血肉之躯在真实的时空背景里突破极限。这是绿幕特效永远替代不了的一种包含情怀、故事和勇气的魅力——AI 无法模拟。

2 个赞

这不能用简单的投资收益比来去看整件事情。

投资收益比这个概念更多是被用在商业中的一个单方面的评价维度,并不能充分说明事物的整个面貌。

体验、情绪、回忆、期待等等这些都是过程中产生的价值,丰富且立体,多个价值的叠加组合又给人更复杂和更好的体验,这些都是AI无法做到的。这就像是知道和做到的区别一样,AI可以直接给你最后的结果,但过程才是人类成长的关键。和网上的那句话一样,懂得了无数的道理却仍然过不好自己的一生,这就是给你结果和你自己得到结果的区别。

抛开过程只取结果,无异于空中楼阁,就像历史一样,如果直接你给现在的生活,跳过过去发生的一切历史过程,你现在接触的现实的一切还将是稳固的吗。

人所做成的事情都是自下而上的建筑,你可以爬上去也可以走下来,是立体且丰富的,AI则是直接给你天空中的云朵,你只能看,想再进一步了解和探寻却够不着摸不到。

更重要的是视角的独特性,AI的位置和立场就注定了它永远无法站在和人类一样的立场和位置上去,相互理解彼此的视角和体验。对于人类来说只能看到AI给出的结果,却无法得知和理解AI产出结果的过程,AI看人类也是一样。

这种情况也在人与人之间发生,你无法对另一个人的一切感同身受,自然无法理解他的一些视角以及做出的结果和表现出来的情况。

之所以有题目“ AI 烟花,失去了特定时空的灵魂,只剩下过目即忘的好看”这种论调和感受,更多的是因为彼此视角的无法转变和过程的黑箱造成了这种特定视角下的评判。

投资收益比在此是一个为了方便表达的概念借用。

不同意「对于人类来说只能看到 AI 给出的结果」的说法,至少对目前频繁使用 AI 的人来说,它的工作模式是近乎「透明的」,这是工程师的刻意为之,但凡涉及推理,模型会展示思维链和用时,给用户提供这种确定性被认为是必要的,因为 AI 的本质是预测,同样的 prompt ,不同的用户得到的结果总会有差异,展示思考过程便是解释差异的最佳方式。ChatGPT、Gemini…这些被称为「基座模型」,各种 agent 的运行被称为「工作流」…它们的运行过程甚至比人类都透明多了,怎么能说 AI 只是输出了空中楼阁和天空云朵呢?

还有这句「AI 的位置和立场就注定了它永远无法站在和人类一样的立场和位置上去,相互理解彼此的视角和体验」,我看得有点云雾,AI 的位置和立场是什么?

我看 AI,已经不再是「机器、模型」这样充满硅基属性的冰冷角色,我更愿意将其视为「人类镜像」,能否互相理解,很大程度取决于你的 prompt,这和人与人的交流体验是一致的,你如果和朋友谈心时,遮遮掩掩,甚至避重就轻,自然对方无法带入。

AI 烟花,对照的是一类特殊的应用场景——故事性的,人物、时间、地点的要素缺一不可,且三者叠加构成了唯一性,结束即消失,无法一键重燃。这是「珍贵」的体验,AI 也无法不认同。

AI的思维过程不是完全透明的,尤其在深度学习中。

AI无自我意识,在意识自省方面依赖外部技术解析,它的逻辑展现依赖依赖XAI技术重建逻辑链,从个技术的视角去近似描述和还原AI的逻辑链,这些解释本身可能是对复杂计算的简化近似,未必完全反映真实计算过程。所谓的思维链更多的是人类为了理解和解释它给出的内容,而从第三人称角度所解读的结果,并非AI本身的内容输出的加工过程。
之所以说是空中楼阁和天空云朵,就是因为其黑箱的思考过程。一些回答的思维链和思考过程,细细琢磨起来其实很牵强,联系并不是很大。

就说这个烟花吧,人拍出来这个烟花的结果,他的过程完全透明,从为什么冒出这个念头到准备的过程,以及开车的六小时,甚至他什么时候的心情,如果想知道完全可以了解。而ai呢,它不会也无法告诉你它怎么一笔一画生成这个图案,过程中都用了哪些技术,为什么要用这个技术,都用了哪些数据,怎样获取的数据,怎样的计算和合成,这些都是无法得知的,最多知道一些人为设定的硬性输出框架,但这并不是其完整的过程。

它输出的内容是黑箱和另外一套工程师调试和设计的框架下的综合结果,可能更多的人看到的是工程师的框架和辅助工具,而不是AI本身的计算过程。

AI的位置和立场就是以目的为导向的工具性,而人就复杂得多了。人和AI是无法完全相互理解的,就和人和人一样。你我只能以一些工具和媒介去进行交流和极其有限的相互理解,去理解对方的意思、思维模式和思维视角。你只能看到我说的话,我也只能看到你说的话,我们通过话语的内容去尝试代入对方的视角和思维,从而进行相互理解。

所谓视角的独特性就更简单了,你我两个不同的人去做同一件事得出相似的结果,你的烟花有现实的时空坐标,我的烟花未尝没有电子世界中的“时空坐标”,之所以彼此对对方的结果带有偏见,只是彼此存在的环境不一样,自然达成结果的过程也不一样,审视和评价彼此的作品,自然都是站在自己的世界中去看对方的作品,这就是位置和立场天然的局限性。

AI的存在给了我们去了解它那个世界视角的可能,就像当局者迷旁观者清一样,给了我们从第三人称去查看我们自己的事情的新角度,就像不同的人对同一件事情的评价一样,每个人每一个新角度的分析和评价都让我们对事物的认识更加丰富和全面,或者你对这件事情想要的答案就是这无数视角中的其中一个。

我发现了一个情况,你和我所说的人与AI之间的理解可能是略有区别的,我所说的理解,不仅仅只是文字语境上达成的一致和理解(比如AI的回答不是胡言乱语,从它的回答中你觉得它理解了你文字种所表达的的意思,给予你正确语境中的共情和鼓励,给出了你满意的回答),还有对其产生结果的过程和独特视角的分析的背后原因的理解。我说的这种理解其实并不能真正达到,只能无限接近,因为ai本身是没有自我意识的,而且就目前为止其很大程度上并不是透明的,最关键的是我们并不是AI本身。

那就是彼此对「透明度」理解的差异了。

人对现实世界的烟花太熟悉了,这种熟悉可以时间和层次两个维度解释。

时间上,烟花的历史久远,属于「见怪不怪」;层次上,我们可以再聚焦一点,到烟花绽放的过程,通常人们只能解释道「火药」的层面,但再往深了说(具体的化学反应等),就超出大多数人的认知了。这就像小学生问老师:“为什么树会长高?”,老师会说:“因为它喝水晒太阳” —— 这并不等同于植物生长的真实分子机制。只是说面对不同的受众,知识降维有时是必要的。

对于黑箱的理解也是如此,可能描述为「生成式 AI 并非完全黑箱,只是目前我们无法全解」更准确。因为就像给小学生解释植物吸收的分子机制一样,AI 技术底层的 transformer 每一层、每一个 token 处理过程并非不可追踪,只是解释难度大、维度高。

再说回你对于人欣赏拍摄烟花过程「完全透明」的观点,只看表象,的确;但如果往深了探,我觉得未必。人的动机其实也可能是无意识驱动的,或者后期合理化的。就像我可能今晚就是纯粹被朋友约着去踢了场球,但事后才说「是为了锻炼减肥」。

而思维链也是一种「事后解释」, 所以,现实烟花和 AI 烟花的差异并不是「一个能解释、一个不能解释」,而是:人会「自以为」自己能解释;AI 是「别人代替它解释」。

你还提到「我的烟花未尝没有电子世界中的时空坐标」,我觉得这句话的表达略显模糊,如果将「未尝没有」换成「比如…」,会让论点更清晰。并且我前面在此强调的也是时空坐标的唯一性和不可重复,这是构成标题的重要因素。说白了,就是稀缺和廉价的心理和体感的差异。

站在各自的世界审视和评价彼此的作品,这也是现实的基本状态。人从直觉上就很难带入 AI 的视角,更难充分理解它的实现路径。这种落差(或者叫错位)可能就像两个起初意见分歧的人,包容和交流(对于人和 AI 而言,几乎没有分道扬镳的选项了)才可能形成最终人和 AI 的不断握手 :wink:

1 个赞