
Victor Riparbelli 在 Ted 演讲中提出了一个颇具颠覆性的预测:我们的孙辈可能将成为最后一代掌握读写技能的人类。乍听之下,这个观点几乎不可想象。毕竟,文字在我们的日常生活中无处不在,是我们表达思想和保存知识的基础。然而,随着 AI 驱动的新型沟通方式兴起,我们可能正站在一个新时代的黎明。
从历史长河看,人类不断追求更高效的信息交流方式。公元前 1500 年左右,第一个字母表的发明简化了复杂的书写系统。到了 1440 年,古腾堡的印刷机让书面内容得以大规模生产。而直到 20 世纪中期,识字才真正成为大众能力。今天,我们已经难以想象没有读写能力的生活。
但文字终究是一种不完美的技术。它高效、可扩展,却是一种 "有损" 的信息压缩方式。文字无法传递我们面对面交流时的语调、肢体语言和环境信息。同一段文字可能被不同人解读出完全不同的含义。我们发明了表情符号来弥补这一缺陷,但即使是表情符号也可能被误解。
而视觉信息则不同。看一张图片,我们几秒钟就能理解。若要用文字描述同样的图片,不仅需要更长时间阅读,还需要更高的认知负荷,而且每个人脑中想象的画面仍会有差异。
现实中,我们已经看到这种转变的迹象。TikTok 不仅是增长最快的社交网络,也是增长最快的搜索引擎。人们在 WhatsApp 上发送语音消息,购物时观看产品视频。Riparbelli 提出:"我们观看的视频越多,就越对文字感到厌烦。" 即使是热爱阅读的人,在学习新事物时也往往先去视频网站或收听播客,只有在真正投入某个主题时才会花时间读完一本书。
为什么如此多的信息仍以文字形式存在?答案很简单:成本。无论是时间成本还是金钱成本,今天我们必须在文字的速度与规模,或视频内容的准确性与吸引力之间做出选择。只有被认为足够重要的内容才会被转化为视频和音频格式。
AI 正在改变这一方程。2016 年,Matthias Niessner 教授的研究团队展示了如何利用神经网络制作极其逼真的视频。这促使 Riparbelli 创立了 Synthesia,一家 AI 视频公司。通过 AI,创作高质量视频的门槛将大大降低,就像键盘和电脑使人人都成为了作家,PowerPoint 使人人都成为了设计师一样。
Synthesia 的研究表明,77% 的人更喜欢通过视频而非文字学习。当 AI 视频与语言模型等推理系统结合时,将解锁全新的媒体类型。交互式、个性化的内容,能够根据个人技能水平和兴趣定制体验。
想象一下,教育将如何变革?孩子们可能会由他们最喜欢的名人在感兴趣的情境中教授数学。娱乐也将发生变化,我们可能会有交互式电影,永不结束的电视剧,以及通过 AR、VR 和脑机接口呈现的,越来越接近真实生活的媒体体验。
这些技术确实打开了 "潘多拉魔盒" 般的问题。我们是否在乎内容由 AI 生成?演员是真实的还是生成的是否重要?我们能否被计算机之间的互动所吸引?
尽管许多设想听起来像科幻小说,但这个未来可能并不遥远。正如 Riparbelli 所言,这取决于我们所有人,确保我们建设一个真正精彩的未来。
译者评论
从我个人的角度看,Riparbelli 的预测虽然有一定的洞见也有局限。人类的沟通确实在不断进化,视频和音频确实提供了更丰富的信息维度。然而,文字有其独特价值:它精炼、高效,允许读者以自己的节奏吸收信息,进行深度思考。尤其是那些抽象的概念,我们未必能够通过视频、音频等方式进行表达。
更现实的情况或许是,未来的沟通形式将更加多元化和情境化。文字不会消失,而会与新媒体形式共存,各自在适合的场景发挥作用。与其说是 "最后一代读写的人",不如说未来的人们将掌握更复杂的多模态信息获取能力,在文字、视频、音频和沉浸式媒体间灵活切换。
技术的目的是扩展人类表达和理解世界的能力,而非替代已经证明有效的工具。随着 AI 的发展,我们不应只考虑取代什么,更应考虑如何将传统与创新相结合,创造出更丰富的人类体验。
评论(0)