回归结构主义的视角来审视语言的本质,搞清楚语言和计算到底是怎么回事儿,人文学界究竟有没有摸透大语言模型是怎么运行的,这是当前急需解答的问题。就在最近,纽约大学德语系副教授莱夫·韦瑟比和数字理论实验室的头儿Leif Weatherby(这两个人就是一个人)写的《语言机器:文化人工智能与剩余人文主义的终结》(这本书是明尼苏达大学出版社在2025年出的)出版了。他提出,大语言模型把认知、语言和计算给分开了,这情况跟当年的结构主义理论挺像的。韦瑟比希望大家能回头看看多年前的语言学和文学理论框架,好理解现在的世界到底是啥样。他给现在这种人机关系取了个名儿叫“剩余人文主义”,鼓励大家别龟缩在越来越小的人类领地死守那种脆弱的人类定义,而是要主动勇敢地重新想清楚人和技术的关系。 韦瑟比觉得现在学术界分成两拨人:一拨死活要质疑人工智能,认为人类语言的核心是“说话者的意图”,或者觉得语言就是认知而不是文字;另一拨人彻底拥抱了人工智能,只想着怎么在超级智能时代活下去。他认为两边都没抓住技术本身的要害,都默认了有一道无法逾越的沟坎在那里,这样的思维反而挡住了大家深入理解语言本质的路。大语言模型其实是靠文本跑起来的,声音元素早就没了踪影,我们面对的是纯文本符号跟数学方法打交道。这就把韦瑟比带到了索绪尔那以后的结构主义那边。他在JHI的博客上聊过这个事儿。结构主义把语言看成是符号互相连接的完整系统。这个系统是活的、动的,意义是由整个系统说了算而不是孤零零一个“指称”决定的。 换句话说,系统不是“岩石”“母亲”这些指称堆起来的大杂烩。意义是系统内部关系的产物,是系统自己把指称功能和别的小功能都弄出来的。大语言模型的训练方式跟这也太像了:海量的文本先处理成矩阵模型,查询的时候再从中采样。所以韦瑟比觉得大语言模型把认知和语言、计算分开了。这就让结构主义的语言观和大语言模型有了个共同的核心:语言有它自己的本体性,动作独立于心理学、形而上学或者逻辑学那些范畴之外。 索绪尔谈的价值论跟马克思的价值理论也是两回事又不两回事。词语的价值看它在整个语言矩阵里的位置定——这就是“不存在实质内容”——这不正好跟马克思琢磨价值和价格的路子一样嘛。现在写文章、搞艺术还有上大学碰到的危机根本原因就在这儿:咱们搞不清大语言模型和人类写的东西有啥区别。韦瑟比反倒说这恰恰证明咱们已经在最本质的层面抓住了语言这东西了,说明语言结构跟数学结构其实挺配的。 而且大语言模型让人类头一回用数据量化了整个文化的分布情况,这肯定能拓宽咱们观察真实文化系统咋运转的眼光;人工智能将来也肯定会变得像文化本身一样。韦瑟比相信结构主义还有很多用武之地没开发出来。像雅各布森、巴特甚至德里达那些人以前琢磨过控制论的东西就很值得深挖一下。现在数字和文字在系统层面混着用,不需要人明确说概念就可以互相作用出结果了。 韦瑟比说他这本新书是理论书而不是写历史的书;他想弄个“剥离认知的语言与图像”的混合理论出来;把文学理论、认知科学和数据科学捏合在一块儿。他希望能弄出一个研究所有意义怎么生出来的“普遍诗学”。这就是人文学科面对人工智能挑战的好机会——数据科学都跑到人文领域来了;人文学者得正面迎上去;别藏在那些老掉牙的术语后面瞎糊弄了。有个大伙儿心知肚明的现实是:一两代人以前就退出了这类严肃讨论的舞台了。