引子
最近在做文化相关的原因,遇到了一个难点——“文化究竟是什么?”
其实这是一个非常有意思的问题,传统机器学习领域研究的步骤通常包括特征提取,也就是给定一个任务,提取一个特征,用这个特征作为某种基向量进行任务的求解。同样,语言也有词向量,将自然语言映射到一个向量空间去进行后续的问题解决。最具有代表性的当属于CV——也就是计算机视觉领域。因为图像天然就可以被表征为RGB——这便是图像空间的基向量。
一个图片可以被三个基RGB分解,被表示为一个矩阵。这很简单。
那么文化呢?文化是一个社会学的抽象概念——其概念还没有完全被定义。各个学者都对文化的定义有不同的理解,比如上个世纪五六十年代,学者们就把文化当作社会不同方面的集合,比如道德、习俗、宗教等,后续的学者认为,文化其实就是价值观、人们的行为等东西的集合。不难看出,对于文化,并没有一个非常合理的基向量组供我们分解。
生活也是一样。
问题:如何描述你的生活?……
试想一下,现在你正在接受一个访谈,访谈者问了你一个非常简单却又难以回答的问题——“你的生活是什么样的?”
或许,你可能会这样回答,“我在早上八点起床,八点半吃早餐,……”。这是一种依靠时间顺序对生活进行描述的方法。是啊,时间会不会是我们生活的基向量呢?你会发现,这样的描述其实并不够,因为依靠时间对生活进行描述,永远无法描述出信念、想法等抽象的东西。时间是用来记录生活的,而不是描述生活。
或许,你可能会这样回答,“我的生活每一天都差不多,我会做很多事情,读书、练字、……”。这是一种依靠行为集合对生活进行描述的方法。是啊,行为会不会是我们生活的基向量呢?你会发现,这样的描述其实,也不够。因为行为依然没有完全体现出你究竟是谁,很多人会在一天内和你做同样的事情,那么你们的生活就是一模一样的了吗?
看到了吗?不论怎么去描述,我们都只能反映出生活的一个侧面,我们永远没有办法用语言刻画出我们的生活究竟是什么样子的。
区分一个人,很简单,我们只需要照片、姓名、身份证号就够了。但是如何区分生活——这听起来更像是某种科幻小说里的情节。
如何描述生活呢?拿一天来举例子,我们需要记录一个人每时每刻所看见的东西,每时每刻所听见的东西,所感觉到的东西,脑袋里想的东西。我们需要将一个人生活的方方面面去建模,然后加以记录,才能够真正的描述出来。语言……是远远不够的。
答案:……未竟之事
我并不认为AI没办法理解生活,或许说,“假装”理解生活,骗过人类。只是我们还有很长一段路要走。现在的大模型,真正理解自然语言吗?真正理解图像吗?我想,其实并不理解,只是这个“装作理解”的假象足够逼真,骗过了所有人而已。这就够了。
至于文化究竟要怎么理解,我觉得,这是要比语言困难,但是比建模生活简单得多的事情。文化或许就是知识的集合,而知识则可以以语言的形式进行传达。
建模生活,是AI要走的最后一步路,或许是最后第二步,我不好说。在这之前,我们要让AI更好地理解语言、理解数学、理解这些通用的知识,之后,我们要让AI动起来,参与到我们改造世界的进程中来——这便是目前具身智能所做的事情。最后,我们要让AI理解生活,再让它们有性格。
生活是绝对可以被矩阵分解的,只是对于生活的建模,这个模型的数学描述将会比较复杂。但是在未来,这绝对不是什么难以实现的东西。
还有一点比较有趣的事情是,AI理解语言,并没有遵循人类理解语言的方式来——难道人类真的会遵循BBPE,将一句话切分为很多细小的语词单元,然后向量化,最后理解吗?或许文化和生活最后也会被用类似的方式被理解。可能未来的研究人员会把文化拆分成某种人类难以理解的细小单元,AI对于这种细小单元的理解将会极其强力。生活也是一样的道理。不过,如果真是这样,那么我要说,造物主在创造世界的过程中,发挥了不少的奇思妙想。
