复旦大学计算机科学技术学院教授、博士生导师,中国自动化学会普及工作委员会主任,混合智能专委会副主任

2021年12月9日,Facebook母公司Meta宣布其旗下的VR世界“地平线世界”(Horizon World)正式向美国和加拿大的18岁以上人群开放。这是Meta的社交/工作平台,供用户在元宇宙中创建内容与互动。近日,百度也宣布将于不久后的12月27日发布元宇宙产品“希壤”,届时百度AI开发者大会将在希壤APP举办。这也是国内首次在元宇宙中举办的大会,可同时容纳10万人同屏互动。百度“希壤”虚拟世界

Metaverse是meta和universe的组合,意思就是要超越现有的宇宙。这也是为什么脸书的扎尔伯格把公司名字改成Meta的原因,因为他希望获得在互联网上的超越。那么,元宇宙怎样形成一个更高层次、更超越的宇宙呢?元宇宙的设计者们给出了一个初步的答案,即有六大支撑技术,称为BIGANT。B是区块链Blockchain,I是Interactive交互,G是Game游戏,A是Artificial Intelligence人工智能,N是Network Computing网络计算,包含云计算和边缘计算,T是Networks of Things,即物联网。元宇宙BIGANT六大技术全景图

但依我看,更理想的元宇宙,可以是建立在人的梦的基础上的。因为它不用追求多高分辨率的虚拟环境,但却有着更强的身临其境的沉浸感。我们也不用太多的传感器来构建物联网,只需要有一个能相互串梦、能进行远距离梦境传输的脑机传感器,就能帮助实现灵魂社交。而且,梦里的金融和梦币交易更容易实现去中心化。因为在梦里,是无论贫困富有、健康或疾苦,人人平等的。如果再辅之以人工智能帮助提升梦元宇宙的愉悦感、沉浸感等,如此这般,我们才有可能把梦的元宇宙做实了。

如果要给这个梦的元宇宙取个名字,我觉得可以叫元梦(圆梦),Metadream!

元梦(Metadream)是最理想的元宇宙实现方式,但如何实现呢?对照目前元宇宙的六大核心技术(BIGANT),我初步对称地构造了元梦里需要的六大关键技术(MEDQOT),按元梦的六大核心技术的次序,来逐个简述。

比特币的不足在于去中心化的外壳下,实际有可能被中心化控制。原因在于,参与这一金融活动的人并非是人人平等的,有些人的话语权是会(严重)影响到比特币的价格。要抵消重要人物的影响,必然需要一个人人平等的环境。而元梦的载体——梦,显然是天然具有这一优势的,因为人人都可以做梦,不管你贫穷或富贵,健康或者疾苦,在梦境中大多可以放松下来。所以,良好的环境载体有了,我们需要引入的,无非是一种能在元梦中流通的虚拟货币,估且称之为Meta Coin,元币M。说起来,它也有点一语三关的意思,因为也可以把它认为是一种梦币(Meng Coin)。当在元梦中,收获一堆梦币的时候,说不定会有一脸梦币的幸福感。那么,如何生成、加密和解密梦币,并保证它的唯一性、独特性和流通性呢?按照比特币的生成原理,其实可以类似地生成梦币。即通过联入元梦的人所形成的元梦系统,来自动生成一定数量的梦币,作为梦工奖励,从而完成梦币的发行。每个进入元梦的人本身也参与扮演了元币发行的角色。

另外,要加密和解密元币,可以利用人的大脑的存储功能,将元币的一部分信息存储在每个进入元梦的人的大脑里,形成私钥。同时将公钥分享给信任的元梦社区的人,就能进行交易了。因为私钥存储在每个人的大脑里,所以,它有着更好的专属所有权。另外,它还有一个独特的性质,就是活体性。当然,如果希望将元币存储在体外也可以考虑研发能保护唯一性的元币银行。

自2012年深度学习流行开始,人工智能进入了第三次热潮,也可以说是处在人工智能70年历史以来最红火的时代。与以往的二次热潮不同,在深度学习模型、大数据和能执行高性能并行计算的GPU显卡的三驾马车拉动下,这次热潮形成了不少可落地的应用,如人脸识别、视频监控,在目前流行的短视频里也能看到很多人工智能技术的运用,如人脸年龄变换、换脸、变卡通等等。

元梦中参与的个体是人,且是人类的大脑部分,如果采用的人工智能技术不具备高的可解释性,就很可能存在不可预计的风险。要解决这一困境的办法之一,是需要寻找预测与可解释性之间的平衡,即平衡智能(Equilibrious Intelligence)。首先,它应有好的预测能力,即能通过采集元梦中的大数据,辅助预测元梦中发生事件的一些可能结果,对危险、高风险事件能形成预警,保持元梦环境不至于失控。其次,要有好的分析推断能力,即能推断出不同事件之间的关联性、因果性,发现隐藏于元梦中的反事实,形成更合理的可解释性。第三,具有零星异常事件检测和收集能力。元梦中相对个人来说,有不少活动的细节,以大数据的统计来处理的话,是属于优先被遗忘的。但对于元梦里的群体来说,有可能是引起共情的重要事件,是实际需要收集的。这对于元梦来说,属于关键因素之一。最后,是需要在强的可解释性和好的预测能力之间寻找平衡,不应该靠向这两个方面的任何一个极端。一来是保护元梦的个体不至于受到伤害的前提,二来也是维持元梦环境平衡的关键。基于以上框架设计的智能模型或智能体,就符合平衡智能E的理念。

用梦境学来替代元宇宙的电子游戏,至少有三重好处。一是不像电子游戏,梦不占用人类额外的时间,因为这是人本身必要的休息时间。因此,对正常的学习、生活、工作影响相对较小。二是不需要进行额外的底层设计,是人类本身自带的,是off-the-shelf(现成的)。三是不需要高的分辨率和色彩还原度。多数梦境都是模糊的、黑白的,只有极少数能呈现颜色。

在梦境学中需要做的,主要是如何从梦境中学习出能建构元梦的素材和场景。同时,利用梦境来增强对真实世界的适应。说起来容易,实现起来并不容易。原因在于,以现有的技术手段,读取梦境很困难。尽管可以通过检测大脑释放的脑波来判断睡眠的状况,但当人进入深度睡眠时,不容易被叫醒;虽然有文献对浅睡眠阶段的记忆进行过研究,但出现的梦境与深度睡眠时的相比,可能还不能算成是真正意义上的梦境,没有很强的故事性。另外,做梦的测试者要还原梦境形成可学习的素材也不容易,因为梦境中的元素多数是转瞬即逝、不容易记住的,这一点有些类似七秒钟的鱼。另外,能否利用梦境来辅助学习也是值得研究的。梦对学习的影响,一般有两种方式,一是提高梦的召回率,二是主动式梦境学习。后者还可细分为清晰梦境(Lucid Dreaming)和梦境孵化(Dream Incubation)。另外,梦境学习的效率有可能做到比日常生活高不少。人们经常会感到在梦里过了好久,醒过来发现也就十来分钟,或者一个晚上。所以,古人才会在《枕中记》里写下卢生“黄粱一梦”的传奇故事。

事实上,即使在深度学习中,我们其实也能看到大咖对梦的思考。如图灵奖得主Geoffrey Hinton在其于1995年提出的神经网络算法中,就曾采用过清醒-睡眠(wake-sleep)交替的模型来优化网络参数。他认为,从底往上建模时,它就像是人在清醒的阶段。但如果一直用这个阶段来优化模型的隐层参数,计算复杂度会指数级的昂贵。所以,他提出采用反向操作,基于从清醒时学会的顶层,自顶向下生成“幻想”(fantasy)的抽象表示。他相信,这些表征能构成对网络生成模型的无偏采样。在此基础上,再进行参数权重的优化。因为这个策略不依赖于外界的输入,所以那些幻想的表示就像是睡梦里产生的一样。

要实现不同个体的元梦间通讯、分享、融合,依靠现有的物联网技术是不太合理的。其原因是,在元梦空间的联络和通讯中,主体是碳基生命的人类,而碳基生命的信号都是连续态。因此,如果采用0和1二进制为基础的冯诺依曼架构的计算机和相关设备,来构建元梦传感器网络,显然不是最合适的方案。另外,在元梦中,要在个体上实现低功耗和快捷的通讯和计算,可能也不宜将计算单元与存贮单元分得过开,最好是与存算一体的忆阻器类似的,这同样也需要打破冯诺依曼的计算架构。在我的有限知识下,我还找不到一个特别合适的网络来实现这些功能。也许,量子力学为基础的理论框架相对能靠上,毕竟它的状态是处于0到1之间可以连续变化的概率态。而且,国内外也有一些科研院校在研究,如何利用量子叠加态和纠缠效应进行信息传递,以实现量子通讯。所以,能够实现存算一体、不依赖二进制的量子网,应该是元梦的可选核心技术之一。

元宇宙的网络计算包含云计算和边缘计算。前者是期望利用算力,后者是期望利用边角废料。但元宇宙中,这两个计算,都较少关注新的知识生成,这是与元梦不同的地方。在元梦里,可以考虑个体和群体两类的计算,或称为个脑计算和群脑计算。

个脑计算是因为,人的大脑在睡眠期间,似乎是在运行着一个不同于清醒时的并行计算机。梦境再多,也较少影响白天大脑的正常思维。类似地,白天的大脑运行也很少会产生梦境,除非过量饮酒或饮用其它致幻物。除此以外,人类大脑各个脑区的活跃度在不同时刻是不一样的,如果可以自适应地将某个不太活跃的脑区利用起来,则可以让其行使与边缘计算类似的计算功能。

其次,进入元梦的是一个群体。因此,群智计算的潜力是巨大的。借用目前流行的名字,头脑风暴,可以研究头脑风暴式的计算(Brain Storming Computing)。在此框架下,一方面能利用元梦中的群体共有资源来替代云计算。另一方面,由于参与计算的群体具有明显的个体差异,在元梦环境中进行自由、自发地计算时,有可能产生新的元梦模式或新颖想法,从而扩展了元梦的功能和想象空间。

与元宇宙框架中强调交互不同在于,元梦更希望强调在这个环境里的共情(Empathy)、灵感与顿悟的探索、自我与虚实的不可区分性,因此,要实现这些目标,不妨将心灵感应视为元梦的核心技术。

事实上,我国著名科学家钱学森曾提倡的思维科学(Noetic Science)中,也曾希望能把人这一块的潜能发挥出来。只是当年的环境、科学认知水平,并不足以支撑相关的研究与探索。而依赖目前的技术,还是有可能看到一线曙光。为什么呢?不妨做个类比。比如心跳的检测,最早是需要通过把脉或听诊器来完成,这些都需要有直接身体的接触。而现在通过手机摄像头,观察人脸上人不能察觉到的细微变化,也能近似估计出心率。人脑在梦境中会释放一些脑电波,如目前已知的alpha、beta、theta、delta四种波。理论上,这些脑电波和个人自己的梦境是无法影响其他人的,也难以形成所谓共情之类的心灵感应。但如果能通过设备放大,寻找元梦中人群里的共性成分,那么就有可能被学习到。对于目前还不清楚机理的灵感与顿悟,有可能也会因为有元梦的大数据支持,从而寻找到其形成的原理。再假如说能设计出混合设备,将这些脑电波再送达元梦中的其它个体,那么就可能形成感应。

不仅如此,在这个感应体验中,我们还可以考虑研发一些增强虚拟的设备,让人可以在现实中也体会虚拟的感觉。比如,增强虚拟(Augment Virtuality)/混合虚拟(Mixture Virtuality)/现实的虚拟化(Real Virtuality)。直观来说,就是可以适当增强元梦中真实感,或来自真实世界的信息;现实的虚拟化则是让现实环境更类似于虚拟的世界。

□ 文/张军平(复旦大学计算机科学技术学院教授、博士生导师,中国自动化学会普及工作委员会主任,混合智能专委会副主任)

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注