Christoph:通往自主智能的途径

9月18日,2018世界人工智能大会——依图科技“看见、智能”分论坛在上海举办。法兰克福高级研究所Christoph von der Malsburg教授为大家带来了题为《通往自主智能的途径》的主旨演讲。

法兰克福高级研究所Christoph von der Malsburg教授

Christoph教授认为,目前状态下的人工智能只是人类想法的一个投射,当下,对于人工智能来说发展比较快的是两项:一是算法,二是在深度学习上的拓展。

如果要进一步发展人工智能的话,就一定要更加颠覆性的创新和变革。首先,要清楚地了解自己的目标和问题是什么,比如自动驾驶、服务机器人的场景应用;其次,人工智能相关理论已经有50年的历史了,并没有那么多的创新,现在再进行人工智能的编程,成本是相对是比较高的。第三,在深度学习方面,人工智能的学习能力并没有那么强大,和一些两、三岁的小孩来比,人工智能的效率并没有那么高,所以目前还是需要给人工智能提供大量的数据和案例来训练它,这就是局限所在。

因此,在未来能有AI方面颠覆式的创新,需要去除一些障碍。

用“图示”理解物体

如果要类比人类的大脑和机器,我们需要大概1个G的内存去创造一个模仿人类大脑的神经网络,把它做成一个模型,并且我们还需要另外1个G的容量去训练它。大家都知道婴儿的学习能力非常强,可以在三年之内学会说话、懂得大人跟他讲话的信息,那么,人工智能是不是也能够用这么快的速度进行学习呢?

这幅图片是一幅早餐的图片,你可以看到这些物体摆放的位置,还有水果以及花朵的色泽是怎么样的。当我们看到这幅图片的时候会有一个综合性的感官,就是不仅图片描绘了什么,而且会联想到面包上的黄油,想象自己可以坐在餐桌旁边去享受这些美食。

如果用数字来描述这幅图,除了前面提到的2个G,我们还需要1PT的容量来描述这个画面。所以实际上,要想用一个综合性的描述方式来阐述这张图片是非常困难的,而且它也需要比想象中更大的一个算法。

那么目前是如何来读懂物体信息的?如果要识别这张图片上的物体,有一个概念叫做“图示”。可以看到,这个车是由不同部件构成的,不同的部件以非常有结构的形式组织起来,才构成了这样一个车。如何运用图示呢?我们用到了一个映射的理念,也就是说对于一件物体,我们在大脑中会有一个映射的概念,这样的话你就可以依次去描述它的颜色、材料、结构等。

因此,为了让机器去识别这样一个图像,也需要用到类似的图示方法。当然,关于图示,它们之间是有层级的,并不是以一种平行的方式陈列在那里。它会有特征和部件,以及它属于哪一种车,这些不同的信息是以有层级的方式组合起来的,这样才能分辨,一个图示是属于一辆什么样的车以及怎么样去使用它。

综上所述,对物体的理解实际上是基于对图示的考虑。此外,对图示的论述,在心理学方面也有同样的研究,我们可以从中借鉴。我们要去发现这个图示,在所处的场景和语境之下进行理解,以及它所代表物体之间的关系究竟是什么样的,这样才可以更好地去映射概念。

神经编码是有结构的数据

自主智能是怎么实现的?我们需要从图示当中提取关键的信息,然后再来描述行为模式。

在未来人工智能发展道路上的一个障碍,就是神经编码。它首先是一个数据结构,可以去表达所有的认知内容。第二,神经编码是一个有结构的数据,并且是基于一些模式的,我们可以发现其中的模式来进行神经编码。

目前,人工智能的数据结构有以下几种,第一种是经典的人工智能,是基于比特存在的,它们的表达能力是无限的,也没有结构化;第二种是人工智能网络,是基于神经元存在的,它们的表达能力是相对有限。有人认为神经网络可以去表达任何事物,这也许是一种偏见,在实操过程中,神经网络是有局限的。其实,这两种网络都是有利有弊的。

再说一个关于人脸识别的案例。这两张图片当中是同一个人,但是他们的动作以及表情仰视的角度不同。怎么实现这样一种人脸识别的技术呢?这个就叫做同物异形,并不是由一种单独的神经网络就可以去实现的人脸识别,需要很多层的神经网络,才能实现这一技术。我们可以采用模式识别的方法来进行识别,就是把图像信息转化为神经网络所提取到的模式,是关于神经编码的多动态链接架构。

神经网络自我组织机制

接下来,和大家一起探讨一个机制——神经网络自我组织。它是由几套不同的神经网络,共同来发射一些信号,然后寻找之间相关的关系,可以在这样的组织结构当中发送信号。

其中有一个重要问题就是,这些结构它的凸出是具有可塑性的,这些连接点是非常重要的,每一个连接点需要连接在一起,形成一个通路,这样能够帮助它们之间建立起相互的关系。这些连接结合在一起形成一个网络,这就是一个神经元的作用机制,这些是在大脑当中产生了活动的神经元活动网络。

还有就是大家非常熟悉的“结构”。从这个图片可以看到各个元素之间的互动,它会形成一些薄膜,像泡沫以及一些表面结构,会有一些张力。我们知道这种结构需要考虑到数学的计算,而且要等待一些分子的结合,以实现这种结构的打造。这种结构从数学分析的角度而言已经存在,需要分子结合在一起以后形成这样的一个结构,这里也有一些其他复杂的结构,像油、肥皂和水之间的结构。另外还有水分子,这是很多水分子之间相互作用产生的结构,由这些元素最终结合起来的结构。

关于结构方面的研究,这里有一个三、四十年前开展的项目,就是视网膜区域当中的这些纤维投影。一开始这些纤维到了这个位置的时候,它们是比较乱的,但是最后它们能够对图像和图像之间进行映射。这是一些随机连接的图像,可以看到这个称之为“天鹅”的映射,也是可以通过方程式来解释的。

基于以上观点,大脑的这些神经代码组成了一个网络,99.9999%的大脑结构都是来自于神经元的结构,要知道有多少的结构信息,在实际的大脑当中这种神经元传递的信息可以作为一个指南,对行为进行指导的。

加载更多>>
责任编辑:范琪
专题 更多>>
评论 更多>>
独家编译 更多>>