计算创意学系列(三):组合性创造力的计算实现( 七 )


从概念整合的角度来看 , 这里我们是在整合第一张图片的内容相关的特征和第二张图片的风格相关的特征 。 这些特征全部都表示为向量空间中的向量 。 但同样由于两组特征来自于意义不同的向量空间 , 不能进行简单的算数组合 , 要通过神经网络训练所使用的优化算法(通常是梯度下降法)来进行含义上的相互逼近 。
DeepDream和NeuralStyleTransfer , 看起来跟DIVAGO是完全不同的算法 。 但如果同时从概念整合的角度去看待它们 , 还是能够进行一些有趣的比较 。
DIVAGO中的知识领域 , 是由一系列离散的信息所描述的 , 一个概念实体要么具有一个特征、要么不具有——只有两种情况 。 而DeepDream和NeuralStyleTransfer作为深度神经网络所考虑的那些特征 , 都是连续的高维向量空间中的取值——因此一个概念实体在多大程度上具有一个特征 , 就是一个能够在一定范围内连续变化的数值 。 从这个角度来看 , 深度神经网络意义上的“特征” , 可以看作是对DIVAGO概念下的“特征”的一个泛化(Generalization) 。
DIVAGO所处理的是人脑所理解的那些概念和特征 , 因此对整合概念的优劣评价 , 也是以人脑的“直观审美”为标准 , 由此衍生出了Fauconnier和Turner的最优原则中的许多条目 。 而DeepDream和NeuralStyleTransfer作为深度神经网络所考虑的那些“特征”和“概念” , 从一开始就不能被人脑理解 , 因此自然也不需要去优化它们在Fauconnier和Turner的最优原则上的打分 。 (Fauconnier和Turner所提出的“相关原则(Relevance)”是一个例外 , 即使是神经网络产生的输出 , 当然也要进行效用上的评估 。 )
在DIVAGO中 , 知识库来自于用户输入的知识领域的描述 。 是这些知识领域的描述最终形成了整合概念的搜索空间 。 因此对于概念整合算法来说 , 在一定程度上构建知识库的过程也就是构建搜索空间的过程 。 DeepDream和NeuralStyleTransfer经过训练之后 , 神经网络的中间层输出可以看作是在对输入数据所描述的原始实体进行特征提取 。 通过这种特征提取的自动化 , DeepDream和NeuralStyleTransfer在某种程度上可以看作是自动化了知识库构建的过程——虽然所构建的知识库人类并不能解读出意义来 。
尽管DeepDream和NeuralStyleTransfer只能作用于图像数据 , 但这种固定统计模型自身的参数 , 让模型去生成一个在当前参数下符合一定条件的数据的概念整合模式 , 可以看作是一个统计模型向人类沟通它对问题域的“理解”的一种方法 。 这种方法在一定程度上挑战了人们对于统计模型“都是完全不可解释的黑盒子”的认知 , 对深度学习的许多新应用都带来了启发 。
总结
这一章我们考察了三种组合性创造力的算法实现 , 从最开始严格按照概念整合理论设计的DIVAGO系统 , 到完全摒弃语义、只跟符号打交道的MetaphorEyes , 到最后彻底放弃人类所能理解的特征概念、用高维向量空间表征一切的DeepDream和NeuralStyleTransfer 。 在这条发展路线中 , 我们看到了对“知识库(KnowledgeBase)”这个概念的理解被逐渐泛化(Generalize) 。
DIVAGO中的最为传统的知识库概念 , 本质上将知识库看作是
一定范围内 , 将任意逻辑命题映射到真或假的函数 。
它用逻辑命题这种极具结构性的语法语义构造为知识建模 。 到了MetaphorEyes这里 , 知识库的条目不需要是严格的逻辑命题 , 而能够是任意文本数据;一条文本信息是否属于知识库 , 也不再是非黑即白的事情 , 而取决于对应谷歌搜索有多少搜索结果 , 有了一个程度的概念 。 因此MetaphorEyes中的知识库的定义变得更加宽松 , 成为了