六、“侵入型信息战”
1 、“迅速制敌”之主要特性:环境控制
按照“迅速制敌”理念里的界定,环境控制指控制可影响敌人意志的那些东西,
并剥夺其控制自己军队和民众的能力。即使是在专制政权下,领导人也会设法通过
大众传媒来影响其民众。在这一节里,我们探讨这样一些技术,它们可被用来扰乱
领导人的信息,方法是嵌入假信息,或者至少造成对真实信息的怀疑。
看过《阿甘正传》这部电影或不少电视广告的任何人,即使是不经意地看,也
可能被这种现象逗乐过,即把当代人物放到历史背景中。很明显,在有足够时间和
经费的情况下,甚至创造出著名人物的看似真实、实属合成的图像也是可能的。在
这一节里,我们考察与极迅速地、甚至实时地创造合成图像有关的研究的公开文献。
这种能力可使指挥官将假信息迅速插入进行中的讲话或新闻广播中,从而起码使大
众传媒工具变成敌人使用起来极具危险的一种工具。
我们特别注意探讨的是,试图实时扰乱敌方领导人的电视讲话所面临的技术挑
战。指挥官或许想以在观众看来天衣无缝的方式插入一段“事先录制好的”信息。
或者,也许可对整个广播进行修改,使讲话者显得恐惧、病态和木然。作为首要的
要求,观众必须无法轻易分清真假。这意味着,不仅要有强有力的技术,而且还要
有好的“脚本”。
当前的最新技术水平可生成具有照片般真实感的脸部图像和动画,并使其与讲
话同步。这是通过使用一个基本模型对脸部视频图像进行变形处理完成的。目前,
这是在脱机情况下借助艺术手段和三维模型控制系统( 附着在演员脸上以监控表情
的装置) 进行的。通过对记录下来的数据进行适当的处理,可生成讲话。这还是在
脱机的情况下以极大的努力完成的。这些制作可能会有不同的真实感水平;随着场
景复杂性和制作速度的提高,成本也相应增加。
未来的系统将需要现有的多种不同技术的一体化,也需要计算能力的增强。为
了可以用部分合成的图像代替领导人的真实图像,我们必须首先建立领导人的当前
图像和声音的模型。在需要部分替代领导人的脸部、动作和讲话时,图像与声音生
成器将访问这一模型。
从对周围场景和在场人物的复杂建模,到对含有领导人突出面部特征的现有模
型的简单修改,可以进行各种水平的模型构建。人们对人类面孔的具体组成部分已
经有所研究。有关人类头发及其与头皮的相互影响的逼真模型是日本电报电话公司
开展的研究的一部分。安彦渡边和安彦未永的“用于毛发图像生成的基于三棱柱的
方法”一文试图解决由人发的高分辨率绘制引起的绘制问题。安田、叶子、鸟协和
稻垣在“一种用于织物的浓淡模型”一文中研究了织物——特别是人造丝织物和丝
绸织物的绘制特性。这些文章刊登在电气和电子工程师协会主办的《计算机图形与
应用》杂志,1992年11月号第15-24 页上。建模涉及的计算需要相当多的计算资源,
尽管模型的很大一部分可以根据现有资料脱机构建。关于人类面孔识别的一部开创
性著作是T ·卡纳德的《计算机对人类面孔的识别》( 博克豪塞出版杜1977年出版
)。面部表情与讲话的协调,是成夫守岛在多伦多大学的课题“更好的面部交流”的
研究内容。他们逼真的面部模型需要约4000个多边形,但可以每秒钟20多帧的速度
合成。面部模型的自动生成是未永在日本电报电话公司的研究课题,以“三维面部
模型的自动生成”为题的相关论文发表在电气和电子工程师协会主办的《计算机图
形与应用》杂志,1993年9 月号第17-21 页上。他们的方法只需要两幅正交的面部
视图就可生成适当模型。一些商用系统,如“运动分析公司”(Motion Analysis Corporation)
的系统,依靠对安装好的目标的视频定位来生成动作。其他一些系统在本质上是机
械的,用于测量关节角度,对于表现面部不是很有用。
音频建模也是必要的。如果讲话者得了感冒,合成的讲话也必须听起来有鼻塞
的感觉。如果需要以一种外国方言进行合成,这一过程就会变得复杂化。有几种合
成模式具有可行性:
◇完全使用计算机根据脚本和音素生成;
◇对说本族语者的话语的修改;
◇部分使用录制的话语生成。
当前的研究试图改进对整句的建模,而不是单个的短语、单词和音素。实际上,
音素生成器芯片已经问世多年。关于最新发展水平的精彩描述,可参见“人类语言
技术的最新发展调查”,这一项目得到了国家科学基金会的部分赞助。最终,讲话
者的面部表情和唇部动作必须与内容相吻合。这个问题已经得到很好的研究,至少
对于欧洲语言是这样。
一旦建成领导人的模型,人们就可以用他们自己的合成话语来部分代替领导人
的任何讲话。这样做面临的第一个技术挑战,是真实图像与部分或完全合成图像之
间的转换。这里有一个等待时间的问题,即对新场景的计算将使现实情景有数分之
几秒的延迟。如果场景全部是合成的,这也许不成问题,因为插入的部分多是预先
录制好的,主要任务是提供一个平稳的过渡。
现在有足够的计算能力来在脱机的情况下生成合成图像和声音,特别是当使用
的是常规低质电视广播设备时更是如此。然而,高清晰度电视的出现将要求更多的
计算资源,否则要冒生成的图像一看就知道是合成图像的风险。
实际操作起来,这是一个非常复杂的过程。为了给人以真实的感觉,插入的话
语在各方面必须符合讲话人的性格,否则就会受到观众的怀疑。知道在什么地方插
入信息和知道如何表述,需要操作者掌握大量技巧。
——泉石小说书库——
亦凡公益图书馆(shuku.net)
下一章 回目录