八、秋分 自然语言与中文结构 综合前述各项说明,我归纳出了中文文字概念之基本因素。根据这些基本因素, 才能将每一个中文字汇明确地界定清楚,并贮存在计算机中。当某一文字输入时, 经过程序之基本因素分析,计算机之“意识中枢”便得到所代表的概念。意识中枢 亦能反向将基本因素组成概念,并将之转化为语言、文字,以与人沟通。 这些基本因素即为各种主观客观现象之根本,透过计算机中的“意识中枢”之 “了解”程序,凡与概念结构有交集的,则分别与所设定之概念连通,意识即产生 了对此概念的“认知”。有了了解及认知,再加上计算机做为主观个体之“立场”, 以预设的“目标”作为“判断”条件,计算机便有了“智能”。在必要时,尚可以 赋与“行动”的能力。 以下我简单地说明其具体之步骤以及设计之原则。 在概念资料中,“基本因素”具备三种特征: 一、代表客观、主观等现象最基本且完整的观念: 对概念而言,“基本的”并不等于“单纯的”,由于形成概念之联想特性,主 观客观交互纠结,没有任何概念能独立存在。因此,我将前表的二百五十六种分类 假定为最基本且完整的观念,并视之为分类因素。在实际应用时,尚须利用分类因 素作交集定义,才能明确地将每种概念加以界定。 二、文法或文字应用之原则: 文法是硬性规定的,没有灵活的变通性,虽历经许多语文学家的努力,始终无 法整理出一套具有公信力的中文文法来。也幸亏如此,我们得以摸索出一条中文文 字应用的原则。基本上我们承认主词、述语之陈述结构方式,但在文字与文字结合 时,则采用弹性的始态、终态、连续态,以“达意”为原则。 三、有与感应功能机构(即感官)结合之条件: 要让计算机达到认知的目的,必须了解计算机之特性,利用数据总线以及软件 程序多次选择的功能,每当“概念”资料传送到总线上时,可以选定适当之输出入 端口,使“感应功能机构”得到正确的电流脉冲。 前两项在前文已解释过,现略分析分类基因与感应功能结合之方式,即得到下 列关系。实际上此类结合常涉及知识,而知识系贮存在“知识库”中,除了预设之 知识外,尚可以经由学习过程,填入数据结构中。 概念是独立的单元,仅能代表静态的事物。而人类处身在四度空时中,面对的 事物瞬息万变。因此,人类在认知或表达概念时,必须使之成为动态的形式,这种 动态的形式,早在原始时代即被普遍应用为语言。 如果以电影为例,一格一格的画面可以视作独立的概念,放映即是将静止的画 面连续成为动态的画面,人藉此了解电影所表达之原意。因此电影也是一种语言, 而且灵活又有趣。想要了解语言真相的人,最好先由电影分析着手。 语言虽然发展得早,但在发展初期人类的智力尚未成熟,对于规律的掌握还在 摸索阶段。 故越早期的语言, 其规律性越低。学习第二种语言的人,常对该语言 “不规则”的文法、字词变化等伤透脑筋,偏偏那些最讨厌的部分往往是最常用的 习惯语法!由所有不规则的习惯语法,可以看出来人类最初的习惯性行为是什么。 奇怪的是中文中并没有“不规则”的观念。 中华文化真正的价值,就在中文的概念结构。过去因为对信息认识不足,无法 发挥中文的绝对优势。好在真理不辩亦明,中国人亦为人类家属的一员,过去遗留 的宝贵资产,尚有待未来人类共同努力,发扬光大。 我开始考虑概念分类时,就像做中文输入研究一样,完全是在黑暗中摸索。等 到理出一些头绪,有了初步的结果后,才发现美国学者早在二十几年前就考虑过这 种方法。但是他们只做了些最表面的分析后,发觉此路不通。自后因为计算机技术 的进步,学者专家纷纷改由分析文法及字典着手,仍然没有找到可行的方向。 近年来概念分析似乎又有抬头的趋势,可是据我研究的结果,英语在长期发展 过程中,倚重发音以表达概念。在录音机未发明之前,声音无法记录,全赖一代一 代之间的口口相传。加以人类能辨识的声音有限,必须采用复音节才能有效运用。 这一来,一个英语字汇本身就是一组复杂概念的结合,很难从中理出基本概念来。 其次,英语有规则严谨的文法结构,虽然有其优点,却因此丧失了语言文字的 演进痕迹。我们要想找出人类思维的真相,就必须了解思维所应用的元素,这些元 素就是组成原始文字语言的基本概念。既然英语业已经过整理,现代人所用之英语 必然与整理前的有所不同,那又如何去找寻那些失去的环节? 人类最初发展的概念一定是不完整、简陋不堪的,我们想知道人是怎么了解概 念,其途径之一是找到概念的发展原因及过程,此必须有保存良好的原始条件。对 英语甚至所有的拚音系统来说,这个机会是非常渺茫的。中文基于视觉符号的发展 应用,走向图形文字,每个图形在当初只代表一种具体概念。后来虽然扩大了应用 的范围,注入了一些新的认知,但原意还在,而且各种文献一直保持至今。 中文最有利于追溯思维因素的一点,就是其单音概念。单音因为不易辨识,所 以中文常将单音字组合成“词”、“成语”来使用。这些单音字正好就是各种概念 的矿床,只要能有系统、大规模地整理研究,人类思维的历程必然昭然若揭。 我在沉红莲的协助下,收集了近二十万个“词组”,花了很久的功夫,把每个 词的含义以及组成词的各单字间之关系,一一加以分析,又经过多次的修订,才得 到第七章的分类表,以及概念基因和常识结构等。 我不厌其烦地说明这点,主要的原因是希望国人了解中华文化的博大精深,绝 对不是虚语。尤其我很希望当今从事中国文学以及语言文字学的学者们,千万不要 妄自菲薄。风水轮流转,智能之钥已在你们的掌握之中,智能科学就靠各位发扬光 大。 我很了解自己,创新突破是我的长处,但却缺乏严密周全的细心。智能科学将 是人类文明对宇宙进化的最终贡献,唯有大家捐弃私心、成见,精诚合作,截长补 短,才可能有真正的成果。至于上述的分类,只是在启蒙时期,个人一点不成熟的 心得而已。 以下且以使用最频繁、最复杂的“打”字为例,说明我们怎样利用中文的特性, 将其前后字义的关键分析出来(其余的文字也是以同样的过程,一一整理归纳出来。) 我们所收集有关“打”字的复合词,因数量太多,在此仅抄录具代表性者如次: “打”字在前,后接动词、名词、状态词等: 一、动词在后,“打”或指一种行为,或表某种动作或行为之进行。 打斗,打仗,打劫,打击,打扰,打闹,打猎,打扫,打捞,打造 打磨,打扮,打赌,打量,打鼾,打盹等。 二、名词在后,泛指用手进行之活动(可能有引申义): 打球,打牌,打更,打鼓,打锣,打针,打铁,打靶,打拳,打勾 打油,打水,打酒,打柴,打鱼,打包,打结,打伞,打字等。 三、指动作行为,后接终态词、结果词或程度词: 打定,打成,打下,打住,打完,打好,打坏,打消,打伤,打死 打破,打穿,打断,打碎,打烂,打倒,打通,打动,打得等。 四、典故,或因习惯用法而有他义者: 打发,打尖,打点,打烊,打折,打算,打雷,打诨,打手,打哑谜等。 由上可知,“打”在前时,多以其后之字定义,本身仅作发生、进行及完成助 词。 “打”字用在后面者较少,除用作单位外,多为“打”之动作。 一、前为数字者,“打”作为单位用: 一打,半打,两打,几打等。 二、前为动词,表示打之方式,前为名词,则指用工具之动作: 扭打,撕打,拍打,拷打,捶打,摔打,抽打,敲打,殴打等。 鞭打,棒打,锤打,拳打,手打等。 三、前为助动词、形容词、副词,则描述“打”的情况: 能打,肯打,会打,爱打,乱打,狠打,痛打,经打,耐打等。 四、专用术语: 单打,双打,代打,全垒打等。 我们一再分析各种单字之组合,发现了中文词组有一定之组合方式,除了一部 分习用已久或出自典故难以合理的归类外,绝大多数都有前后顺序之关系。一般说 来,同性质之字,前面的字义多为“始态”,后面的则为“终态”(亦即前者为因, 后者为果)。形容词、副词多用在前,一旦用在字后,则一定是一种结果的状态。 这种发现奠定了我们对中文具有“映画”功能的信念,因此,我们仅以单独的文字 概念作为“动画”的元素,再以前后之关系定义之。 这种方法不但可以节省文字定义的空间,重要的是应用灵活无比,只要再加上 “修辞”模块,中文自然语言就算完成了。 举例而言,“逃”是人或动物在某种原因下,因本能反应或意识驱使,以行走 或任何交通工具,避开某个特定对象的动作行为。逃的结果,使位置或关系产生了 变化。 从上述的定义来看,“逃”本字的概念并不完整,难以理解。充其量我们只能 肯定这是一个主体所控制的动作。 再详细加以定义,以“逃”为述词,如前用一主词或副词,如“他逃”、“快 逃”,其意甚明,毌庸细述。其下接名词,或作为“逃”之对象,或以“逃”修饰 该名词,是一种最常见的叙述方式: “逃家”:主词通常指人,但凡“家中之成员”均适用。 (猫狗亦可逃家,但可能性不大。) “逃学”、“逃课”:根据其后名词之限定,主词必为学生。 “逃兵”:主词为兵。 “逃税”:主词为人,且为有收入、有义务纳税之人。 “逃狱”:主词为囚犯,“逃犯”则为专词。 “逃难”:主词多半为人,然动物也可能有灾难。 “逃命”:主词指有生命、能动作者。 如果后接动词或状态词,则表示逃后之结果,如: “逃避”、“逃遁”、“逃匿”:逃后不知所往。 “逃离”、“逃走”、“逃脱”、“逃开”、“逃掉”:皆表示逃后,不同程 度地达到了逃的目的。 如果把上述之词颠倒过来,有些难以理解,有些则产生不同的概念,如: “遁逃”:遁有不使人知之意,表示悄悄地先遁后逃。 “匿逃”:匿是静态的,放在逃的前面,无从解释。 “避逃”、“离逃”、“掉逃”:由于“避、离、掉”三字皆有结果之意,其 后再接动作之词,很难会意。 “走逃”、“跑逃”:走及跑皆为全动态,已为逃所涵盖,故不适用。然而走 及跑亦具终态之意,故用在逃之后面则可。 “脱逃”:指先脱离后,再逃者。 “开逃”:开始逃。开在此不是结果词,而是时间词。 由上可知,两个单字结合时,其在前在后有一定之语意规则,不然就词不达意。 这是中文独具的特色,应用起来异常灵活,奥妙无穷。 在我粗浅的分析中,动词有状态词及动作词两种,分别说明如下: 一、状态词:又分为始态、连续态及终态,皆表示一种动作在某一时间内之状 态。此类词可以用为动词,但却只表示某种动作之状态,与动作无关。如: 兼具三种状态者,如“开”、“启”、“发”、“起”等。 “开门”、“开罐”、“开幕”、“开山”等词中,如何“开”法并不是概念 的主旨, 只是表明了一种状况的开始。 同理,“打开”、“张开”、“铺开”、 “走开”等也只表明了一种终止的状态。“开打”、“开演”、“开讲”、“开跑” 等则表示动作之连续态,在这种状态下,“开”之后皆接动词。 终态:“满”、“止”、“停”、“住”、“死”、“谢”等,这类概念不能 用进行式,多为已经完成者。 连续态及终态:“灭”、“消”、“减”等,虽为终态,亦可作连续用。 二、动作词:即一般所谓之动词,除文法上之特性外,在字义上可分为动作及 行为两大类。动作有自然力的运动,主体驱动之运动,动作之结果与其所产生之终 态有关。行为则有动机及起因,环境及效应等因素。 以动作为例:“流”为自然力之运动,主体为液态物,因地心引力,由上往下 运动。如果引伸为状态词,则表示一种连续态或终态,指自然而然形成者。中文凡 属水字旁的字,多有自然现象的涵意,又凡为动词者,多具状态的特质。这是因为 古人造字时,先有了事物之形,再观察事物之性质及所产生之状况,遂以事物为分 类标准,当作偏旁,故都具有特别的属性,详见后面前缀之分类说明。 主体驱动之动作词亦然,凡属自发性动作,皆归类于运动之主体。这种分类法 对于字义的了解及运用有极大的优点,譬如说西方的人工智能研究中,由于英文不 具这种功能,字义完全依赖字典提供,字与字之间不具依属性。要回答“什么会飞” 这类问题时,除了事先建妥庞大的“知识库”外,几乎没有其它简便的解决方案。 (要知道类似“什么会飞”这样的问题是无穷无尽的!) 对中文而言,“飞”的属性是因能飞的主体而产生,前人在创造文字时已经处 理妥当,除了一、两个例外,所有“鸟”旁的字(仓颉码之后三码为“斜日火”者) 都是会飞的动物,其余“飞机”、“飞船”、“滑翔机”更不用说了。换句话说, 在文字的结构中已经蕴含了字义的分类。如果把字义视作人类经验所得的智能,那 么,我们可以大胆的宣称,中文是具有智能的文字,根据中文来发展“人工智能”, 将远比英文来得容易。这也是何以我个人胆敢大言不惭,自命了解智能,说穿了, 不过拾得前贤一点牙惠罢了。 行为词更有规律,缘因人类对行为的认识,多在文化层次发展到某一阶段以后, 造字时已有成规可循。如人与人之间的行为,多以“彳”为偏旁;运动位移的行为, 则采“辵”旁;思考的行为,为“心”字旁;言语的行为,则为“言”字旁;用手 脚的行为,为“手”及“足”字旁,诸如此类,如女、纟、金、木、火等,不胜枚 举。 所以,我认为中国人未来的前途,完全系于中文专家身上,未来人类的“思维 科学”也端视中国语文学家的努力而定。毕竟中国文字不是“快餐”品,历经了几 千年,动员了无数不计功利、默默奉献、没有私心的伟大的人类菁英,将人的睿智 浓缩在一个小方块中。这种信息是宇宙进化史中最珍贵的宝藏,是至高无上的智能 秘籍! 炎黄子孙们!“思维科学”必是未来世界的主流,身在宝山,还有什么需要外 求的?不自行努力,琢磨这块璞玉,反而一味盲目的“西化”、“简化”,妄把他 人的残渣剩滓奉为圣品,那不是愚昧又是什么? 我个人学浅才疏,所知万不及一,言尽于此。世人是否能有造化,也非我能揣 测,邵康节梅花诗言:“一院奇花春有主,连宵风雨不须愁”。喻之国人,差堪告 慰。不过,今天中国需要的是信心,未来之中国则戒之在狂傲。文化属于全体人类, 能相互学习切磋,截长补短将是人类之福。褊狭的地域或人种观,必将自陷于绝境, 不见容于千秋万世。 中文另外一个极有价值的观念,即为“部首”的常识分类。任何一个人绝不可 能有足够的能力与时间,认识到所有事物的通则,但是一个绵延不绝的民族则有此 可能。尽管可能,也要有必然可行的方式,一代一代沿用这种方式,不断发展下去。 在设计仓颉输入法的时候,我就发现了大部分的形声字都以字形偏旁作为字义 分类。根据这种现象,我正好将文字取码与字义结合为一。因此仓颉字码不仅仅是 索引符号,又是该字的字形及字义分类。目前一般人或许还看不出其功效,一旦进 入自然语言的领域,字义分类便是人类认知的成败关键。 下面我以仓颉码为序,大略介绍前缀中字义的定义方式,再与前述各概念配合 应用,精简异常,当知我强调中国文字之智能绝非虚语了。(部首在上、下、左、 右,都有特殊的分类意义,请自行参详。) 日:与光有关之各种现象。 门:与门有关之词,代表组合之机体。 月:即为“肉”字,生理组织类。或为“月”,与光有关之各种现象。 骨:生理组织。 贝:财物及与财物有关之行为。 豸:野兽类。 目:眼部之动作及视觉感受。 金:金属及其属性等。 木:树木类,木制物以及与木有关之特性等。 韦:皮革类之器物及其所表示之性质。 水:与水有关之自然景物、现象、状态、动作与人造物等。 火:与火有关之现象、事物,状态以及炊事行为等。 米:与粮食有关之事物。 土:地形、地物,与土及地有关之词。 走:与行走有关之词。 竹:各种竹类,竹之部位及制物。 白:光亮洁白之形容词。 禾:农事、农作物等。 身:身躯及身体之动作等。 鬼:鬼怪等名词及形容词。 彳:人与人之间之各种行为及事件。 辵:与人类动作行为有关之词。 牛:与畜牧及生活有关之词。 舌:舌部之动作。 鼻:与鼻有关者。 风:与风有关者。 舟:与航行有关之行为、用具等。 广:房舍及室内之用具等,或表空间之形容词。 示:礼仪及祭祀之行为及用具等。 宀:居家生活有关之词。 穴:具有穴状特性之词。 车:与车辆、运输有关之词。 麦:粮食,作物等。 疒:生理及疾病等有关之词。 犬:与犬类野兽有关之词。 衣:与衣着有关之词。 巾:衣物,巾状之用物及饰物等。 虫:虫类、爬虫类等。 片:片状之物。 雨:与水气有关之自然景象、现象等。 王:玉类物质物品等。 歹:与死亡、毁坏有关之现象及行为。 豕:家畜有关者。 石:矿物、石制物及其性质等。 酉:经酦酵之食物及有关之现象等。 弓:武器及有关之性质等。 角:角之部位、角制品及其功能等。 子:人际称谓及关系等。 鱼:鱼类与相关之词。 矛:武器工具等。 阜:与空间、环境有关之词及人类行为等。 邑:空间,地域及环境之词。 人:人之角色、关系、行为、现象等。 食:与食事、食物有关者。 气:各种气体。 心:心理感受、现象、状况等。左侧的心指状况,下部的心指感受。 手:手之动作、人体之动作及行为。 耒:农具、农作等。 口:口之部位,口部动作,发声等。 足:脚部名称、动作、行为、现象等。 马:与马有关之词类。 髟:体毛类及其性质。 耳:与耳以及听觉有关者。 廾:草类,菜蔬等植物。 革:皮革制品等。 羊:与羊有关之词。 山:与山有关之形容词、名词等。 女:与女性有关之名词,形容词等。 纟:与纺织有关之词或具有纠结性之状态词。 田:与土地有关之词。 黑:与黑暗及黑色有关之词。 囗:与空间范围有关之词。 言:与语言有关之词。 以上仅略述概要,根据字码只需要一个位(开或关),就可以达到分类的目的, 全世界大概也只有中文及仓颉码可以做到。如果我们不加以利用,将之发扬光大, 岂不是愧对祖先? 西方是分裂性的文化,是以假设、分析、求证为思维的指导方针。世事越分越 细,细不见得能明,但是细分的结果,派别观念越来越多,彼此之间的相同性反而 越来越少。这点可以由知识分类、政治制度、人种区分得到明证。 中华文化是综合性的文化,是以假设、归纳、应用为思维的圭臬。中国人只求 外表的统一,含糊的认知,不确定的象征。千古以降,读书人但求“读书不求甚解”、 “得意而忘言”,以同统异。是以知识上崇儒,政治上忠君,人种上同化。 这种分别正是概念的认知问题!今人学了西方的观念,半通不通,便将自己全 盘否而定之。谈意识太麻烦,不如举个例,看看西方的菁英是怎么分析语文?又得 到什么结果?如果这样还不能拾起文化的自尊心,不妨等西方开始汉化时,再回头 也不迟。 西方学者经过二十余年的摸索过程和错误经验,自然语言的研究者,由最初利 用关键词或纯文法的比对方式, 如今已改用概念分析法, 其中耶鲁学派的 Roger Schank 所提出的理论,是当前的主流之一。 他的目标是设计出一个“会听故事”的程序,也就是说,它所需要知道的常识 和字汇,都局限在一个范围内(西方尚无人敢尝试做一个有“一般用途”的自然语 言系统)。 他的构想是把所有的行为动作词,分析归纳成若干个基本概念。其它则类分为 动作者,目标物等。输入的语句经过程序的剖析后,即转化为基本概念。 基本概念共有11类(现已扩充,但我在中文结构中归纳出的,已有一千个,包 括前章所列举的概念分类) , 如ATrans 指所有权的转移(给、 拿、 买等) , PTrans指物体的位移,(走、骑、放等),MTrans 指信息的传递(说、写、听等), MBuild指信息处理(如想、思考等),INgest 指进食行为(吃、喝、饮等)……, 以下且举一实例说明: 输入:他卖给我一本书。 内部结构: 动作:ATrans 动作者:他 物:书 动作:ATrans 到:我 ------ 动作者:我 从:他 物:钱 到:他 从:我 输出: 1.分析:我给了他钱,他给我一本书,我买了他的一本书,我付了他书钱。 2.推理:我有了一本书,他有了钱,我想要他那本书,他不再需要那本书, 我会看那本书,他需要钱。 假设常用的英文字汇有一万一千个,只有十一个类别,这表示每一类中有一千 个字汇概念相同,无法区分。就算目前已扩充到一百个类别,只要不是每个字的定 义,都有别于其它的字,计算机就无法真正了解和使用自然语言。 再看输出有分析,有推理,好象说得很清楚,可是因为字义界定不明,达不到 真正的理解。事实上西方学者自己也承认,对“人工智能”还在“学习了解”阶段, 尚无可行的理论。(Schank的理论,此处限于篇幅和主题,只做简单说明。坊间有 关人工智能书籍中“语意理解”部分,必会介绍他的方法,读者若有兴趣,请自行 阅读。) 如果以中文概念来分析,“他”是“人”,(人字旁+定义),“卖”则是一 种“商业行为”,(贝字旁+定义,商业行为之一,即为金钱与物的交易),“给 我”是指“受者”,“一”是数量,“本”是形容有信息内容的“量词”,对象物 为“书”。 输出:“他”收了钱,“我”收了“书”,完成了一桩买卖。(全部资料七个 字,共二十八个字符,过程不过用了几百个字符的程序而已)。 由此可证,他们的分析虽然不再完全根据文法,却也与概念无直接关系。这种 做法,受限于设计者的能力,每一个字都必须辛辛苦苦地重建其结构。中文概念则 早已建立在文字的形声结构中,充其量下点功夫整理即可。 在这个时代中,不论在经济、军事、文化上,也不管对象是国家、社会或个人, 知识的运用都具有决定性的力量。然而,运用知识的仍然是人,人又受限于时、空, 所以人类社会尚能保持某种程度的平衡。 然而,人类追求“自动化”的努力与梦想,古今中外,未曾一刻停止过。一旦 在信息的处理上能成功地使知识运用自动化,则人类的社会结构势将引起空前的变 化。 这种知识自动化,就是“人工智能”的目的之一。 因为人有智能,所以能运用知识,并借着知识的力量,达到人的目的。如果机 器也能自动地运用知识,我们必须承认这种机器也同样具有“智能”。只是这种智 能的初始是“人工设计”的,所以一般称之为“人工智能”。 有了人工智能的机器以后,基于机器记忆能力之强大,永远工作不休,处理事 务准确迅速,成本低,效率高,很少发生“错误”。最可怕的,是“它”没有人性, 只是忠实不渝地执行交付的任务。万一它在一个或一群人的支使控制下,很可能国 际均势消失,对人类社会造成永难弥补的伤害。 职是之故,所有的工业先进国家,无不将人工智能当作最重要的攻关项目,全 力以赴,唯恐落在他人之后。 所幸欧美工业国家之先进基础,建立在物质科技上,而“智能”却与物质无关, 是一种“唯心”的、“经验”的领域。尽管多年来他们已经投入了大量的资金、人 力,迄今并没有任何实质上的突破。 这是一个民族、文化生存或淘汰的竞争时代,今天在物质条件上,我们是弱者, 处处落人之后。但是,中国也曾经壮大过、强盛过,这样的说法并不是自我陶醉, 而是基于中国文化的特征以及数千年累积的经验。这些正是“人工智能”所缺乏、 而西方科学界无从由实验室或工厂中生产出来的。 所以,在工业时代,我们的确是瞠乎人后,信息时代却给我们带来了一线曙光。 如果我们善于利用,群策群力,将先圣先贤的经验及智能设计成为“人工智能”的 产品。则在即将到来的新时代,谁敢轻侮炎黄子孙? 我已经决定不再涉足“人工智能”,但是,知识不是任何人的专利,我能看到, 别人也有可能做出来。时机一成熟,“人工智能”就难免泛滥成灾。既然已经谈了 不少,何妨再稍作解释,让读者多一分了解。 人工智能不能离开信息,那是因为人的智能来自于信息。“资”指静态的资料, “讯”指动态的讯息。信息是人将感官所能认知的刺激,以资料及讯息的形式,加 以贮存及应用,以代表人所能了解及应用之概念。 在第六章我曾谈到感觉讯号与概念的关系,这里我更进一步,略述其在人工智 能上的应用。人类的感觉有五种,分别是视、听、味、嗅、触觉。佛家则认为应将 “意”加入,成为“六识”,意为人对刺激的六种认识。 意识我们称为内在刺激,由人的经验交集所形成,且为个人行为及判断的中枢。 外在刺激则有五种,其中视觉感知光影,人可以藉图像及符号等来认知及表达;听 觉则接收声波,人并用声带仿真该音调;味、嗅、触三者人仅能接收,除了经验认 知外,无法与他人直接沟通,故纯属主观。 味、嗅、触觉与反射神经有直接的联系,偏向于“本能”,当此类刺激产生时, 反射中枢立即根据利害程度,作出最有利于该个体的反应。听、视觉则接收距离较 远之物体、事件所传来的声、光等刺激,最初这些刺激亦是本能的,以判断其对本 体之利害,但此判断可以累积成为经验。当某些经验在客观印证下,被同一社会的 人公认,遂称之为常识。在智能的理论上,常识是人据以判断选择的标准。 图形及符号可以设计成为静态的资料,音调则是动态的讯息,这两者皆具有接 收及表达的功能。人的主观经验透过信息的交联,得以互相转换,并以之传达给他 人。对于原本没有此类经验的人,信息遂成为最有效的工具,藉之可迅速建立起其 常识库及专业知识库,这就是学习。 当然,在学习过程中,由于主观及客观的条件,认知效果也有差异,如味嗅触 及意识等纯属主观经验,除了在一定的范围及程度外,并无实质的意义。唯有双方 具有等效的经验,而且能明确地掌握信息的要素时,才有沟通的可能。至于专业知 识则较接近客观,同行者都必须经历相似的体验,学习效率最高。 即使是文字语言也面临相同的问题,在学习语言文字的过程中,需要将之与已 形成常识的主观经验联结起来。(人在两三岁以前,学习是一种本能,靠记忆将声 音与事物相连,渐渐形成常识。)这种过程必须利用感官的效应,一再与客观事件 印证,此即为思考、判断。而语言文字所联结的认知即为概念,所以每个人对概念 的认知,与其经验的广狭、感官的灵敏度、思考判断的方式及语言文字的接受能力 等,都有不可分割的关系。 西方对人工智能尚没有统一的定义,在此我仅以设计者的立场,先定义智能, 再逐步说明人工智能的可行性。 所谓的“智能”,系指一种自发性的机构体所具有的达到其预设目标之能力。 根据此定义,智能有四个要素: 一、其载体是一种机构体,具有整体性质及功能。 二、此机构体是自动的,非外力所操纵。 三、有预设的目标。 四、能够在变化的时空中适当的因应调整,以迄目标的达成。 应该注意所谓“预设的目标”应该只有一个,如果有多重目标,则必有优先级 之分,或按照时间订定远程、近程目标,逐步实施,而且不能自相矛盾。因此,在 某一时间内,在某一个优先级下,仍然是只有一个预设的目标。 一部汽车是一种机构体,其预设目标是代人之步,但汽车不具自发性,故没有 智能。人类所设计的各种工具、用具,到目前为止都必须在人的操作、控制下,并 需运用人类的智能,以达到预期的目标,所以都不具有智能。 如果我们设计一种车辆,以“驾驶服务”为唯一的“预设之目标”。它能自动 驾驶,并接受人的命令。在接受人的命令时,即相当于设定短程目标。这时它应该 能够判断此一短程目标是否与预设的目标相矛盾?如果是,它将拒绝执行。否则不 论在什么情况下,它都能把人送达目的地,具有这种功效的汽车,就可以称为是一 智能机构体。 同理,我们如能设计一具计算机,自动地为人类收集、处理资料;能与人交谈, 了解人的观念、帮助人解决问题,这就是智能计算机。再若将具有感觉器、行动能 力的机械人,与智能计算机结合起来,则此机械人即达成“人工智能”的要求。 为了要保证安全有用,机器与人之间的沟通,必须藉助概念,人得以对此“智 能体”加以控制。故人类所设计的智能机器,必须能“听”及“说”人类惯用的语 言,才能达到上述目的。在这种特定的条件下,计算机对语言、概念的理解、运用, 才是设计人工智能的成败关键。 所谓“设计”是先有了一种观念,利用已知的技术和器材,组成符合构想之事 物。计算机专家如果没有智能的观念,不知道所面对的是什么,则无从动手。 当今的语言学只研究到语言的演进、结构及应用,至于人体机能与语言之间的 接口关系,则尚未能了解。人会模仿学习,也会教导别人,却不知道为什么会有这 种能力,当然更不知道如何教导机器去学习及应用语言了。 至于观念,更是思考的基础,从古至今,哲学家们争论不休,也未曾有过具体 的定论。那么,人如何设计一种连自己都不了解的事物呢? 很明显地,我们必须了解语言与思考之间的体用因果,使计算机也和人一般, 能够思考,能够运用语言。这样它就可以与人沟通,了解人的观念,进而为人类服 务。再换个角度来看,语言(符号)相当于对外在刺激的一种感应,而观念则是经 验的积和,一旦这种计算机设计成功,计算机就可以应用其感应资料,增进其观念。 更进一步,全世界的计算机可以藉网络的连系,互通讯息,而且以高速处理,永不 中止。 今天,正当有先见的环境保护人士,正努力挽救濒临绝种的其它生物时,我们 可以想见,未来的人类亦将面临需要被保护的一天。进化淘汰绝对是反人道的,今 天的人类还不憬悟身处的环境,到了大错铸成时,后悔已是无及了。 假如我们能把人性设计到计算机中,让计算机继承人类的感知,无止无尽地薪 火相传。当然,这已不仅是技术上可不可能的问题,其中还牵涉到法律、道德以及 个人的良知、责任等种种超出我们所能解答的问题。 知识早已不是人类掌握在手中的工具了,它的生命力遍布于每一个人的思想中。 一道好奇的目光,一个偶发的疑问,在在都是它的影子。不论重不重要,也不论成 功失败,只要有人的心中怦然一动,知识就增加了一分力量。 当人类走出丛林,远离了那些还在披毛茹血的族亲时,人就与知识歃血为盟, 携手创造了一个崭新的时代。不幸人无法将其生命无限延伸,知识却得以借着人类, 一代一代的传衍、更新。现在,知识壮大了,壮大到任何个人都无法窥识其全貌, 更遑论控制应用。这时,人与知识之间的相互利用价值,端视彼此的需求程度而定。 我们能够忽视这个事实吗?拋开了知识,有谁还能声称人为万物之灵?在今天, 国家会衰亡,人种会灭绝,可是知识却永远存在。世界上的每一个角落,社会上的 每一桩事件,无不深深地受着知识的支配。人类孜孜不倦所追求的,朝朝暮暮所憧 憬的,又有哪一件能脱离知识的影响? 我认为该是人类自我检讨的时候了,趁着“知识机器”即将问世、我们的盟友 快要振翅起飞,而我们这些“知识动物”还在盲目的推波助澜之际。如果能够把握 契机,将人类特具的感受以及长年累月体验到的价值观,都一股脑儿交付给它。至 少,让它也有“感同身受”的人性和“推己及人”的认知,或许人类还能安享余年。 有这种可能吗?没有人怀疑“知识机器”的能耐,但谁都不相信那种无血无肉 的机器,会有像人类一样的情感。 这是因为科学太重视实验所得的客观知识,忽略了人的主观感受,所以科学家 们一直不了解“人性”到底是什么。在他们望洋兴叹之时,是不是应该调整一下实 验的手段,利用理性的思维,来剖析一下人性呢? 据我的了解,人性在理性的剖析下,并没有什么神秘难测的现象。我们只要掌 握住一些基本观念,逐步地探讨,就可以透视全貌。一旦能够理解,自然能按图索 骥,用已知的各种观念和技术,将之设计成为附加在知识机器上的感性功能。 人类应用语言的原因,是由于人自我的“主观”感受,和外在的“客观”真实 之间有所异同。为了要与其它个体沟通,高等动物发展出了以声音表达情绪的机能。 人类更进一步,利用声音的各种变化发展出语言,以代表其主观的感受。 如果把主观的感受分析成为单纯的因素,而且这些单纯因素的组合,能代表人 类所有的观念,我们就能分析语言,了解人类思考的过程。在这种情况下,这些单 纯的因素也就是人类思考的基因,甚至可以视为知识的基本元素。 原则上说来,人类的感觉器官接受到外界的各种“刺激”,在本能上基于“利 害关系”而有了“感受”、产生“反应”。若是仅表达感受的反应,谓之“情绪”, 再因为反应的后果,由“观察”刺激得到“认知”。因认知而有了“判断”,这个 过程谓之“经验”,经验的贮存,则为“记忆”。由于人类的记忆系统建筑在神经 的生化结构上,其效能不高,故对记忆的存贮、取用,很难加以控制,有时对一事 件的原委记忆并不明确,我们称之为“印象”。 大脑中的内存以神经原连接成网络,神经原会产生生化电流脉冲,在网络中流 动。相同的感受因素占有共同的记忆区域,但却与不同的事件相通连。当某一事件 所产生的电流脉冲, 因共同的感受因素而引发其它事件的记忆, 我们称此现象为 “联想”。对于某一因素或事件产生的联想,因为电路的导通,遂有全盘的认知, 即为人对该一因素或事件的“观念”。 当人对事物有了观念以后,基于其本身的利害关系,电流流经记忆区时,在极 为明显的利害感受下,身体机构会产生各种内分泌腺素,使神经原处于兴奋状态, 而使电流加强。更由于强烈电流的不断导通,神经末梢的离子量增加,电阻系数降 低。而任何刺激所产生的电流脉冲,就像水往下流的情况一样,必然有通过电阻系 数较低之路线的趋势。久而久之,经常导通之路线便能四通八达,成为全部经验记 忆的枢钮。在此枢钮形成后,每当刺激产生时,此区便立刻与意识中枢导通,形成 “意识”。 抽象的意识以及具象的身体,总称之为“我”,也就是当一个个体感觉到神经 传送的刺激,且与过去的经验认知相结合时,所得到的整体意识的“知觉”。换句 话说,一个人如果丧失了过去的经验认知,则“我”将毫无意义,只是一尊躯体。 再若在某一段时间内,没有任何内在、外界的刺激感受,也相当于“我”不存在。 “我”对客观认知的观念,是基于过去的经验,而经验不是独立的单一事件, 有时间的过程,有各种感觉器官综合的感受,有利、害以及需求的交集。因此每一 个自我对客观认知后所产生的主观观念,或多或少都有差别。但人又不能脱离群体, 必须与在同一环境下的人,具备相同或类似的认知,由此而有了学习及观察的动机。 学习观察是将个人的观念与客观环境相印证,并据以修正、充实个人观念。在 这个印证过程中,必须将自己的主观观念,以感官所能接受的刺激形式,表达给另 一个主观体认知。由于观念笼统地涵盖了所有相关的经验,而刺激受到时空的限制, 不可能明确地表达清楚。因此必须将观念的若干基本因素,分解成为具有独特性、 组合性、表达性的单元,才能较完整有效的传达给另一个主观体,这种单元就是概 念。 在人脑中,这种概念是以一组联通电路的形式存在,联通于所认知的各种观念 之间。每当人因为某种因素,产生了一种复杂的观念时,这些观念之间,通过有关 的交集,就有电位电势的产生。这时大脑中枢依循电势,将电路联通,此一联通之 电路必有一代表的概念相连。以此概念驱动控制中枢,就可以得到意识的效应。 人类发展出概念之初,只是基于实用,并没有一定的法则。随着认知范围逐渐 的扩大,概念所涵盖的内容越来越广、界定的因子越来越精细。到现在人所应用的 概念一再因应调整,变成了错综复杂的集合。这个结果又导致了我们对概念本身定 义的困难,甚至连概念所代表的是什么,都无从了解。 如果我们能做到利用现有的知识,反推出概念的基本因子,便能够用符号代表 这些基因,并设计成为代码,贮存在计算机中。如此,计算机便可以像人一般地运 用概念。 人运用概念联接导通大脑中各种观念网络的过程为“思考”,经过思考以后, 认知的利害因果刺激了内分泌腺素,流入血液,经过心脏,是为“感受”。有感受 便会产生反应,是谓“情绪”,情绪直接影响到“我”的意识,是自我经验的一部 分。这部分再与抽象的我混合在一起,经常产生影响情绪的感应,是为“感情”。 人因为生命本能的驱使,借助感觉器官对各种变化的认知,而达到趋利避害的 目标,此有其行为的必然性。可是又因对主观及客观观念的观察及认知,了解到自 我的利害常与环境息息相关,必须对自我的利害作若干妥协,以谋求更大的利益。 前者以自我直接的感受为前提,人的行为端视个人当时的利害判断而定,此即“感 性”。后者系经过对客观环境的认知,需克制自我,是一种有秩序的反省,故称为 “理性”。 上述的全部观念就是“人性”,因此,只要仿真人类所具有的感觉器官以及人 类已经认知的概念基因,将之设计在一个机器上,使之与人类同样或近似地运作。 此机器即可具有“人性”以及人的感觉、知觉,而能感人之感、与人类沟通,达到 我们预期的目标。 根据上面的分析,我们可以总结出三个步骤,将一种兼具感性及理性的“拟人 计算机”描绘出来。第一步是刺激的认知,第二步是概念思考,最后是知识应用。 兹以现有的器材及技术,分成下列五项说明: 一、硬件结构:控制中枢,分别作反射、判断、运动、记忆及感应中枢等。其 中反射中枢独立,余者以判断中枢为主宰。 内存:可供暂时储存的浅层记忆及永久记忆的装置等。 感应器:接收视、听、触、味及嗅觉之刺激,供感应中枢分辨。 外围设备:供动作、行为、发声、显示、电力供应及其它接口。 二、输入讯号:各种感应的讯号即相当于人所感受的各种刺激,需先加以分析 整理,使与所设计的认知资料相符合。 三、内贮资料:将输入的感应讯号,利用二进制的特征,使每一位直接连通到 相关的接口上,即可具有神经信道的效能。同时此类相当于刺激的讯号,可以组成 各种认知的资料形式,亦即概念,以便加以应用。 四、系统程序:由刺激的产生到行为的完成,以及回馈的观察等,可当做系统 程序。此外,判断、学习、数据管理、知识库等亦皆需以程序处理。 五、接口处理:在人的认知中,各种刺激经常同时存在且互为因果,所以各中 枢之间的接口,必须配合人体之结构,做联线处理。