人工智能的成长,一方面有待认知神经科学的突破和研究方法论的进步;另一方面需要切实应用的反哺以发现问题继而反思。本选题在简要介绍人工智能的历史与现状、思维科学的基本思想与观念的基础上,强调知识工程、尤其是经验及其隐性知识在智能模拟中的独特作用和重要意义,以书法创作的形象思维模拟和进入应用的计算机辅助心电图分析这两种“心迹”的计算为实例,阐述思维过程模拟、经验知识挖掘、关键特征提取的思路、方法和技术,据此融合规则推理和统计学习算法并获得有效结果。最后,进一步拓展视野,描述科学技术与艺术的互相关联和影响,指出普遍缺失的辩证思维的重要性,简述计算的困境及其可能策略。
人工智能的成长,一方面有待认知神经科学的突破和研究方法论的进步;另一方面需要切实应用的反哺以发现问题继而反思。本书在这方面进行了尝试,以书法创作的形象思维模拟和进入应用的计算机辅助心电图分析这两种“心迹”的计算为实例,阐述思维过程模拟、经验知识挖掘等。
马克思在其中学毕业前夕所撰写的《青年在选择职业时的考虑》一文中写道:“在选择职业时,我们应当遵循的主要指针是人类的幸福和我们自身的完美。 不应认为,这两种利益是敌对的,互相冲突的,一种利益必须消灭另一种的。 人类的天性本来就是这样的: 人们只有为同时代的人的完美,为他们的幸福而工作,才能使自己也达到完美。”[2]
“人类的幸福”内涵宽广、意义多样,理解有别、古今存异,根本而言,健康当是幸福的基础,缘此才有蓬勃生命的延续、丰富生活的体会、充实人生的追求;“自身的完美”涉及身、心两者,若缺失健康则完美无从谈起。 心,除了中央位置以外,还有两种含义,一是心脏,二指意识功能,或者说分别是生理和心理两者。 前者的经典之作如《心脏运动论》。 [3]后者又包括两个方面:一是心灵,即精神表现,通俗之作是《心的简史》; [4]二是心智,有时候是智能的另一种表述,也是拙稿讨论的主要对象。
当今社会,心脑血管疾病已是威胁人类健康的头号杀手,最佳的应对措施是“治未病”,其次则是及时诊治,计算机、信息化可以提高效率、提升速度,而智能信息处理则可提供更实时和更具针对性的服务。
检查心脏的基本手段是心电图(electrocardiogram,ECG),那是用专门的仪器记录与心脏每一心动周期的收缩和舒张所产生的电生理活动的时间序列相应的体征,是心的活动,也是物理、生理意义上的“心迹”,心电图是健康检查的一种手段。 相对于此,展现人们文化修养和精神风貌的书法则可透露出人的喜怒哀乐,表达感情和心绪,可以说是精神、心理层面的“心迹”,书法是益于健康的一种途径。 同时,笔者关注隐性知识,即难以言表的经验,因而拙著可谓“一心三意”。
唐代书法家孙过庭在其书法理论经典之作《书谱序》中说的“智巧”谓人的智能与书写技巧,而“心手”当指大脑与手。 [1]如《孟子· 告子上》之十五云:“耳目之官不思,而蔽于物。 物交物,则引之而已矣。 心之官则思,思则得之,不思则不得也。”[1]其中“心”为脏腑之心,实际上思考的器官是脑,即“心智”之心, [67]与平常所说的“心旷神怡”“心猿意马”“称心如意”“心有灵犀一点通”中的“心”一样。
孙过庭还说:“……神怡务闲,一合也……心遗体留,一乖也……”“……睹迹明心者焉……”“贵使文约理赡,迹显心通……”“写《乐毅》则情多佛郁;书《画赞》则意涉瑰奇;《黄庭经》则怡怿虚无;《太史箴》又纵横争折;暨乎《兰亭》兴集,思逸神超,私门诫誓,情拘志惨。”“非其心闲手敏,难以兼通者焉。”都是说书法创作与心情、情绪有关。 唐代另一书法理论家张怀瓘在《书断序》中说:“……技由心付……心不能授之于手,手不能受之于心。 虽自己而可求,终杳茫而无获,又可怪矣。”[8]同是唐代书法理论家的韩方明在《授笔要说》中指出“然意在笔先,笔居心后……”[9]都是指心与手的呼应。在我们的生活中、语境里,心电图和书法都是与大众相关的话题,拙著介绍以它们为背景与对象的人工智能研发的阶段性结果。 其中,计算机辅助心电图分析面向社会的实际需求,已逐步进入应用。 机器书法创作模拟则缘于研究兴趣,本意只是探索艺术思维的机器模拟的可能性,就审美本身而言,笔者不认为其结果可与经典之作媲美,虽然后文我们会看到计算机输出的有些结果尚不算“丑”。
据此出发,以后的各章将涉及三个方面: 人工智能背景、思维科学基础与经验知识阐述,即第1至3章;计算机辅助心电图分析和机器书法创作模拟工作介绍,分别是第4、5章;以及由前述讨论引出的科技与艺术话题以及人工智能一般问题,也就是第6章。 结语是关于计算在智能模拟中遇到的困境的粗略分析。 拙著研究与开发并重、科技与人文交融,每章前有笔者的古代名碑帖集联,然而所介绍的内容自然是初步的,诸多挑战有待我们以新的视角和方法论去迎接。 以下是主要章节引述。
第1章: 人工智能万水千山。 新兴学科得以形成,当有其脉络和源头,而不是孤立的过程;传统学科的发展背后,有着具体的轨迹。 它们既是人类知识的积淀,也是学科本身的“前车之鉴”,历史的回顾则有助于我们洞察过去、立足当今从而把握未来。 本章简要分析人工智能一开始的乐观预言,介绍若干里程碑工作和基本结论。
第2章: 思维过程扑朔迷离。 形象思维本是原始思维、艺术思维、儿童思维等领域的话题,与科学的基础,即抽象思维或逻辑思维似乎“道不同”。但作为思维的一种形式,形象思维是最早体现又难以言明的,若要进行思维模拟,就不能“不相为谋”。 本章涉及日常思维、钱学森先生倡导的思维科学体系及其辩证思维等方面。
第3章: 经验知识举足轻重。 表面上看经验与严谨的科学技术不相干,实际上人工智能技术离不开领域经验的总结与表达,知识的获取过程、表达方式及其推理与经验整理密不可分,逻辑推理与经验既不同又关联。本章阐述显式知识与隐性知识、知识工程与领域经验等方面的基本观念与应用价值,生活中学习能力与常识积累互相关联,机器学习也一样。
第4章: 心电图谱见微知著。 计算机辅助心电图分析的程度影响着医生的服务效率和医疗机构的服务质量,其实际应用不尽人意,诸如现有的算法特点与医生脑中的诊断思维过程是否一致、心电图特征集是否是疾病分类的充要条件等问题制约着大量理论方法的可用性。 本章强调医生思维过程模拟、经验知识挖掘和形态特征刻画等对计算机辅助分析的意义。
第5章: 机器书法浮光掠影。 用计算机模拟文字书写并非新鲜之举,数十年间,国外有针对英文字母的变形开展的工作,我国也有若干课题组的研究见诸文献,通常是毛笔物理特性甚至草书“飞白”的随机效果的模拟,多数并非出自思维模拟的目的。 本章从创作实践出发介绍机器书法创作的初步工作的特点、方法、效果,及其教学应用设想。
第6章: 科技艺术若即若离。 科学崇尚真理,艺术追求唯美,本是人类文明发展历程的两条道路,从本质、手段到表现均有它们自身的方式,但并非是平行线,而是既有交叉又有互相的影响。 由计算机模拟书法艺术创作的探索,可拓展到科技与艺术关系问题。 本章叙述科学大家关于艺术的思想与论述、艺术中似是而非的观点,它们并非“风马牛不相及”。其中的核心是经验中的隐性知识。 本着归纳方法、探究本质的目标,以形象思维与抽象思维并重、人和机器交互、整体论与还原论结合、经验与逻辑相渗透为基本思想,融合规则推理与深度学习,关注整体思维特征把握和隐性知识挖掘,笔者曾在拙著《人工智能哲学》中给出过如下基本内容及其
关系①。
人工智能涉及目标(object)、方法论(methodology)、进程(progress)、依据(fundamental)和瓶颈(bottleneck)问题:
PhiloAI !df{O, M, P, F, B}
① 董军. 人工智能哲学[M]. 北京: 科学出版社,2011: 3 4.
目标是模拟(simulation)智能和理解(understanding)智能:
O !df{SI, UI}
前者的核心是思维(thinking)模拟:
SI !df{TS, …}
思维包括抽象(abstract)思维、形象(imagery)思维和创造(creative)思维,辩证(dialectic)思维是它们的结合与综合:
DT !df{AT,IT, CT}
方法论是以辩证思维为基础的整体(synthesis)思维、人(human)和机器(computer)的交互:
M !df{ST, H∪C}
进程则是从智能模拟(intelligencesimulation) 经思维模式(thinkingpattern)到认知模型(cognition model)的递进。 相应外延逐步扩大:
P !df{IS, TP, CM}
ISTPCM
依据是唯物论(materialism)和辩证法(dialectics):
F !dfMa∩Di
瓶颈是学习(learn)和知识(knowledge):
B !df{Le, Kn}
有关知识的主要方面是操作(operation)和内容(content):
Kn !df{Op, Co}
操作包括获取(acquisition)、表达(express)和推理(reasoning):
Op !df{Ac, Ex, Re}
内容包括领域(domain)知识和常识(common):
Co !df{DK, CK}
领域知识包括显式(explicit)知识和隐性(implicit)知识。 隐性知识主要与经验有关,即
DK !df{EK,IK}
经验包括书本信息,实验结果,以及专家尚未或难以表达、经过启发和讨论给出的内容。 知识是主观世界的东西,它只有相对的真理性;形式化之后的知识又有如何在一定的上下文语境中加以解释的问题。 这些给人工智能系统中的逻辑问题带来了更大的复杂性。 根据经验(experience)的知识精化(refinement)指去除冗余信息、给出新的特征、确定数值区间等:
IK !dfrefin{Exp}
“心迹的计算”的关键就是关于隐性知识的建模,也就是隐性知识的人工智能途径。 “心迹”是内心写照、本性流露,计算的原意则是根据已知数通过数学方法求未知数的智力活动。 随着计算机的普及及其大规模的应用,计算逐渐变得“无处不在”,计算的对象和内容也日 益丰富,远不限于数字计算本身,尽管计算机内部还是二进制的数字表示。 无论针对“心”的心脏之意及其生理活动,还是心灵之意以及心理活动,均为拙著中的“心迹”一词的外延,无非一种是物质的,一种是意识的。
黄庭坚有《欸乃歌二章戏王穉川》的诗:
从师学道鱼千里,盖世成功黍一炊。
日日倚门人不见,看尽林乌反哺儿。
科艺互彰,“心”“心”相印,以“思”(思维)之计算(模拟)为中心抛砖引玉,不知“得”之与否? 祈望方家指谬。
参考文献
[1] 孙过庭. 书谱序[M]//华东师范大学古籍整理研究室. 历代书法论文选: 上. 上海:上海书画出版社,1979: 124 132.
[2] 马克思. 青年在选择职业时的考虑[M]//马克思恩格斯全集: 第四十卷. 北京: 人民出版社,1982: 37.
[3] 哈维. 心脏运动论[M]. 凌大好,译. 西安: 陕西人民出版社,2001.
[4] 戈德温. 心的简史[M]. 彭亦农,译. 长沙: 湖南文艺出版社,2009.
[5] 杨伯峻. 孟子译注: 下[M]. 北京: 中华书局,1960: 270.
[6] 赖尔. 心的概念[M]. 刘建荣,译. 上海: 上海译文出版社,1988.
[7] 罗素. 心的分析[M]. 贾可春,译. 北京: 商务印书馆,2010.
董军,男,1964年11月出生于江苏省苏州市,1997年获浙江大学工学博士学位,2002年破格任华东师范大学教授,现为中国科学院苏州纳米技术与纳米仿生研究所研究员,博士生导师(中国科学技术大学、厦门大学)。曾于工业界工作近9年。主要研究兴趣为人工智能及其在健康监护、传统文化中的应用。先后出版人工智能相关专著3部,在IEEE Intelligent Systems、《中国科学》等刊物和会议上发表论文90余篇,入选中国科学院“百人计划”、江苏省“双创人才计划”等5个人才计划或奖励。