我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 语义树 >

人工智能中知识获取技术doc

归档日期:06-28       文本归类:语义树      文章编辑:爱尚语录

  1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

  §4.1 知识获取的概念和途径 (1) 静态移植。在系统设计过程中,通过知识表示、程序编制、建立知识库,进行知识存储、编排和管理,使系统获取所需的先验知识或静态知识。故称“静态移植”或“设计移植”。 (2) 动态移植。在系统运行过程中,通过常规的人机交互方法,如“键盘-显示器”的输入/输出交互方式,或辅助知识获取工具,如知识编辑器,利用知识同化和知识顺应技术,对机器的知识库进行人工的增删、修改、扩充和更新,使系统获取所需的动态知识。故称“动态移植”或“运行移植”。 2.机器学习 所谓“机器学习”,是人工智能系统在运行过程中,机器通过学习,获取知识,进行知识积累,对知识库进行增删、修改、扩充与更新。 机器学习的方式可分为二种: (1) 示教式学习。在机器学习过程中,由人作为示教者或监督者,给出评价准则或判断标准,对系统的工作效果进行检验,选择或控制“训练集”,对学习过程进行指导和监督。这种学习方式通常是离线的、非实时的学习,也可以在线) 自学式学习。在机器学习过程中,不需要人作为示教者或监督者,而由系统本身的监督器实现监督功能,对学习过程进行监督,提供评价准则和判断标准,通过反馈进行工作效果检验,控制选例和训练。这种学习方式通常是在线、实时的学习。 在上述二种学习方式中,机器可以采用各种学习方法,如强记式、指导式、示例式、类比式方法等。 3.机器感知 所谓“机器感知”,是人工智能系统在调试或运行过程中,通过机器视觉、机器听觉、机器触觉等途径,直接感知外部世界,输入自然信息,获取感性和理性知识。 机器感知主要有二种方式: (1) 机器视觉。在系统调试或运行过程中,通过文字识别、图象识别和物景分析等机器视觉,直接从外部世界输入相应的文字、图象和物景的自然信息,获取感性知识,经过识别、分析和理解,获取有关的理性知识。 (2) 机器听觉。在系统调试或运行过程中,通过声音识别、语言识别和语言理解等机器听觉,直接从外部世界输入相应的声音、语言等自然信息,获取感性知识,经过识别、分析和理解,获取有关的理性知识。 在机器视觉、听觉中,都要用模式识别、自然语言理解等方法和技术。 §4.2 机器学习 一、学习和学习系统的概念 1.“学习”的概念 “学习”是一个通俗的、广泛应用的概念,同时也是一个含义丰富、难以确切定义的术语。 不同的学科,不同的发展阶段,对“学习”的概念有不同的定义。例如: 在神经生理学中,巴甫洛夫把“学习”称为“条件反射的形成过程”。 在控制论中,维纳把“学习”称为“系统自我完善的过程”。 在人工智能中,西蒙把“学习”称为“系统积累经验,改善性能的过程”。 在知识工程中,认为“学习”是“知识结构的改进,知识的获得、积累和修正”。 这里包括两方面的知识: 显示知识——可用语言、文字或符号表示的知识,如书本知识。 隐式知识——不便用语言、文字或符号表示的知识,如经验技能。 2.“学习系统”的概念 由于学习的概念不同,相应的“学习系统”(也叫“学习机器”)的概念也有所不同。例如: 能够从某种过程或环境中的未知特征获取信息,并作为经验用于未来的估计、分类、决策或控制,以改进其性能的系统,称为“学习系统”。 若系统在其环境发生变化后的一段时间(T)内,相对于性能函数(P)的响应是令人满意的,则可称为“学习系统”。 能利用与环境相互作用时所获得的信息,在未来的与环境的相互作用中,改进其性能的系统,称为“学习系统”。 在与环境的相互作用中,不断使知识库完善化的系统,称为“学习系统”。 在系统运行过程中,能不断地从外界环境中获取知识,改善系统性能的系统,称为“学习系统”。 上述学习系统的定义大同小异,其中,学习系统应具备的二点共性是: 获取知识(信息); 改善系统性能。 二、机器学习系统的类型 机器学习系统的类型很多,可按下列几个方面进行分类: 1.学习能力 机器学习能力大小的主要标志,是对人的监督和示教作用的依赖程度。据此可分为: (1) 示教式学习系统 在学习过程中,需要人作为教师,进行示教、监督和训练,学习结束后才能投入工作。这也称为“离线) 自学式学习系统 不需要人进行示教、监督和训练,机器在运行过程中,自动获取知识,改善性能。这也称为“在线.学习方法 机器学习方法,是指获取知识和改进性能的方式。据此可分为: (1) 强记学习系统 机器在学习过程中,通过反复训练,利用奖惩规则或评价标准,强行记忆所获得的知识。 (2) 指导学习系统 在学习过程中,由人给出指导性的建议,机器通过知识推理,获得改善性能的具体行动规则,具有从一般到特殊的演绎推理功能。 (3) 示例学习系统 系统从训练集的许多事例或样本中,获取关于事物的特性和规律的知识,以提高其识别能力和性能,具有概括(从特殊到一般)和归纳推理功能。 (4) 类比学习系统 系统通过类比方法,进行联想推理,获得类比关系和转换规则的知识,提高对其他类似事物的识别能力。 3.学习内容 按所学习的知识的内容,可分为: (1) 概念学习系统 学习内容是关于事物的概念、状态、性质等叙述性知识。其中包括单概念学习,如判断事件的真假、是否等;多概念学习,如疾病诊断、质谱分析等。 (2) 过程学习系统 学习内容是关于事物状态变化的过程性知识,如问题求解的步骤,机器人行动规则,语言的句法分析,模式的文法推断等。 4.知识表示方式 根据机器学习系统中知识表示的方式,可分为: (1) 数值学习系统 用数值表示知识,如概率值、权系数等,又可分为: 统计学习系统,如贝叶斯学习分类器。 参数学习系统,如权系数修正器。 (2) 符号学习系统 用符号表示知识,如产生式规则、语义网络、“与/或”树等,又可分为: 产生式学习系统,用产生式规则表示知识。 网络式学习系统,用语义网络表示知识。 三、机器学习系统的原理结构 机器学习系统是根据人工智能的学习原理和方法,应用知识表示、知识存储、知识推理等技术,设计和构成的,具有知识获取功能,并能逐步改善其性能的系统,可称之为“人工智能学习系统”或“智能学习系统”。 机器学习系统可以采取示教式或自学式,进行离线或在线学习。在学习过程中,可采用强记、指导、示例、类比等各种学习方法,进行奖惩式、演绎式、归纳式、联想式学习。根据所采用的学习方法,设计系统中的学习环节。 为了能够获取知识,改善性能,在机器学习系统中,应拥有知识库,并且要求知识库具有增删、修改、扩充和更新的功能。在示教式学习系统中,还需要有相应的人机接口,以便机器向示教者学习,获取知识信息。 示教式学习系统通常是离线学习、非实时学习,但也可以在线学习、实时学习。自学式学习系统一般是在线学习、实时学习。所谓“在线”,是指学习系统与其工作对象或环境是直接联机的;而“离线”是不联机的。所谓“实时”,是指学习系统与其工作对象或环境的时间域是相同的,即实际运行时间;而“非实时”,其时间域是不同的。 机器学习系统,或智能学习系统的一般结构图4-1所示。 当监督环节为示教人时,图4-1为示教式学习系统;当监督环节为监督器时,图4-1为自学式学习系统。 当环境与系统不直接联机时,图4-1表示离线式学习系统;当环境与系统直接联机时,图4-1表示在线 智能学习系统的结构 四、机器学习系统的基本功能 图4-1所示的智能学习系统,各部分功能如下: 1.知识库 用于存储(记忆)、积累知识,具有知识增删、修改、扩充、更新功能的知识库及其管理系统。根据所存储知识的记忆稳定度,可分为: (1) 长期记忆知识 长期记忆知识是稳定不变的,它是学习系统必须具备的先验知识背景,在学习过程中不发生变化的基本知识,如事物的基本概念和定义、定律和公理,博弈的基本规则等。 (2) 中期记忆知识 指通过学习可以改变的,关于环境事物的各种具体知识,即知识库中通过学习而增删、修改的那部分知识。 (3) 短期记忆知识 指反映环境变化的信息和数据,学习过程的中间结果,以及知识调用的条件等。当处于“在线”学习过程中,短期记忆知识是经常改变的,一般存放于“总体数据库”或“黑板”中。 2.学习环节 它是学习系统的核心环节,其作用如下: (1) 采集环境信息 通过选例环节或直接采集有关环境变化的信息。 (2) 接受监督指导 接受来自监督环节的示教、指导信息或评价标准。 (3) 进行学习推理 利用所采集的环境信息,根据监督指导,通过强记、指导、示例、类比等学习方法,进行学习过程的知识推理,获得有关问题的解答和结论。 (4) 修改知识库 将学习推理所获得的结果,输入知识库,对原有知识进行增删、修改。 3.工作环节 利用知识库中的知识,进行识别、论证、决策、判定,采取相应的行动,完成工作任务的执行环节。 如果工作环节的行动结果,直接引起环境的变化,如机器人行动、生产过程控制、机器博弈等,那么就形成了“在线.监督环节 在示教式学习系统中,监督环节是人,即示教者;在自学式学习系统中,监督环节是监督器,即评价准则或检验标准。监督环节有以下几个作用: (1) 工作效果评价 接受来自工作环节的反馈信息,对系统的工作效果进行评价和检验。 (2) 整定评价准则 接受来自环境变化的信息,整定和修订评价准则和检验标准。 (3) 监督学习环节 根据评价和检验结果,对学习环节进行示教、训练或指导。 (4) 控制选例环节 根据环境变化信息及工作效果的反馈,控制选例环节,选取其他事例或样本。 5.选例环节 其作用是从环境中,选取有典型意义的事例或样本,作为系统的训练集或学习对象,以便提高学习效率,加速学习过程。 选例环节可以由人或机器来实现。 6.环境 指系统获取知识和信息的来源,工作的对象和人物等。例如,医疗专家系统的病员、病历档案、医生、诊断书等;模式识别系统的文字、图象、物景;博弈系统的对手、棋局;智能控制系统的被控对象和生产过程等。 §4.3 机械学习 机械学习也叫死记硬背学习。 一、机械学习的模式 机械学习是最简单的机器学习方法。机械学习就是记忆,即把新的知识存储起来,供需要时检索调用,而不需要计算和推理。 机械学习是最基本的学习过程。任何学习系统都必须记住其获取的知识。 在机械学习系统中,知识的获取是以较为稳定和直接的方式进行的,不需要系统进行过多的加工。 而对于其它学习系统,需要对各种建议和训练例子等信息进行加工处理后才能存储起来。 当机械学习系统的执行部分解决好问题之后,系统就记住该问题及其解。我们可把学习系统的执行部分抽象地看成某个函数,该函数在得到自变量输入值(X1,X2,…,Xn)之后,计算并输出函数值(Y1,Y2,…,Yp)。机械学习在存储器中简单地记忆存储对((X1,X2,…,Xn),(Y1,Y2,…,Yp))。当需要f(X1,X2,…,Xn)时,执行部分就从存储器中把(Y1,Y2,…,Yp)简单地检索出来而不是重新计算它。这种简单的学习模式如下: 例如,一个决定受损汽车修理费用的汽车保险程序。这个程序的输入是被损坏的汽车的描述,包括制造厂家、生产年代、汽车的种类以及记录汽车被损坏部位和损坏程度的一个表,程序的输出是保险公司应付的修理费用。这个系统是个机械记忆系统。为了估算损坏汽车的修理费用,程序系统必须在存储器中查找同一厂家、同一生产年代、损坏的部位和程度相同的汽车,然后把对应的费用提交给用户。如果系统没有发现这样的汽车,则它使用保险公司公布的赔偿规则估算出一个修理费用,然后把厂家、生产日期和损坏情况等特征与估算出的费用保存起来,以便将来查找使用。 二、机械学习的主要问题 1.存储组织信息 显然,只有当检索一个项目的时间比重新计算一个项目的时间短时,机械学习才有意义,检索的越快,其意义也就越大。因此,采用适当的存储方式,使检索速度尽可能地快,是机械学习中的重要问题。在数据结构与数据库领域,为提高检索速度,人们研究了许多卓有成效的数据存储方式,如索引、排序、杂凑等等,在机械学习中我们可以充分利用这些成果来实现我们的要求。 2.环境的稳定性与存储信息的适用性 在急剧变化的环境下机械学习策略是不适用的。作为机械学习基础的一个重要假定是在某一时刻存储的信息必须适用于后来的情况。然而如果信息变换得特别频繁,这个假定就被破坏了。因此机械学习系统必须保证所保存的信息适应于外界环境变化的需要,这也就是所谓的信息适用性问题。 解决问题的办法有两种: 密切监视外界环境的变化,不断地更新所保存的信息。 核对,即是说在检索某一信息的时候核对一下外界环境的有关条件,看看所检索的信息是否仍旧适用。如不适用,需要经过适当的变换。 3.存储与计算之间的权衡 因为机械学习的根本目的是改进系统的执行能力,因此对于机械学习来说很重要的一点是不能降低系统的效率。比方说,如果检索一个数据比重新计算一个数据所花的时间还要多,那么机械学习就失去了意义。 解决问题方法有两种: 估算一下存储信息所要花费的存储空间以及检索信息时所花费的时间,然后将其代价与重新计算所花的代价比较,再决定存储信息是否有利。 把信息先存储起来,但为了保证有足够的检索速度,限制了存储信息的量,系统只保留那些最常使用的信息,“忘记”那些不常使用的信息。这种方法也叫“选择忘却”技术。 §4.4 基于事例的学习 当无法建立好的模型时,通过记录事例进行学习是一种可取的方法。 采用基于事例的学习方法时,首先,应用相容启发方法,把某个预先观察过的事物的特性赋给另一个从未见过的新事物;其次,学会如何快速找到特征空间内的最近邻物体。 一、相容启发使事例支持特性 现有八块积木,每块积木的颜色、宽度和高度均已知,如图4-2所示。假定有一块新的积木(记为U),其宽度和高度为1×4cm,而颜色尚不知道。若要猜测其颜色,就必须猜想:这种颜色应与其它方面(如宽度和高度)与该积木最为相似的积木一样。在这种猜想中,将用到相容启发方法。 相容启发定义:无论何时要猜测某事物的特性,除了提供一套参考事例外不知道其它情况;通过测量其它事物的已知特性,找到最相似的事例,该事例的特性是已知的。作为猜测:所求未知特性是与最相似事物的已知特性一样。 画出各积木的宽度与高度而求得特征空间,如图4-3所示。有了特征空间图,就能够容易地把相容启发方法用于猜测颜色,而不需要推理。由于未知颜色的积木U与桔黄色积木最接近,于是猜测:积木U的颜色是桔黄色。 图4-2 八积木事例集 图4-3 积木颜色的特征空间 二、最近邻物体的寻求 寻求最近邻物体的最直接方法是:先计算未知物体与事例集中所有物体的距离,然后求取这些距离的最小值。若事例集中已有n个物体,则要计算n个距离,比较n-1个距离。当n较小(如n=10)时,这种直接方法较好用;但是,当n很大(如n为一百万或十亿)时,这种方法就不那么好用了。 寻求最近邻物体的较快方法有两种:一种是串行过程,另一种是并行过程。 1.快速串行过程求得最近邻物体 该方法采用一种特别的决策树。决策树大体上是一些测试的排列,它规定了分析中每一步最合适的测试。 定义:决策树是一种表示,是一种语义树。树上, 每个节点与一个可能回答集合有关; 每个非终叶节点与某个测试有关,该测试把它的可能回答集合分解为对应于不同测试结果的一些子集; 每个分支把一个具体的测试结果子集传给另一个节点。 这种方法的计算工作量与成正比,而不是与n成正比。 要利用决策树思想处理积木辨识问题,必须在计算最近邻物体之前对事例进行分组,如图4-4所示。 首先,按高度把积木分为两组,每组含有相同的积木数。其中一组,所有积木的高度≥5cm(称为“高积木”);另一组的高度≤2cm(称为“矮积木”)。 接着,按宽度再分这两组积木。“高积木”分为两组,其中一组的宽度≥5cm(称为“宽高积木”),另一组宽度≤2cm(称为“窄高积木”);“矮积木”也分为两组,其中一组的宽度≥4cm(称为“宽矮积木”),另一组宽度≤2cm(称为“窄矮积木”)。 最后,把上述4组进一步分成8组,每组正好只有一块积木。 图4-4 积木事例分组 分组过程如图4-5所示。 图4-5 积木事例分组过程 要确定积木U的最近邻积木,首先注意到U处于最矮的高积木和最高的矮积木间的中等高度,且积木U的高度大于3.5cm。根据这一观察可以得出结论:积木U很可能靠近某块高积木而不是矮积木。因此,可以暂时舍弃那些矮积木。 为什么说是暂时舍弃矮积木?因为最高的矮积木高2cm,它与积木U的距离不小于2cm,即高度差为2cm。也就是说,未知积木U与下面一组任何积木的距离不可能比2cm更近。如果积木U与高积木的距离小于或等于2cm,那么暂时舍弃矮积木的决策将成为永久的决策。如果积木U与高积木的距离大于2cm,那么最终还得考虑矮积木。 接着,考虑高积木;它们也分成两组。因为积木U的宽度小于3.5cm,所以它很可能靠近某块窄的高积木。因此,可以暂时舍弃宽的高积木。 同样,因为宽的高积木与积木U的距离不小于4cm,如果积木U与窄的高积木的距离是小于或等于4cm,那么暂时舍弃宽的高积木的决策将成为永久的决策,否则还得考虑宽的高积木。 下一步是把积木U与矮的窄高积木放在一起,这种积木只有一块,即桔黄色积木。同样,积木U与窄的红色高积木的高度相差2cm,如果积木U与桔黄色积木的距离等于或小于2cm,那么就无需计算积木U至窄的红色高积木的距离。 至此可以知道,只要前述各决策被证明是合理的,最靠近积木U的积木就是桔黄色积木。积木U与桔黄色积木的距离是1.41cm。因为1.41cm小于2cm,说明舍弃窄的红色高积木是合理的;1.41cm也小于4cm,说明舍弃宽的高积木也是合理的;1.41cm又小于2cm,说明舍弃所有矮积木是合理的;即各项决策都是合理的。 寻找最靠近的积木实际上是个跟随决策树路径的问题,该树反映了物体的分组方法。不管未知积木的宽度与高度,只需3个单轴比较就能猜到本例中的最近邻积木,如图4-6所示决策树说明。一旦计算出至被猜测最近邻积木的距离,那么要证实导致猜测的决策的有效性,只需再进行3个比较就能够知道它是否是正确的。如果运气不佳,猜测失误,再回头对前面被舍弃的积木组进行决策求解。 图4-6 辨识新积木最近邻物的决策树 一般说来,具有两个分支系数和深度为d的决策树含有2d终叶。因此,如果要辨识n个物体,那么d必须大得足以保证2d≥n。对两边取对数后可知,所需比较次数(对应于树的深度d)为。如果有8个物体,比较次数为,而不是(8-1)=7次,那么节省并不显著。不过,如果有10亿个物体,那么比较次数为,而不是(109-1)≈10亿次,比较次数的节省就极其显著。 2.并行硬件更快求得最近邻物体 如果有大规模并行计算机,它包含许多处理机来执行各自的工作任务;那么就不需要进行前述设想推理搜索。每个距离的测量能够并行地进行。 当然,所得全部结果都需要进行比较,以便求得与未知物体得距离最小的事例。进行此类比较的一种方法需要有近邻处理机来比较它们的结果。然后,比较每双处理机的最小距离与某近邻双处理机的最小距离。继续这种方法,在经过步之后,最终将得到全局最小距离,其中n为被比较的距离数。 §4.5 基于概念的学习 基于概念的学习是归纳学习的一种。 归纳学习是研究最广的一种符号学习方法,它表示从例子设想出假设的过程。在进行归纳学习时,学习者从所提供的事实或观察到的假设进行推理,获得某个概念。归纳推理是一个从部分到全体、从特殊到一般的推理过程。 从应用角度看,归纳学习可分为概念学习、概念聚集和启发学习三种。 对概念学习的研究有两种不同的观点: (1) 基于工程方法的概念学习,它从可能的学习机理出发(不管这些机理是否存在于生命组织内),试图试验并确定概念学习的工程方法; (2) 基于认知建模的概念学习,极力开发出人类概念学习的计算理论。 本节仅从工程角度介绍基于概念的学习。概念学习的首要任务在于构造类型定义。因此,我们首先讨论类型定义,然后研究分类程序。 一、类型定义 就某一具体输入而言,分类就是赋给它所属类的名称。 分类是许多问题求解的重要组成部分。直接的识别问题是它的最简形式,如提问:“这是什么字母?”但分类常常嵌在另一操作之中。如下述产生式规则的一个问题求解系统: 如果:当前目标是从A地到B地,且有一堵墙将两地分开。 那么:找墙中的门并穿过它。 为能成功地利用此规则,系统的匹配程序须能辨识哪一物体是墙。若不能辨识,规则便无法调用。接着系统还须能认识门。 在进行分类前,必须先定义好类型。有多种定义方法,其中包括统计法和结构法。 图4-7 字母识别输入示例 1.统计法 抽出一组与问题领域有关的特征,用这些特征的加权和来定义每一类型。形式如下: C1t1 + C2t2 + C3t3 + … 式中,每个t对应一个有关的特征,每个C表示相应的权值。 例:要求解的问题是把输入图形正确地辨认为字母表中某个字母。每一输入被描述成0和1的矩阵,1表示有墨,0表示无墨。图4-7所示为这种输入的一个例子。图中,为便于识图,以空格代替0元素。对于每一输入矩阵,字符识别程序将输出英文字母表中26个字母之一,以表示该字母最类似这一输入图形。每个t对应于输入图形的一段,其值为该段1的个数。C的取值在-1与+1之间:-1表示墨水与该类相反的指示符,0表示不用考虑。 图4-8 字母G的定义 2.结构法 抽出一组与问题领域有关的特征,定义每种类型为由这些特征组成的结构。例如,对于字母分类问题,字母G定义为: ARC(a, b) ∧ ABOVE(a, b) ∧ LINESEGMENT(b, c) ∧ LEFT(c, b) ∧ LINESEGMENT(b, d) ∧ BELOW(d, b) ∧ LINESEGMENT(a, e) ∧ ABOVE(e, a) 以上两种方法各有优缺点。统计法往往比结构法有效;但结构法更为灵活,易于扩充。 二、分类程序 构造类型定义的任务叫作概念学习。它所使用的技术依赖类型(概念)的描述方法。如果用统计法描述,概念学习可用参数修正技术;如果用结构法定义类型,则需要使用构造式概念学习程序。 §4.6 基于神经网络的学习 一、神经网络的组成与特性 1.生理神经元的结构与功能 (1) 生理神经元的结构 大多数神经元由一个细胞体和突两部分组成,如图4-9所示。 突分两类,轴突和树突。 轴突是个突出部分,长度可达1m,把本神经元的输出发送至其它相连接的神经元。 树突也是突出部分,但一般较短,且分枝很多,与其它神经元的轴突相连,以接收来自其它神经元的生物信号。 轴突和树突共同作用,实现神经元间的信息传递。 轴突的末端与树突进行信号传递的界面称为突触,通过突触向其它神经元发送信息。对某些神经元的刺激促使神经元触发。只有神经元所有输入的总效应达到阈值电平,它才能开始工作。无论什么时候达到阈值电平,神经元就产生一个全强度的输出窄脉冲,从细胞体经轴突进入轴突分枝。这时的神经元就称为被触发。 (2) 生理神经元的功能与特性 脑神经生理学研究结果表明,每个人脑大约含有1011~1012个神经元,每一神经元又约有103~104个突触。神经元通过突触形成的网络,传递神经元间的兴奋与抑制。大脑的全部神经元构成极其复杂的拓扑网络群体,用于实现记忆与思维。 从生物控制论的观点,神经元作为控制和信息处理的基本单元,具有下列一些重要的功能与特性: a) 时空整合功能:神经元对于不同时间通过同一突触传入的神经冲动,具有时间整合功能;对于同一时间通过不同突触传入的神经冲动,具有空间整合功能。两种功能相互结合,具有时空整合的输入信息处理功能。 b) 兴奋与抑制状态:神经元具有两种常规工作状态: 兴奋——当传入冲动的时空整合结果使细胞膜电位升高,超过被称为动作电位的阈值时,细胞进入兴奋状态,产生神经冲动,由轴突输出; 抑制——当传入冲动的时空整合结果使细胞膜电位下降至低于动作电位的阈值时,细胞进入抑制状态,无神经冲动输出。 c) 脉冲与电位转换:突触界面具有脉冲/电位信号转换功能。沿神经纤维传递的电脉冲为等幅、恒宽、编码的离散脉冲信号,而细胞膜电位变化为连续的电位信号。在突触接口处进行“数/模”转换,是通过神经介质以量子化学方式实现的变换过程(电脉冲——神经化学物质——膜电位)。 d) 神经纤维传导速度:神经冲动沿神经纤维传导的速度在1~150m/s之间,因纤维的粗细、髓鞘的有无而不同。有髓鞘的粗纤维,其传导速度在100m/s以上,无髓鞘的细纤维,其传导速度可低至数米每秒。 e) 突触延时和不应期:突触对神经冲动的传递具有时延和不应期(在相邻的二次冲动之间需要一个时间间隔,即为不应期)。在此期间对激励不响应,不能传递神经冲动。 f) 学习、遗忘和疲劳:由于结构可塑性,突触的传递作用有增强、减弱和饱和,所以细胞具有相应的学习功能、遗忘或疲劳效应(饱和效应)。 2.人工神经元的组成与分类 (1) 人工神经元的组成 人工神经网络(Artificial Neural Nets, ANN)是由人工神经元组成的,可把ANN看成是以处理单元(Processing Element, PE)为节点,用加权有向弧相互连接而成的有向图。其中,处理单元是对生理神经元的模拟,而有向弧是轴突——突触——树突对的模拟。有向弧的权值表示两处理单元间相互作用的强弱。图4-10是ANN的组成示意图。图中,来自其它神经元的输入乘以权值,然后相加。把所有总和与阈值电平比较。当总和高于阈值时,其输出为1;否则,输出为0。大的正权值对应于强的兴奋,小的负权值对应于弱的抑制。 图4-10 人工神经网络的组成 在简单的人工神经网络模型中,用权值和乘法器模拟突触特性,用加法器模拟树突的互联作用,而且与阈值比较来模拟细胞体内电化学作用产生的开关特性。 (2) ANN的数学描述 设来自其它神经元i的信息为,它们与本神经元的互相作用强度为,i=1,…,n,神经元的内部阈值为θ。那么,本神经元的输入为 而神经元的输出为 式中,f称为激发函数,它决定神经元的输出。该输出为1或0取决于其输入之和大于或小于内部阈值θ。 激发函数一般具有非线性特性。常用的非线性特性有: ① 阈值型 如图4-11(a)所示 对于这种模型,神经元没有内部状态,激发函数为一阶跃函数。输出为: ② 分段线(b)所示 ③ Sigmoid型 如图4-11(c)所示 激发函数为西格莫伊德(Sigmoid)函数,简称S型函数。其输入输出特性常用对数曲线或正切曲线等表示。这类曲线反映了神经元的饱和特性。S型函数是最常用的激发函数,它便于应用梯度技术进行搜索求解。 图4-11 常用ANN输入输出特性 (3) 人工神经网络的分类 目前,在应用和研究中采用的神经网络模型不下30种。分为两大类: ① 前馈型 主要有反向传播(BP)网络、自组织映射网络等 ② 反馈型 主要有Hopfield网络、自适应共振(ART)网络等 二、基于反向传播网络的学习 反向传播(back-propagation, BP)算法是一种计算单个权值变化引起网络性能变化值的较为简单的方法。由于BP算法过程包含从输出节点开始,反向地向第一隐含层(即最接近输入层的隐含层)传播由总误差引起的权值修正,所以称为“反向传播”。 BP网络不仅含有输入节点和输出节点,而且含有一层或多层隐(层)节点,其结构如图4-12所示。输入信息先向前传递到隐节点,经过作用后,再把隐节点的输出信息传递到输出节点,最后给出输出结果。节点的激发函数一般选用S型函数。 图4-12 BP网络结构 BP算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐单元层逐层处理后,传至输出层。每一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望输出,那么就转为反向传播,把误差信号沿原连接路径返回,并通过修改各层神经元的权值,使误差信号最小。 三、基于Hopfield网络的学习 Hopfield网络属于反馈神经网络,是一种动态反馈系统,比前馈网络具有更强的计算能力。 Hopfield网络有离散随机神经网络模型和连续时间神经网络模型两种。一般在进行计算机仿真时采用离散模型,而在硬件实现时则采用连续模型。 第四章 知识获取技术 学习是人类智能产生的核心问题。人的聪明就在于学习,人不是单纯的死记硬背学习,被动的获取知识,更多的是不断总结经验教训、纠正错误,完善自己,不断适应环境变化的需要。人的学习是动态的获取知识并在获取知识的过程中,有所发现、有所发明、有所创造,人的学习是与认识论密切相联系的。 人工智能不仅要研究让机器具有解题的本领,还应重点研究使机器具有自学习的能力,使机器也能不断的积累经验、总结教训、纠正错误、完善性能、适应环境变化的需要,还能有所发现、有所发明。这也成为人工智能和智能控制的主要内容。特别是七十年代以来,由于以人工智能为基础的知识工程的发展,形成了人工智能的三大中心问题:知识表示(Represent),知识应用(Utieigation)与知识获取(Acquisition)。知识获取解决了机器知识的来源与补充。凡是先进而完备的人工智能系统必须具备有学习能力,原则机器只能按照人的“逻辑”或“传授”的原始知识死板地行动。而不能适应环境变化与事物发展的需要。 第一节 知识获取的概念和途径 知识获取的基本概念 知识获取的定义 “知识获取”(Knowledge Acquisition)是人工智能和知识工程的基本技术之一,它解决在人工智能和知识工程系统中、机器(计算机或智能机)如何获取知识的问题。这可以有两种定义: 狭义获取知识:指人们通过系统设计、程序编制和人机交互使机器获得知识,即通过人工移植的方法,将所要的知识存储到机器中,称为“人工移植获取知识”。例如:专家系统原始基本知识的获取是知识工程师利用知识表达技术建立知识库。 广义知识获取:除了人为的获取知识外,机器还可以自动或半自动地获取知识。例如:借助模式识别利用“机器视觉”或“机器感觉”,机器直接感知从外界来的信息,通过加工,对知识库进行增、删、修改、扩充、更新和完善,达到知识获取的目的。又如:系统在调试或运行的过程中,不断对外界所来的信息进行识别,通过机器学习进行知识的积累。 知识获取分类: 人工智能是用于模仿、延伸和扩展人的智能,所以,机器所需获取的知识类似与人类所需的知识,可以按各种不同的方式进行分类: 常规分类方式: 这种分类方式常以知识的属性和范畴来划分方向。 感性和理性知识 经验与理论知识 常识与专门知识 定性与定量知识 专业与基础知识 专用分类方式: 在人工智能和知识工程中,通常为了知识的表达、存储和推理的方便,以及系统设计的需要,也对知识进行分类。如: 按知识的用途分类:叙述性、过程性和控制性知识 按知识层次分类:浅层(经验或感性知识)和深层知识(理论或理性知识) 按知识等级分类:元级知识(知识的知识或本领知识),非元级知识(非本原知识由元级知识引申过来的知识)内舍和外延。 按知识的形式分类:文学知识、图象知识、书面知识、口头知识(口语)。 二、知识获取的主要途径 在人工智能和知识工程系统中,一般来说机器获取知识的途径不外有三条: 1、人工移植: 即依靠人工智能系统的设计师、知识工程师、程序编制人员、专家或用户通过系统设计、程序编制及人机交互辅助工具,把人的知识内容直接用程序“编辑”后存入到计算机的知识库中,使机器获取知识。这就要求系统不许具备特殊的知识编辑系统。 根据移植的环境不同,又分为: (1)静态移植:在系统设计过程中,使系统所要的先验知识直接通过知识表达、程序编制、存储到知识库中去。 (2)动态移植:在系统运行过程中通过人机交互系统或辅助知识获取工具,对机器知识库进行人工的增删、修改、扩充和更新使系统获取所需的动态知识。 2、机器学习: 所谓“机器学习”,是人工智能系统在运行过程中,机器通过学习来获取知识进行知识积累,对知识库进行更改,即用自然语言把知识“传授”给计算机。一般来讲,机器学习的方法有两种: (1)示教式学习:由人作为示教者和监督者,给出评价标准或判断标准,并对学习过程进行指导的学习。 (2)自学式学习:在机器学习过程中,不要人作为为示教者或监督者,而由系统本身监督器实现监督功能。并提供评价标准和判断标准。通过反馈进行工作效果检验。 3、机器感知: 所谓 “机器感知”,是人工智能系统在调试或运行过程中,通过机器视觉、机器听觉、机器触觉等外部途径,直接感知外界的信息,向自然界学习,以获取感性或理性知识。这是一种高层次理想的学习过程。在机器视觉与听觉中,都要用模式识别、自然语言理解等方法和技术。 第二节 机器学习的概念和类型 一、学习和学习系统的概念 1、学习: 什么是“学习”?“学习”是一个通俗的、广泛应用的概念,在不同学科的不同发展阶段往往有不同的含义。神经学家巴浦洛夫很早就把学习看成是“条件反射的形成过程”。控制论奠基人维纳把对学习定义相当广泛,甚至包括生物的个体变异与发育过程。他认为学习是“系统自我完善的过程”。自从人工智能发展成为一门学科以后,多数人工智能学者倾向于把学习看成是一种心理过程,看成是行为的变化。心理学家对学习的定义是:“学习是系统积累经验以改变其性能的过程”。 随着人工智能工作的深入发展,到七十年代“学习”逐渐被理解为“知识结构的改进,因为机器视觉、专家系统以及语言理解系统的知识往往被表现成各种句法结构或语义网络的组织形式。这种结构或网络在学习过程中不断地被补充完善。到七十年代后期,由于知识工程、专家咨询系统的发展,把 “学习”看成是“知识的获得、积累与改进”。因为专家系统的专门知识大量地被表示为可读规则的集合,这些知识需要不断地获取、组织与扩充。 八十年代初出现了把学习看成是技能的获取与改进,着多半是由于智能机器人取得的某些成就所促成的。技能也是某种知识,这种知识主要是通过实践形成的。同时也出现了把学习看成是“理论形成过程”(包括假说形成与定律形成)的观点,这时也出现了一些成为科研人员助手的发现系统,于是学习又被理解为“事物规律的发现过程”。 2、学习体统: 在七十年代初,人们对学习系统的定义各不相同。后来,为了统一起见,提出了一个“标准”的定义:“如果任何系统,只要它能够从某个过程或环境的未来特征中学到有关信息,并且能以学到的信息作为经验用于未来的估计、分类、决案或控制以便改进系统的性能,那么这就是学习系统。”为了使学习系统与自适应自组织系统有所区别,从控制论的角度提出了一个比较“封闭”的定义:“一个系统,若在它的环境发生变化后的时间T内,相对于性能函数P的响应是令人满足的,就可以认为是学习系统”。在人工智能发展的前期,学习系统基本上是按上述概念进行研究和设计的,他主要用于模式分类与自适应控制等过程实践,所以一般称为自适应学习系统(Adaptive Learning System)。 我国有些人工智能学者认为:从人工智能的角度来看,上述定义只是重复了逐步改善性能这一点。实际上现代人工智能系统是知识库与环境这两个部分的相互作用。因此,他主张“二元论”的学习系统的定义,即“学习系统”是在与环境的相互作用中,不断使知识(库)完善的过程。换言之,只要系统能够从周围的信息中获得未知的知识就可以算是学习系统而学到的有用知识必然会导致性能的逐步改进,这是不言而喻的。这种学习系统可以称之为智能学习系统(Intelligence Learning System),以区别于以往的自适应学习系统。凡是有关概念形成、归纳、推理、文法推断、假说猜想、科学发现等人工智能系统的内容,都可以纳入学习系统的范畴。实际上,这几年来的有关学习系统的研究工作已与上述内容结合越来越紧密,有的已成为学习系统的重要组成部分。因此可见,完整的人工智能系统应该是具有学习能力的系统,这一点已确认无疑的了。 二、机器学习系统的类型: 1、按学习能力分类: 这是自适应学习系统的传统分类方法。学习要标志在于对外界监督指导或教师的依赖程度,它把学习系统分为两类: (1)有监督的学习系统——示教式学习系统 需要人作为教师,进行示教、监督和训练,在学习结束后才能投入工作。也称为“离线)无监督的学习系统——自学式学习系统 不需要人监督或示教,机器本身在运行过程中自动获取知识,用评价标准代替人为监督环节,或称“在线”学习系统。 由上可见,有无监督的分类法不是很严格。七十年代仍有人用此分类法,但多指自适应学习系统。随着智能学习系统的不断发展,有必要采用如下的分类法。 2 、按知识水平与学习方法分类: 知识水平指特殊事物到一般规律的知识层次。学习方法指逻辑的思维推理方法。它把学习方法分为四类,且这些方法成为智能学习系统的主要分类基础。 (1)机械学习系统:(Rete Learning System)这种系统在训练时只用简单的奖惩原则把特殊的知识教给计算机。这是从特殊到特殊的学习过程。例如老鼠走迷宫和博弈对局。机械学习与单纯的记忆不同,它是通过反复学习评价后把知识存入知识库的。 (2)指导学习系统:(Advice-taking)训练站只给机器以一般而笼统的指示或建议,机器必须把指示或建议具体化为可以工作的细节知识或特殊规律。这是从一般到特殊的学习过程。在学习过程中要反复评价这些规则,以填补细节。指导学习系统要有领悟能力,不能只是“照葫芦画瓢”。 (3)示例学习系统:(Learning from examples)它是学习系统中用的最多的类型。它从许多事例或作为训练集的样本中得出事物的特征或规律性知识。这种学习称之为概括。它是从特殊到一般的学习过程。它有指导推广和“举一反三”的功能。示例学习的最高形式是“发现系统”,它通过学习所获得的知识可成为高度概括化的“定律”。 (4)类比或模仿:(Learning by Analogy)它用类比推理的学习方法,先由特殊事例概括出一般规律,即类比关系或转换规则,然后再由一般关系换成特殊事例或行动。 在上述分类学习系统中,事例学习系统的学习能力较强,它能概括以致发现新知识,知识库占用存储少,但应用时推理时间长,而机械学习系统则相反。类比学习系统介于其间。指导学习系统需要有优良的“导师”。 3、按学习事物的性质分类 (1)概念学习系统:概念学习又分为单概念与多概念学习两种。 所谓单概念指可以明确划分正反事例的概念,如判断事物的真假或是否等,而多概念多因素集合的概念,如疾病诊断。 (2)过程学习系统:学习掌握过程性知识,例如:解题步骤、机器行动计划、语言的句法分析与结构模式的文法推断等。过程学习往往需要把总目标化为分目标。 4、按知识表示法分类 学习系统要求知识的表达方式便于修改扩充,以便使知识库不断完善。根据知识表达方式可以把学习系统分为两大类: (1)数值学习系统:用数值表达知识,概率值、权系数等。数值是“隐式”知识的主要表达方式,主要用于模式识别、自动控制以及博弈等。 (2)符号学习系统:非数值学习系统。这种系统要求知识表达方式都为“显式”。常用的表达方式有特征向量,一阶逻辑和产生式等。特征向量用于不考虑内部结构的事物,据此符号学习系统又分为: A、结构学习系统:它要求知识表达方式为描述性结构,如符号串、判断树、语义网络。 B、产生式学习系统:它适合于过程规则的表达,也可以用于概念性知识,由于产生式学习系统便于规则的“产生”或修改,所以它是目前主要的学习系统。 第三节 机器学习系统的原理与结构 一、机器学习系统的原理: 机器学习系统是根据人工智能的学习原理与方法,应用知识表达和知识存储、知识推理等技术,设计和构成的具有知识获取功能,并能逐步改善其性能的系统,称之为“人工智能学习系统”。 机器学习系统可以采取示教式或自学式,进行离线或在线学习。在学习过程中可采用强记、指导、示例、类比等各种方法,进行奖惩式、演绎式、归纳式、联想式学习,并根据所采用的学习方法,设计系统的学习环节。 为了能够获取知识,改善性能,在机器学习系统中应用拥有知识库并且要求知识库具有增删、修改、扩充或更新的功能。在示例式学习系统中,还需要有相应的人机接口,以便机器向示教处学习,获取知识信息。 示教式通常为离线学习,即不联机(Off-line)。 自学式通常为在线学习,即学习系统与其工作对象或环境是直接联机(On-line)。 二、学习系统的一般结构: 选例 监督 学习系统的具体结构往往因具体任务的不同而有所不同。但是可以根据学习的一般特征提出一个统一的模式作为一般结构。如图所示: 图中有两个主要部分:环境(EV)与知识库(K.B.)这两部分分别代表外界信息来源与知识(信息学习成果),它们通过工作环节(W.E.)与学习环节(L.E.)相互作用。而这两个环节分别对知识信息与外界信息进行处理。环境、知识库、学习环节与工作环节构成了学习系统必要的组成部分,缺少其中任一部分都不能构成学习系统。此外,在工作环节与学习环节之间必须有反馈,这是学习系统的重要特征。另外,还有两个重要而非必需的信息处理环节,即简单环节(SV)与选例环节(LS),这两个环节的工作通常是有人作为教师或教练员来完成的。各个环节的功能如下: 环境(Environment):它不是一般意义的环境,而是指系统的外置信息来源。它可以指系统的工作对象,也可以包括工作对象或客观事物的外界条件。如在博弈系统中,环境就是变化繁多的棋向和对手;在科学实验分析中,环境就是各种因素和数据。 知识库(Knowledge Base):它用来存储或记忆系统通过学习所获取的各种知识。根据其稳定程度,知识库可分为两部分:长期记忆(LTM)与中期记忆(HTM)。长期记忆的知识是稳定不变的,它是学习系统必备的知识背景,在学习不能改变的基本知识与范畴。如:事物的基本定律、公理、定理等,这种知识是先验的知识,不是靠学习获得的。 中期记忆内容是相对稳定的,也就是一般定义下的知识,它包括各种具体事物的规律,如各种专业知识或规则的集合,这种知识是可以通过学习改变的。还有一种短期记忆(STM),也就是上述的总体数据库。它不仅用来反映环境信息的变化,也可以存储学习过程中的中途信息。它不属于知识库的范畴,而是调用知识的状态或条件。 工作环节(Working Element):又称允许环节(Performance)或决策执行环节。它利用知识库的知识作出决定或行为以完成各种工作。例如:模式分类、定理证明、智能检索、机器人行动计划。如果工作环节使环境发生了变化,就形成了在线学习。 学习环节(Leaning Element):它是学习系统的核心它的任务就是对环境信息进行搜索、控制和逻辑“思维”(如比较、抽象、概括、综合、推理等)以产生、修改与补充知识。它是智能系统的智能发生器。 监督环节(Supervisor):它相当于学习系统的“教师”或“训练者”。它的作用有:1、对工作环节的决策或行动效果进检验或评价,以指导学习环节的工作。因此,它必须具有评价、检验标准,如模式分类的分类标准或格式、控制系统的目标函数等。2、指导选例环节的工作。 选例环节(Instance Selection):选例就是从环境中选出有典型意义的事例或样本作为机器的学习对象,以提高学习效率,加快学习系统的收敛速度。所以选例是否合适对学习系统是十分重要的。上图所示的结构不仅适用于具有启发式学习程序的学习系统,而且对脑模型的学习机制也有重要的意义,因为大脑的联想推理部分相当于工作环节,而记忆部分则相当于知识库。 如果学习系统能通过学习形成知识与技能、那就成为智能学习系统。 第四节 常用的学习系统介绍 一、相关产生式学习系统 1、相关产生式的概念 通常的产生式是由“条件——动作”对的形式组成的,其产生式的左部(条件)和右部(动作)是无关的,即不存在共同项。 相关产生式(Relational Production)则是“前状态——后状态”对的形式,在其左部与右部之间存在相关项,即共项。 例如:在机器人的行动规划系统中,积木搬运规则UNSTACK(卸)的相关产生式如下: 前态(左部) 后态(右部) (clear x) (clear x ) (on x,y ) (ontable x) (on table y) (clear y) (on table y) 可见前态与后态之间存在共项(clear x),其共项性表示为:[(clear x)](on x,y) (on table x)(clear y) 进一步记为一般式: 2、相关产生式学习方法: 在相关产生式学习系统中,采用归纳式学习方法。从许多状态变换的事例中进行由特殊到一般的归纳,概括出行动规则的相关产生式。 相关产生式学习系统的结构相应于一般学习系统的结构对应部分: 知识库:用相关产生式表达知识的规则集,包括特殊和一般的规则。 学习环节:进行概括和归纳的“一般化”环节,通过示例训练由特殊到一般的推理。 选例环节:选取状态变换示例组成的示例集,作为学习系统的训练集。 工作环节:对于积木边界而言,工作环节为机器人。 监督环节:示教人或监督员 环 境:积木边界。 相关产生式学习系统的学习过程,即进行概括和归纳的“一般化”过程。其“一般归纳化”定理与定义参书P91~92。 二、条件空间筛选学习系统 1、示例空间学习: 对于复杂事物的学习过程,上述相关产生式系统存在一些困难。因为由搜索方法产生产生式是逐步获得的。有时可能出现前后矛盾现象,后面生成的产生式不符合前面的事例,因而往往需要返回追踪,重新搜索,效率较底。 所谓“条件空间”(Version Space),或称“文本空间”,就是列出所有可能的产生式的集合空间,在学习过程中,用训练集的正、反事例,去匹配条例空间的产生式集合,消除不符合时间事例的产生式,留下所需要的与实际事例不矛盾的产生式。称为“条例空间筛选法”。这样可以避免前后矛盾,不必返回追踪。 条例空间筛选法的学习过程,是从两端逐步匹配,删除其中较普遍的特殊条件的筛选过程,这是通过正反例的事例训练。不能压缩条例空间的双向推理过程。 2、结构归纳学习系统: 结构归纳学习是通过对输入的结构描述事例的学习,寻求描述一类事物概念的最精确的概括,这个过程即为“归纳”。 结构归纳学习需要考虑以下几个问题: (1)结构的描述:可以采用不同的关于事物的结构化描述方法。如产生式规则、层次结构、语义网络等。描述归纳学习要处理的事件以及归纳的结论。 (2)描述类型:“归纳”可看成是对于描述空间的搜索,因而必须给该搜索目标,提供关于目标的结构描述的判据。判别目标的类型有:“特性描述” ,“区分描述”,“分类描述”。 (3)概括规则:归纳学习的目的是寻求表达一类事物的最精确的概括,即从一些特殊的事例中抽象出一类事物的共性。概括规则是指实现这种“由个别到一般”的转换规则。 (4)构造性规则:构造性规则过程将改变关于问题的结构描述空间。可以用所谓“构造性归纳规则”来说明构造性归纳方法,它时间上是一种归纳推理的程序系统。 控制策略 控制策略分为“自底向上”(数据驱动)“自顶向下”(目标驱动)和“混合方式”三种 结构归纳学习方法是反复运用概括规则和县定规则、寻求关于及物概念的“MSC-概括”(最精确的概括)的过程。该算法一般包括一个“概括过程”和一个“限制过程”。 概括过程:指运用概括规则、从输入事物的个体实例中抽象出一般性的过程。 限定过程:当一个相关项可能使关于以了事物的结构描述范围扩大时,就必须使用限定规则加以限定。 四、类比识别——简单的学习方式: 类比原理 婴儿生下后逐渐地认识自己的父母、日常用品、汽车、飞机等等。这种学习方式称为类比识别(感性认识到一般认识)。它的学习机制如何,如何用计算机实现这一功能。为下例所示:若向图形A,B,C,1,2,3,4,5中哪一个是正三角形? 这个问题涉及到下面两个子问题:什么样的图形称为正三角形;如何从上面八个图形中识别出正三角形。有关第一个问题的知识属于第一层知识;第二个字问题的知识属于第二层知识。如何就得正三角形的定义呢?那只有通过父母和老师的教育,通过时间、并经自己的抽象思维逐步形成。如何识别正三角形呢?那就是用类比的方法,把上面给出的八个几何图形和自己头脑中的正三角形的模式逐个进行比较。这个问题比较简单,对如下问题: 设有图A 变换到图B为已知:现欲从图1~图5中找出一个图X来,使得图C变换到图X的规则与图A 变换到图B的规则相匹配。图A 和图B的自图是圆点、半圆和长方形,而图C和图1~图5的图是圆点和三角形,两类子图不一样。但是,我们可以一目了然地找出图1所求的X:因为图A变到图B的规则是其子图圆点被删除了。而图C变到图1的规则也是子图圆点被删除了。人匹配的时候靠一双眼睛,机器不一样,目前能实用的还只能以语句描述图形,用语句表达每个图中各子图之间的关系。表达图形是如何进行变换的。为了说明方便,我们称图A变到图B时,图A为源图,图B为终图用表示这种变换,有三部分组成:源图的描述 终图的描述 源图中各子图如何变换终图的子图例如:现有二幅图形。试看如何描述它们,其中X为源图,Y为终图。这两幅图形的三个部分描述如下: part 1 part 2 1在m的上面 n在m的右面 1在n的上面 n在m的内部 part 3 1删除 m的比例变化1:1 旋转0度 n的比例变化1:1 旋转0度 并不是所有图形都有三个部分描述,有的只需要二个部分描述,如在图3中A→B,试在图形1,2,3中找出一幅土,使得e→w与A→B匹配 现列出三个部分的规则: 规则 部分1 部分2 部分3 A→B 1在m上面 1在m左面 C→1 x在y上面 y在x上面 C→2 x在y上面 y在x上面 C→3 x在y上面 x在y左面 因为子图中不存在变大变小,旋转,增添,删除等变化,所以没有第3部分描述。比较A→B的一、二部分与其它规则的一、二部分,可见C→3可以和A→B很好的匹配。 2类比中值得注意的几个问题: 子图形的匹配不是唯一的。如右图所示, A为源图,B为终图,试问 x是z的照搬呢还是1的缩小呢? 这是毫无办法的问题,要解决这个问题, 只能对规则的第三部分描述进行“打分”。为说明源图中的某一子图变到终图中无变化,则打某一分数,若缩小了可大另一分数,看哪个分数高,就运用哪个规则作匹配规则。 当有几个答案是靠分数的高低选择最优答案。如下图:已知A→B 试在1,2 两幅图中找出w,使得c→w和A→B相匹配。现把规则描述如下: 部分1 部分2 部分3 A→B 1在m上面 1删除,m的比例1:1,旋转0度 C→1 x在y左面 x删除,x的比例1:1,旋转0度 C→2 x在y左面 y删除,x的比例1:1,旋转0度 从以上可知,C→1、 C→2都是A→B的精确匹配。这时只能规定A→B删除掉是三角形;C→1删除掉也是三角形;C→2删除掉是圆形。若规定c→w删除掉的图形和A→B删除掉的一样,则给以附加分。那么C→1就是最优答案。 若规则的第三部分描述只有位置关系时,则不用去考虑其子图个数与源图不同的那些图形。如下图所示: 因图A和图B的子图数相同,而图1,2的子图个数与C不同,故图3与A→B匹配规则相符合又是唯一的,所以是最佳选择。 上面讨论仅限于平面图形。对于平面图形,只要有A→B的三个部分描述,计算机就能识别c→w。这过程是一个识别过程,称为学习。那么对立体几何如何识别呢?若用同样的办法,则三个部分的描述是极复杂又十分可观,这时需要采用语文网络的方法。 五 概念的学习—立体几何的识别 用语义网络表示概念: 前节介绍的类比识别对平面图形较适合。若我们希望识别立体几何呢,则可借助与语义网络(Semantic Network)。语义网络由结点和弧组成,结点表示概念或对象,弧表示两个概念之间的关系,在弧上可附加一些说明,这些说明被称为是指针(Pointer)。比如积木世界中的房子的描述: 被B支撑 房子由 A、B组成 A是锲形块,B是砖块 有了这些基本的语义网络,房子的概念就 不难表示出来。从上述可知,房子的语义网 络中每一条弧上都有说明。可见指针在语义 网络中是何等重要。有时为了突出各概念之间的关系,指针可采用加强型。 如:Must-be-SopperTED-BY 必须被支撑 Must-BE-A 必须是一个… 2.学习: 为了教给儿童一个新的概念。往往除了举一些正确的例子外,还要适当举一些似是而非的例子。只有这样,才能是儿童树立完整的正确的概念。计算机也能象儿童一样,在“教师”的一些正确与似是而非的例子教育下,树立正确的概念。这种学习称为有指导性学习。 学习与一般的程序设计不一样。一般程序设计是人们去安排工作和执行任务的次序、机器只是照办而已,而学习有两种含义:接受教师的教育;用已有的概念和理论去解释客观现实,若产生不一致或矛盾,则再修正原有概念。这是一个多次反复的过程,是一个解释现象、修正错误的过程。计算机如何进行学习呢?用语义网络就能表达这种简单的学习概念。设有一个房子,教师为了使学生对房子的概念有清楚的认识,就给出一些反例。 通过学习,机器对房子的概念更加清楚了。这种认识的深化体现在两个指针都用了加强型。在有些情况下,某一件东西不一定是某一形状之物,而可以是某一类型之物。如:积木世界中提供(Arch)的概念,教师给出了两个正例和反例来教计算机学习拱的概念。 对此计算机的学习步骤如下: 程序比较正例1和反例1,发现正例1中有两个指针(顶被柱1支撑顶被柱2支撑)而反例1中则没有。通过学习程序应把概念模型中的两个指针改为加强型。 程序比例正例1和反例2。发现反例中,柱1和柱2之间多了两个指针(touch)。而正例中则没有,因此,正例中在柱1和柱2之间应增加一对“不能接触”指针。程序反复的比较正例和反例,而后,修改正例指针已达到概念清晰。 程序比例正例1和正例2之后,发现拱的顶既可以是锲型块有可以是长方块,这说明语文网络中有关指示顶的类型的指 针,应指向跟广大的范围。在粘木世界中,所 有的物体可划分成不同的类用一棵树表示: 通过学习,可得拱的新概念模型如右图 所示。从上例可知,学习是不断修改语文网 络的过程、通过反例的学习把一些指针更改成加强型,通过正例的学习,一些指针就指 向范围更宽的区域。同时也可以看到, 用语文网络进行学习,首要的问题是找出模型网络和样品网络之间的差异。为了找到这种差异。第一步,必须对它们进行分配,找出两个网络之间的对应关系,常用的方法是在图上把对应的点用虚线连起来。第二步,找出模型与样品之间的差异,差异一般有两种:被匹配结点性质方面的差异或被匹配结点对应关系的差异。 除上述学习方法之外,还有机的视觉与物景分析、机器听觉于人机对话等由感知的学习。在此不再赘述,有兴趣情参阅有关资料。 本 章 小 结 知识获取是人工智能和知识工程中的关键技术难题。目前,在实际系统设计中,如专家系统。,主要采用“人工移植”的方法。使机器获取知识。关于机器学习与机构感知等自动获取知识的方法和技术,是正在研究和开发的领域。 为了提交人工移植方法只是获取的效率,需要研究的问题有: 知识的分类、编辑和介绍方法 知识获取的辅助工具,智能编辑器 “专家-知识库”智能接口 在机器学习方面学要研究的问题,如: 在线、实时示较学习系统 实例运行经验归纳学习系统 类比学习方法与联想数据库 知识库自动增删、修改、扩充与更新的方法和机器实现技术 环境 学习环节 知识库 工作环节 学习 知识库 工作 环 境 选例 监督 细胞体 输入信号 树突 轴突 突触 神经元输出 细胞核 图4-9 生理神经元的组成 × W × W × W + 相加 1 0 阈值 σ 0 f(u) 1.0 1.0 0 f(u) σ σ 0 f(u) 1.0 (a) (b) (c) … … 输入信息 输入层 … … 输出信息 输出层 … … … … 隐含层

  “原创力文档”前称为“文档投稿赚钱网”,本网站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有【成交的100%(原创)】

本文链接:http://furymagazine.com/yuyishu/104.html