关键词:计算机视觉;案例推理;图像处理;图像描述
中图分类号:TP391.41文献标识码:A文章编号:1009-3044(2007)04-11102-03
1引言
基于案例推理(case-basereasoning)是人工智能中正不断发展的一项重要推理技术。基于案例推理与类比推理方法相似,案例推理将旧经验或教训转换为知识,出现新问题时,首先查找以前是否有相似的案例,并用相似案例解决新问题。如果没遇到相似案例的,经过推理后解决新问题的方法,又会成为新的案例或新经验,下一次再遇到相同问题时,就可以复用这些案例或经验。
这与人遇到问题时,首先会用经验思考解决问题的方式相似,这也是解决问题较好的方法。基于案例推理应用于工业产品检测或故障诊断时具有以下特点:
CBR智能化程度较高。利用案例中隐含的难以规则化的知识,以辅助规则推理的不足,提高故障诊断系统的智能化程度。
CBR较好解决“知识获取”的瓶颈。CBR知识表示以案例为基础,案例的获取比规则获取要容易,大大简化知识获取的过。
CBR求解效率较高。是对过去的求解结果进行复用,而不是再次从头开始推导,可以提高对新问题的求解效率。
CBR求解的质量较高。CBR以过去求解成功或失败的经历,可以指导当前求解时该怎样走向成功或避开失败。
CBR持续不断的学习能力,使得它可以适应于将来问题的解决。
所以基于案例推理方法正不断应用在产品质量检测和设备故障诊断方面,并取得较好的经济效益。为了产品检测和设备故障诊断中,更为智能化,更容易实现现场检测和诊断,计算机视觉技术起到很大的作用。
计算机视觉是研究用计算机来模拟人和生物的视觉系统功能的技术学科,使计算机具有感知周围视觉世界的能力。通过计算机视觉,进行图像的获取预处理、图像分割与特征抽取、识别与分类、三维信息理解、景物描述、图像解释,让计算机具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。
计算机视觉随着科学技术发展,特别计算机技术、通信技术、图像采集技术、传感器技术等,以及神经网络理论、模糊数学理论、小波的分析理论等计算机视觉理论的不断发展和日趋成熟,使计算机视觉从上世纪60年代开始兴起发展到现在,取得快速发展,已经从简单图像质量处理发展到围绕着纹理分析、图像编码、图像分割和滤波等研究。图像的分析与处理,也由静止转向运动,由二维转向三维,并主要着眼于对图像的识别和理解上,也使计算机视觉的应用领域更为广泛,为案例推理中运用计算机视觉打下基础。
2案例推理系统的主要关键技术
(1)案例的表示与组织
案例的表示与组织即是如何抽取案例的特征变量,并以一定的结构在计算机中组织存储。如何将信息抽取出特征变量,选择什么语言描述案例和选择什么内容存放在案例中,案例按什么组织结构存放在存储器中,这关系到基于案例推理方法的效率,而且对于案例数量越来越多,结构十分复杂的案例库,尤其重要。
(2)案例的索引与检索
案例的索引与检索即是为了查找最佳相似案例,如何建立案例索引和相似度算法,利用检索信息从案例库中检索并选择潜在可用相似案例。后面的工作能否发挥出应有的作用,很大程度上依赖于这一阶段得到的案例质量的高低,因此这一步非常关键。
(3)案例的复用和调整
案例的复用即是如何根据旧案例得出新解,涉及到找出案例与新问题之间的不同之处,案例中的哪些部分可以用于新问题,哪些部分不适合应用于新问题的解决。而复用还分案例的结果复用,案例的求解方法复用。
(4)案例的学习
案例的学习即是将新解添加到案例库中,扩充案例库的案例种类与数量,这过程也是知识获取。此过程涉及选取哪些信息保留,以及如何把新案例有机集成到案例库中,包括如何存储,如何建立索引等等。
针对案例推理的关键技术,根据检测和故障诊断系统的特点,计算机视觉主要解决如何将产品图像输入系统,如何将产品图像特征进行抽取和描述,如何区别产品不同之处。以便案例推理系统进行案例建模,确立案例的表示形成和案例相似度的计算。本文主要从计算机视觉如何运用在案例推理系统进行探讨。
3产品输入系统
产品输入系统在不同产品类型和生产环境可能有不同之处,主要应有传感器单元和图像采集单元。如图1。
图1产品输入系统结构
传感器单元主要判断是否有产品存在,是否需要进行图像采集,是否继续下一个产品图像的采集。这简单传感器可使用光电开关,配合光源,当产品经过时,产品遮挡住光源,使光电开关产生一个0值,而没有产品经过时,光电开关产生相反的1值,系统通过判断光电开关的值,从而判断是否有产品。
图像采集单元简单地说是将产品拍摄并形成数字化图像,主要包括光源、反射镜、CCD相机和图像采集卡等组成。光源和反射镜作用主要使图像中的物体和背景之间有较大灰度。CCD相机主要是拍摄设备。图像采集卡主要是将图像数字化。通过传感器判断有产品后,光源发出的光均匀地照在被测件上,CCD相机拍摄,拍摄图像经过图像采集卡数字化后输入存储设备。存储设备即为计算机硬盘。存放原始图像、数据、处理结果等。
这是案例推理系统的原始数据,是图像处理、图像特征抽取描述的基础。
4图像处理
在案例推理系统中,需要对案例的组织和案例建模,案例的组织即案例的表示,相对计算机而言,即图像特征的抽取,即某图像具有与其它图像不同之处,用于区别其它图像,具有唯一性。同时,又能完整地表示该图像。所以案例的表示要体现案例的完整性、唯一性、操作容易性。
图像中有颜色区别、又有物体大小之分以及图像由不同的物体组成。如何表示图像,或说图像内部包含表示的本质,即图像的描述。根据图像特点,确立图像案例的表示,以图像的像素、图像的数字化外观、图像物体的数字组成等属性。这需要对产品输入的原始图像进行处理。
在计算机视觉技术中,对原始图像主要进行图像增强、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既改善了图像的视觉效果,又便于计算机对图像进行分析、处理和识别。具体工作流程如图2所示:
图2计算机视觉的任务与工作流程
图像预处理是将产品的数字图像输入计算机后,首先要进行图像的预处理,主要完成对图像噪声的消除以及零件的边缘提取。预处理的步骤为:图像二值化处理;图像的平滑处理;图像的边缘提取。
图像二值化处理主将灰度图形二值化的关键是阈值的选取,由于物体与背景有明显的灰度差,可以选取根据灰度直方图中两峰之间的谷值作为阈值来分割目标和背景。
图像的平滑处理技术即图像的去噪声处理,主要是为了去除实际成像过程中因成像设备和环境所造成的图像失真,提取有用信息。
图像边缘提取是为了将图像中有意义的对象与其背景分开,并使之具有某种指定的数学或符号表达形式,使计算机能够理解对象的具体含义,检测出边缘的图像就可以进行特征提取和形状分析了。可采用多种算法,如采用Sobel算子提取边缘。
图像预处理是为下一步的特征描述打基础,预处理的好坏直接影响案例推理的结果和检测诊断的效率。
特征提取是对图像进行描述,是案例建模关键,案例建模是根据案例组织要求抽取图像特征,是建立案例索引和检索的关键。如果图像没有特征,就谈不上进行检索。图像特征可通过图像边界、图像分割、图像的纹理等方法,确定图像特征,包括是什么产品、产品形状大小、产品颜色,产品有什么缺陷、产品缺陷在什么位置等特征,根据这些图像特征进行描述,形成计算机中属性值,并从数据库查找相应信息资料,从而确定产品之间的关系,相似度,也就是案例推理的方向。
5系统的检索
根据案例推理原理和相应算法,建立案例推理系统模型,如图3所示。
图3案例推理系统
对话系统:完成人机交互、问题描述、结果显示和系统总控制。
案例库系统:由案例库及案例库管理系统组成。
数据析取系统:对各种已有的源数据库的数据通过转换而形成所需的数据。
多库协同器:根据问题求解的需要,按照一定的数据抽取策略,完成问题求解过程中对模型库系统、方法库系统、知识库系统和数据库系统等资源的调度与协调。
知识库系统:由产生式规则组成,这些知识包括专家经验和以规则形式表示的有关知识,也可以是数据挖掘结论,支持案例检索、案例分析、案例调整等。模型库系统:由模型库、算法库、模型库管理系统组成。完成模型识别和调用,并把结果综合,送入对话系统显示,作为补充信息供案例检索、调整使用。
数据库系统:存放待决策支持的所有问题,并完成其维护与查询等功能。
由于系统主要应用产品的现场实时检测监控或故障诊断,所以系统的检索时,也必须输入检索值,即输入现场产品的图像,在通过产品预处理、图像的二值化、分割和边界处理后,进行图像特征描述,根据图像描述进行分类识别。根据案例推理的算法检索案例库中,是否有相似的案例。即确定相似度。相似度确定主要由案例推理的算法确定,如贴近分析法。确定相似度最大作为结果,并将案例的解输出,给相关控制系统进行决策。如产品质量检测,确定产品质量是否合格,是否有不合格产品,不合格产品是什么原因造成,故障源是什么,如何解决和排除故障,等等。
6结论
案例推理方法有效地解决计算机视觉技术中图像检索问题。对提高图像检索的效率和准确度提供了平台。
计算机视觉技术也为案例推理系统实现产品现场实时检测、监控、诊断提供技术支持。计算机视觉技术现场的数据采集、处理为案例推理打好基础。
两者的结合设计的系统适用范围很广,只要产品需要进行质量检测、监控,或设备需要进行故障诊断和维护,都可以适用。
系统提供的实时检测、监控和诊断功能,提高企业的生产效益,降低了生产成本。
参考文献:
[1](美)桑肯(Sonka,M).图像处理分析与机器视觉[M].人民邮电出版社.
[2]王宏等译.计算机视觉[M].电子工业出版社.
[3]蔡建荣.自然场景下成熟水果的计算机视觉识别[J].农业机械,36(2):61-64.
[4]王宇辉.基于计算机视觉的锥体零件尺寸在线检测算法[J].重型机械,2005,2:4-6
[5]骆志坚.基于计算机视觉检测技术自动计数系统的研究与应用[J].仪表技术与传感器,2005,3:41-43.
[6]左小德.贴近度分析法在案例库推理中的应用[J],南大学学报(自然科学版),1997,18(1):21-26.
[7]姜丽红.案例推理在智能化预测支持系统中的应用研究[J].决策与决策支持系统,1996,6(4):63-69.
关键词:设计艺术;设计教学;手绘训练;计算机绘图;视知觉
中图分类号:J50文献标识码:A
SignificanceofFreehandSketchinginDesignTeaching
XUQing
(SchoolofDesign,JiangnanUniversity,Wuxi,Jiangsu214122)
近年来,随着计算机软件教学在设计教学中的广泛应用,绘图软件的高效性和便捷性,对于教学中的手绘训练,产生了重大的冲击,有观点认为用计算机绘图的方式完成设计练习会更容易,色彩搭配和替换的也更直接。持此观点的人不理解甚至否定了手绘在设计练习中的必要和意义,希望练习作业用绘图软件来绘制,而不是手绘。这种观点是十分错误和有害的。
计算机的出现是科技改变生活的一面镜子。它改变了我们的生活和工作,使衣食住行都发生了惊人的变化,工作的速度和效率得到空前提高。但是,如果简单地把计算机当作人类改造世界的工具来看待,就太小觑它的影响力了。计算机作为自然科学的产物,关注的是物的清晰性、稳定性和运动性规律,力求通过排除具有差异性的偶然因素,获得世界的普遍性和确定性本质。而包括设计在内的人文科学,关注人的认识和思维活动的全面发展,认为把世界静态化和程式化处理是虚假和有害的,因为一旦它得以确立,就很容易因特有的便捷性和可操作性使人放弃对世界的真实领会,而人对世界的真实领会是人认识自身和世界的源头。然而,在当今追求“功能―效益”的工业文化主导的社会,计算机在社会学习和工作中的广泛应用,正对人的认识和思维活动的全面发展产生不利的影响。在设计教学中,主张放弃手绘训练,而中意计算机操作,就是一个鲜活的例子。
主张“以计算机绘图取代手绘”的人认为,设计创作的流程是:观察事物―提炼形式―形成语言―转换语言―进行创作。其中,手绘和计算机绘图都只是转换语言的手段而已。既然计算机绘图效率更高,为什么不用呢?
可是,计算机真的是我们可以随心使用的工具吗?关于计算机,要记住的基本事实是,其研究方法只依靠严格的线性逻辑方法。它的程序只是类似于人的认知过程而已。这种过程是计算机力量的根源。在物质世界的逻辑分析中,计算机以比人更强的记忆和精密分析着日常世界。这就给人一个错觉。在认知过程中,我们点击鼠标就像手持画笔一样,可以自由地将自己的感受和视知觉形象由内而外地转换出来。然而,这里出现了一个人们难以发现的、却意义重大的差异,即手绘时视知觉的表现与操作计算机时的视知觉的转化是完全不同的。手绘时,视知觉处于一种感悟过程,而计算机绘图是一个对视知觉印象浏览和跳读的过程。前者是视知觉经验在纸笔间留下印记、在世界与智慧之间取得一致的过程;后者是在程序操作技巧和速写之间,取得形式上的秩序的过程。计算机绘图使得人的视知觉表达机械化(事实上,在学习计算机程序时,学习者的感觉和思维就被要求必须依附于逻辑化、机械化的程序操作模式)。计算机绘图有着明显的流水线工作流程,忽略这种程序化的流程对视知觉表现的不利影响,是那些主张“以计算机绘图取代手绘”错误观点的症结所在。
计算机绘图程序在个别事物之中猎取那些具备普遍意义的东西,把人视觉经验轮廓化,建立起概括性很强的形式(造型与色彩元素)模型。计算机无视人的视知觉感悟世界的天赋,与自然科学关注“物”的文化取向有关。人的视知觉是对世界的一种能动的把握,不是人在感知事物的个别成分之后,再将这些成分在脑中机械拼凑或相加而成的。它是知觉活动在对外部事物整体的瞬间把握中建构的产物。“它是有高度选择性的,不仅对那些能够吸引它的事物进行选择,而且对看到的任何一种事物进行选择。”[1](P.49)
当人观看世界时,自然事物或内心世界中的任何变化,都会令人产生充满激情的视觉感知。鲁道夫・阿恩海姆说:“所谓‘观看’,就意味着捕捉眼前事物的某几个最突出的特征……这些突出的标志不仅足以使人把事物识别出来,而且能够给他一种生动的印象,使人觉得这就是那个只是事物的完整形象。”[1](P.50)诸多形象和色彩混乱、偶发并积极地结合,尝试着构建出一种视知觉的形成。这种形成是人对观看对象的总体结构特征的主动把握。阿恩海姆认为,人的视知觉具有思维的一切本领。他说:“人的视觉决不是一种类似机械复制外物的照相机一样的装置。它不像照相机那样仅仅是一种被动的接受活动,外部世界的形象也不像照相机那样简单地印在忠实接受一切的感受器上。相反,对于人来说,他总是在想要获取某件事物时,才真正地去观看这件事物。这种类似无形的‘手指’一样的视觉,在周围的空间中移动着,哪儿有事物存在,它就进入哪里,一旦发现事物之后,它就触动它们、捕捉它们、扫描它们的表面、寻找它们的边界、探究它们的质地。因此,视觉完完全全是一种积极的活动。”[1](P.48-49)
在视觉艺术创作中,视知觉的功能被有意识地使用和扩大了。当一个艺术家“观看”事物时,他对事物的视觉构建有独特的方向,他比一般人更努力地捕捉和表现“视觉形象的表现性”。这种“视觉形象的表现性”体现为视知觉对“力”的感知。“我们发现,造成表现性的基础是一种力的结构,这种结构之所以会引起我们的兴趣,不仅在于它对拥有这种结构的客观事物本身具有意义,而且在于它对于一般的物理世界和精神世界均有意义。”[1](P.620)视觉艺术家在努力寻求一种视觉判断上“力”的平衡。一切事物都存在于时间和空间中。它们都是流动、偶发、短暂和矛盾的。力的平衡,就是感知事物时所经历到的视觉力的基本性质――扩张与收缩、上升与降落、前进与后退、扭曲与径直等方面――都在达到其极短暂的、静态时所特有的一种“力”的分布状态。对于造型来说,就是形状、位置、方向、色彩等诸多“力”的表现要素“都达到了如此确定的程度,以至于不允许这些要素有任何些微的改变。”[1](P.17)“在实际上,在任何一个具体的艺术品中,都是通过……各种力的相互支持和相互抵消而构成整体的平衡的……由这些力的关系所造成的复杂性,对于造成一件艺术品的生命力来说是至关重要的。”[1](P.26)这种视知觉中“力”的平衡瞬间建构,会改变或歪曲物质世界的形式和色彩,确立一个具有强烈节奏性的新的创造性视觉形式。在这种创造性视觉中,实物或印象中物象本身似乎消失了,从先前具体的、个别的、混乱不清的各种形与色的关系中,浮现出肯定而明晰的线条与色彩。这种形式,线条和色彩各方面,对人而言,不是对外界事物一种忠实的复制,而是充满生动的、形与色的和谐律动的世界,是一种形式美的世界。
人的感知与知识不同,它在与世界进行接触的过程中根本不需要以概念为中介。从纷繁复杂的变化世界中,捕捉事物之间力的平衡,并塑造新的创造性视觉形式,是十分困难的。但是,对于一个准备成为视觉艺术家的人来说,这种能力是一个必须掌握的专业素养。视知觉是一种既具体又抽象、既清晰又模糊、既完整又片面的自相矛盾的感知。创造性视觉的最终形成,是一个经过无序和漫长的阶段,和无数次的力的调节和踪迹的抹擦过程,是一个不同物到另一个不同物,一个对立项到另一个对立项的位移和摇摆不定的延异(雅克・德里达语)。事物的差异和位移的永恒存在的,而力的平衡只是在延异过程中的瞬间的状态,也是手绘者最终寻到力的平衡时候的视觉形式的表达。
海德格尔说:“在每一件手的作品中所包含的每一个手的动作都贯穿着思的因素,手的每一举措皆于此因素中承载自己。一切手的作品都根植于思。”[2](P.21)手绘最大特点就是,它将视知觉经验的迅捷过程呈现为稳定不变的、沉思与分析的力量。在设计教学中,手绘设计表现必须被重视。它对激发视知觉感悟能力,增强对造型空间、细部结构的力的把握,都有重要作用。手绘训练,既培养了学生的视知觉能力,增强对造型艺术的敏感度和审美能力,也培养了学生的艺术思维方法,让设计思想和设计表现更加活跃。而计算机绘图另辟出一系列与设计创作完全不同的心智习惯,若是以这种方式进行设计教学,危害甚大。首先,计算机绘图软件程序的理性逻辑与模块使用,是无视视知觉捕捉事物之间力的平衡的创造,将严重降低学生视知觉能力的培养;其次,计算机的程序操作迫使学生将勉强抓住的点滴视知觉经验转化为机械语言,具有活力的视觉感悟被降解至枯燥无趣的点线面的拼凑;此外,当学生惯用计算机形式化语言后,图像和色彩的复制粘贴就立刻因效率高而被大量运用,可以想象的结果是,学生不再尝试形式创造,而是热衷于模仿抄袭。
手绘训练是设计教学中一项重要基本技能培养。计算机绘图不能替代手绘对世界的感悟。在信息高速发展的今天,计算机给予了我们工作和生活的许多便利。我们可以利用计算机绘图软件,实现一些纯技术化的操作,能节省许多工作时间,提高工作效率。当代很多优秀的设计师,他们的创意都喜欢用手绘的方式进行表现,用手工设计完了,再由电脑辅助设计师来用电脑完成设计图。在设计教学中,手绘训练能培养学生视知觉敏感性的训练,通过切实感受到事物的灵韵,触摸媒材的颤动,更深刻地体验到设计的艺术魅力。“以计算机绘图取代手绘”的观点是不妥当的。在当前的设计教学中,手绘训练不但不应该取消,反而应该加大训练力度。(责任编辑:贾明哲)
参考文献:
关键词:计算机;图形图像设计;视觉传达设计;异同点;应用
一前言
从行为方式来分析,视觉传达改变早已出现,然而,如果站在学科角度来分析,视觉传达则为一个新鲜领域。视觉传达指的是将视觉符号作为信息传递的一个主要通道,人们通过视觉符号进行信息交流和信息共享。并且,这也是人们传播信息的一重要方式。据统计,人类约70%的信息都是通过视觉系统所获得的,但是,对外部环境信息作出反应过程中,在人类感官系统中,视觉系统占据着主导位置。若人类借助视觉系统来接受信息,再用另外一感官接受其它信息,若这两个信息存在矛盾时,那么人类将会对视觉信息作出相应反应。
二关于计算机图形图像设计和视觉传达设计的分析
2.1概念和设计思路
对新时代的人们来说,其数码艺术早已渗透到人们的日常生活当中,成为十分流行的艺术创作手法,特别是对年轻一代人来说,都热衷大胆进行尝试,从而通过此方式去释放作者的想象力,来表达出自己的内心情感,因此,此种艺术创作手法既简单又复杂。对于计算机图形图像设计与视觉传达设计来说,不仅能够解放设计师双手,而且又能使设计者思维更富有其弹性,不受技巧框住,不受现有知识所影响,以便创造出更多无意识、不合常规的特殊作品,这势必会成为计算机图形图像设计与视觉传达设计的独特之处。一般来说,人们把视觉传达设计看作为表达人思维的一种手法,特别是在视觉传达设计中,将文字和图像紧密结合,二者相互补充,衬托出对方的优势,因此,视觉传达对符号设计时,要尽量将而这加以优化,充分发挥出符号优势,从而将整体予以转达。
2.2设计手法和设计技术
随着时展的进步以及行业发展内在需求,因此,我们要充分认识到电脑和设计二者之间的联系,将计算机变为设计工作者的一重要设计工具,表达设计者的设计理念,再分享给人民大众。再加上,信息全球化的高速发展,远远离不开计算机图形图形设计,特别是在广告、电影等发展领域当中,都要求有很强的计算机图形图形设计技术。并且,在设计过程中,设计者也可以借助各种工具软件,适当调节图形图像的清晰度,从而给观众良好视觉感受。
三关于计算机图形图像设计和视觉传达设计异同点
3.1相同点
计算机图形图形设计和视觉传达设计过程中,一般会应用到Photoshop软件,它是Adobe公司开发的一个跨平台的平面图像处理软件。PS的专长用于图像处理,而不是图形创作。图像处理是对已有的位图图像进行编辑加工处理以及运用一些特殊效果,其重点在于对图像的处理加工。大多数内容都是难以区分的,换言之,它们的共同点是非常多的。比如:在专业课中,都会涉及到绘图、色彩等知识,在此方面的学习具有相同点,而且,在现代设计思路、创作方式都是互通的,对点、面、体等的排列原则也都是相同的。
3.2不同点
3.2.1目标任务不同
视觉设计工作者的目标任务是为找寻美感,打造良好的设计形象,熟练掌握媒体动态所产生的;但是,计算机图形图像设计目标任务是把动态和静态紧密结合,塑造二维和三维空间所产生的。
3.2.2技术方法不同
视觉传达设计除要对核心技术进行学习之外,对理论知识学习也要引起高度重视,因此,视觉传达设计相对比较枯燥、乏味,但是,计算机图形图像设计相对十分有趣,除要学习专业课程之外,对视频编辑等内容的学习也是非常重要的。
四当前计算机图形图像设计和视觉传达设计的应用探究
4.1包装设计
在市场或者是超市当中,新颖、特别包装设计会可以吸引消费者眼球。因此,对于视频和服装包装远远离不开计算机图形图形与视觉传达设计。包装成为实现使用价值的一个重要手段,不管是在书籍封面或者是各种宣传彩页的制作,上述这些带有良好视觉传达的商品,通常都和计算机图形图像设计有关,对思想性与知识性予以重新认识。其中,色彩、透明度等的不同都会传达出不同视觉效果。
4.2广告与影像创意设计
在广告和影像创意设计当中,都远远离不开计算机对图形图形的处理,在经过处理之后,便会带给大众各种不同创意效果。可以说,创意设计为艺术设计的一个枝干,但是,这种设计往往不带有商业性目的。然而,因创意设计能够为设计爱好者提供更为广阔空间,所要,大量设计工作者学习计算机图形图像设计知识,表达出各自不同的视觉创意。
4.3插图和绘画设计
因计算机图形图图像设计拥有绘画和调色的功能,因此,大量插图工作者首先利用铅笔来绘制草图,再借助图形图形设计软件来绘制插图。另外,近几年来,像素画极其流行,从而使更多设计者能够通过图形图形设计来创作自己个性化作品,并且,此类作品有较强视觉冲击力。
五结束语
总体来说,在当今信息高速发展的时代,科学技术成为国家进步的主要力量。而在我国各行各业当中,计算机图形图形设计和视觉传达设计应用十分广泛。因此,我们只有在对现有技术加以改革,认真对视觉传达设计进行研究,将计算机图形图形技术为人们的生产和生活服务,为社会发展贡献一份力量。在现今领域中,都充满巨大挑战,因此,计算机图形图形设计必然会更好的适应社会发展,尤其是在于视觉传达设计的结合更为重要,二者相互影响,相互促进。我们坚信,在不及的将来,必然会有新突破,
参考文献
[1]郑刚,辛欢.计算机图形图像设计与视觉传达设计[J].兰州工业高等专科学校学报,2004(2).
[2]范丽萍.计算机图形图像设计与视觉传达设计[J].电脑编程技巧与维护,2012(4).
[3]金波.数字时代视觉传达设计的构成关系浅释[J].美术大观,2007(4).
计算机平面设计在社会生活中逐渐具有举足轻重的作用,为了提升其视觉体验效果,不断的发挥色彩语言在其中的重要作用自然无可厚非,因此色彩语言目前已经成为计算机平面设计中的主要角色。可以在应用层面把色彩语言与计算机平面设计两者之间的关系划分为以下两个方面。其一,色彩语言是计算机平面设计中的重要陪衬,例如色彩语言中的一些元素能够直接应用于视频、图像、文字等之中,从而使整个平面设计作品在色彩语言的衬托下展示了更好的视觉效果,达到了商品在审美与实用两个方面相互增值的效果,最终让产品能够被更多的消费者认可与理解;其二,计算机平面设计能够在过程中实现色彩语言的优化与完善。计算机平面设计的过程也是对色彩进行优化使用的过程,其能够让色彩变得更新颖,更高层次发挥色彩的吸引力与感染力,从而实现产品设计的外观与实用性相统一的作用。
二、色彩语言在平面设计中的应用探讨
以平面设计为基础的计算机平面设计被广泛的应用在企业的形象展示设计、产品包装设计、商业广告设计等各个方面。这种以文字、图像等形式作为传播载体的功能设计,能够很直接的传递一个理念以及与企业或产品有直接关系的信息和文化。曾经色彩被简单的当作文字或图形的附属品来使用,后来市场不断提高的竞争力,使得色彩语言成为平面设计方面的有利武器。接着色彩语言就成为了能够很好表现产品或企业个性的主要方式,并在不断的使用过程中占据了设计作品中的主要元素。
三、色彩语言在计算机平面设计中更深意义上的应用
3.1色彩语言在计算机平面设计中的情感应用
色彩作为平面设计作品中画面渲染的主要元素,本来不具备情感特征,只是一种物理的视觉表象,然而将它融入在我们的生活当中时就会引起我们的情感共鸣从而产生情感作用,进而实现平面设计效果上的升级,因此色彩语言能够为平面设计作品的情感表达加分。利用色彩在冷暖感觉上的作用搭配进行色彩选择,能够很好的把产品的实物特征展现给消费者。利用色彩的收缩与膨胀特征加以科学的调配与叠加,能够大大提升设计画面的视觉效果,另外还可以降低长时间的观察给人们带来的视觉疲劳的可能性。如果在设计画面中添加部分带有沉静感的色彩元素,就能够让人的心理变得比较愉悦进而让别人更好接受作品的设计目的,而且各种不同的情感都可以根据不同的色彩进行表达。
3.2色彩语言在计算机平面设计应用中加强效果探讨
通过上文中的相关论述和分析,知道了色彩语言在计算机平面设计中的重要位置,不但是更高层次的展示产品实用性与美观性的关键,而且能够实现消费者情感共鸣的效果,为了提升其在计算机平面实际上的适用范围,我们需要探讨其在计算机平面设计应用中的加强效果。根据不同色彩语言能够通过平面设计作品给人们带来不同视觉体验及情感表达效果的差异性作用,就能够更多掌握色彩语言的灵活性,实现更强的设计效果。为了更巧妙的挖掘出色彩语言在计算机平面设计中的作用,还可以从色彩语言的基础表达和它的含义特征着手,以此来不断提升其在产品设计理念和思路方面的能力,更加直接的给消费者展示商品的基本性能。首先能够通过对设计图最简单的色调调和与选择开始,进而体现商品的冷暖感觉,比较的直接的将商品的实际特征表达给消费者;其次,利用色彩的收缩效果和膨胀效果两个方面的搭配与变化应用于平面设计之中,实现设计画面视觉效果的整体提升,避免短时间内甚至长时间带来的视觉疲劳;再次,就是将沉静感的色彩当作重点,利用能够引起人们心里变化的色彩展示出不一样的表达效果,那么就可以将情感表达的复杂度和深刻度扩大,实现不同的设计体验。因此,色彩语言能够给计算机平面设计带来无限的视觉遐想。
四、总结
本文首先探讨了色彩语言与计算机平面设计两者间的关系,论述了色彩语言在计算机平面设计应用中的重要性,又通过视觉感觉得出了色彩语言能够为平面设计增加情感特征的结论,分析了色彩语言在计算机平面设计应用方面的策略,希望为计算机平面设计在产品设计的表达上呈现出其最初的价值,即实现产品销售的经济意义。
作者:温金辉单位:港口理工学校
参考文献:
计算机的发展及应用,使人们的生活日新月异。计算机辅助设计源于计算机图形技术的产生,计算机辅助设计的研究构想发端于1950年,但使用计算机绘图的最早记录是在1963年,美国麻省理工学院的研究人员伊凡·苏泽兰在美国计算机联合会会议上发表了名为《画板》的博士论文,从而开始了计算机辅助设计的发展历程。他从1950年开始着手开发通过图形技术来处理人与电脑交互对话的操作系统。1963年,这套以电脑主机、显示屏、光电笔和键盘为工具的图形画线系统得到实现。这套图形画线系统开发和引进了许多计算机绘图的基本思想和技术,使用户可以运用电脑画出直线、复杂曲线以及简单的标准部件。
最初CAD被解释为“计算机辅助绘图”,由于当时计算机在设计上的作用是替代传统手工绘图的一种新工具,但随着后来信息技术的飞速发展,计算机技术在各领域的广泛应用,CAD的含义也在不断变化扩展,随着20世纪70年代像素的产生、80年代三维曲面造型系统的开发等,使电脑绘图从只能用“线”这一基本绘制元素发展到可以用点、面、体进行绘制计算机图形,从而使CAD的含义也发展成现在人们比较熟知的计算机辅助设计这个概念了。1970年的威尼斯双年展首次接纳了计算机绘画作品,这也标志着新的视觉艺术形式的诞生得到了社会的承认。
我国的计算机辅助设计起源于20世纪70年代。与国外计算机辅助设计发展的轨迹相似,国内计算机辅助设计的研究与应用基本上是从各高等院校发展起来的。20世纪90年代初,随着我国现代化进程的迅速发展以及计算机的进一步普及,在环境艺术设计和创作领域,计算机技术应用的价值,逐渐得到人们的重视。
二、我国计算机辅助环境艺术设计的现状
计算机作为信息时代重要的技术工具,在环境艺术设计领域得到普遍应用。在20世纪90年代前,国内对环境艺术设计效果的表现是使用手工绘制的方法,到了20世纪90年代初期,计算机辅助设计技术开始在我国建筑业应用。计算机辅助设计技术在建筑设计表现领域以不可逆转的潮流迅速发展。尤其是到了20世纪末,计算机辅助设计逐渐成为建筑效果表现的主流。起初,设计师主要运用AutoCAD软件进行施工图的绘制,在方案阶段还以手绘为主。但随着相关专业软硬件的更新和进步,它自身的强大优势得以显示,同时对传统手绘表现产生了越来越大的冲击。
随着近十几年来我国计算机辅助环境艺术设计的发展,计算机建筑效果表现的类型己经有了很细致的划分,可以分为:计算机建筑效果图、计算机建筑漫游动画和计算机建筑效果虚拟现实。计算机建筑效果图主要是通过3DSMAX,Lightscape,Photoshop等计算机软件制作的静态的效果图。通过计算机三维软件从平面、立面数据中得到透视图,透视点位置及视点角度均可变换,然后再渲染出二维图像,这种方式是目前社会上应用最广泛的。计算机漫游动画是利用3DSMAX软件的三维动画功能,在建筑物的室内或室外的设计阶段就能以可视的、动态的方式全方位展示建筑物所处的地理环境、建筑物外貌和各种附属设施以及建筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。
三、计算机辅助环境艺术设计的发展趋势
当前,随着计算机软硬件技术的迅猛发展,计算机辅助设计在环境艺术设计领域受到了广泛的重视和应用,比如各种方案的汇报、投标以及招商广告中随处可见,从而出现了大量的绘图软件的教程以及在教学上更加重视计算机绘图软件的教学课程。人们更多的关注计算机技术,想方设法掌握各种绘图软件,在模型、材质、灯光以及各种渲染技法上花费大量的时间,而忽略了最终的效果图的艺术性。计算机辅助设计是科学与艺术以及计算机与艺术设计相结合的边缘学科。计算机辅助设计在视觉艺术创造规律、形式法则和审美方法与传统的艺术设计是相同的。所谓视觉艺术,是通过人的视觉感受而将客观内容纳入主观心灵并予以对象化呈现的艺术形态。一些美学研究者认为,从审美主体的角度来看,艺术离不开创造者和欣赏者两个方面,而这两个方面都要通过一定的感官和相应的感性物质媒介,前者创造出审美对象,后者达到审美愉悦。所以说,作为视觉艺术的计算机辅助设计作品既要真实的描绘场景,又要使欣赏者达到审美偷悦。不可否认,人们的欣赏水平在不断提高,求新、求异的视觉口味也越来越高。这源于技术的发展、审美的进步,计算机技术的发展对于社会和艺术创造产生了重大的推动作用。
在计算机辅助环境艺术设计发展的初级阶段,设计师的目标是使效果图具有真实感,能够模拟未来场景的真实效果,具有一定的实用性。目前的计算机建筑效果图的风格单一,已经不能满足大众的不断提高的视觉口味。计算机建筑效果图既是表现的技术同时它又是视觉艺术。设计师创造出审美对象,筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。使用的软件有Creator系列三维建模工具及Vega场景管理软件。计算机建筑效果虚拟现实技术强调的是一种身临其境的感觉,采用的是人与人之间自然的交互方式。它可以实现逼真的、纯三维的场景,可以全方位、多角度、完全由用户自由控制在场景中漫游。作为建筑师可以从多个角度观察建筑方案,所以说虚拟现实技术不仅可以使用于建筑表现,而且也是一种推敲方案的有利手段。VR技术在我国的环境艺术设计领域中有着广泛的应用前景,将给环境艺术设计带来革命性的改变。
设计师创造出审美对象,要使欣赏者达到审美愉悦而不是审美疲劳。为此,根据目前我国计算机辅助环境艺术的发展情况,未来计算机建筑效果图应呈现艺术化、人情化和多样化趋势。
参考文献:
[1]邓庆尧.环境艺术设计[M].济南:山东美术出版社.
[2]张绮曼.中央工艺美术学院环境艺术设计系—室内设计的风格样式与流派[M].北京:中国建筑工业出版社.
[3]张绮受.中央工艺美术学院一环境艺术设计与理论[M].北京:中国建筑工业出版社.
[4]李小艺.环境艺术设计的新视界阅.北京:中国人民大学出版社.
[5]李砚祖.环境艺术设计.北京:中国人民大学出版社.
那么,“人工智能”是什么意思呢?解释起来其实很简单。“人工”,顾名思义是指人造的、人为的,也就是我们人类动手创造或者改编出来的;“智能”就涉及到意识、自我、思维等多个概念了。总的来说,人工智能是一门关于模拟、拓展人的智能的学科,使机器能够胜任一些通常需要人类才能完成的复杂工作。举一个简单的例子,一个人要判断一张图片上的动物是猫还是狗,一下子就能做到;判断100张,可能需要好几分钟;判断10000张,就会非常伤脑筋了。而对具有人工智能的机器人来说,只要建立正确的模型,计算机就可以在一秒钟内判断几百万张图片的内容,而且不会有任何差错。
随着互联网的迅猛发展,我们能够在网上(如新浪微博、QQ空间)看到越来越多的媒体数据(文本、图像、视频等)融合在一起,“跨媒体”成为表达主题或事件的一种新形式。比如一部刚要上映的电影,在网上不仅有它的评论,还能看到它的宣传海报和预告片,包括文字、图片、视频等各种媒体数据都有。这种多种媒体数据的结合,就是我们说的“跨媒体”。正因为“跨媒体”的运用,制作团队能够更好地表达电影的主题,也能够让更多的人了解电影。
不断涌现的媒体数据也催生了“数据驱动”这一计算模式。根据这种计算模式,我们在处理信息时可以获取不同类型的数据。比如,我们常常看新闻报道,新闻报道中既有文字描述,又有与这些文字相对应的图片,而“数据驱动”就可以通过新闻报道这一资源获取文字和图片两种不同类型的数据。视频也一样,因为视频中既包括视觉图像信息,又包含语音听觉信息等数据。
实际上,英国心理学家麦格克(McGurk)等人在1976年就已经证明:人类对外界信息的认知是通过整合不同感官信息而形成的整体性理解,任何感官信息的缺乏或不准确将导致大脑对外界信息的理解产生偏差。这个现象也被称为“麦格克效应(McGurkEffect)”。就像“眼观六路,耳听八方”是人类与生俱来的能力,我们要把听到的东西和看到的东西结合在一起,才能更好地理解、判断事物。
现在,计算机的专家们正努力让计算机拥有“看图说话”的能力。比如,看到一幅“猫追蝴蝶玩”的图像,要求计算机也能像人一样,给出“猫追蝴蝶玩”这样的描述。要让人用一段话来表达一张图片或者一部电影的内容是很容易的,但如果你想让计算机干同样的事,那就有点困难了。至少我们手上的台式机或笔记本电脑是干不了的,就算给它配上摄像头之类的各种外部设备,它也干不了。在这个过程中,计算机得将一种类型数据转换为另一种类型数据,例如图像转换为文本,这就是跨媒体。可见,跨媒体对智能的要求是很高的。
其实,我们人类学会看图说话也不是那么容易的,也需要一定的时间,所以让计算机学会“看图说话”更不可能是一蹴而就的事情。为了实现计算机自动识图,计算机专家们正在想办法让计算机学会对图像作简单的文字表达,也就是说,先让计算机掌握图像中的视觉对象(如“猫”和“蝴蝶”等视觉对象)与自然语言中的文本单词(如“猫”和“蝴蝶”等词汇)之间的对应关系。看到图片时,计算机先将“认识”的视觉对象(“猫”和“蝴蝶”)一个个“抠”出来,然后通过已经掌握的“视觉对象――文本单词”之间的关联,按图索骥,寻找哪些文本单词与这些视觉对象最匹配,最后再用一定的语法规则将单词组合起来,得到描述图片的句子(“猫追着蝴蝶玩耍”)。只有这样,计算机才算完成了“看图说话”的任务,实现了从图像数据到文本数据的“跨媒体计算”。
可以设想,如果我们有一本汉英大词典,里面包含了足够多的相互配对的“英语单词――中文单词”,那么当给出一句英文后,我们就可以根据汉英大词典,将英文句子中每一个英文单词所对应的中文单词查找出来,然后再按照中文语法规则将这些中文单词组织起来,完成从英语句子到中文句子的翻译工作。同样,如果计算机掌握了良好的抠图技术,又存储了一本足够大、相互对照的“视觉对象――文本单词”词典,那么计算机就可以“看图说话”了!也就是说,当计算机能把越来越复杂的图像“抠”出来,并能用越来越完整、越来越准确的语句表达时(如“蓝天下,一只黑猫和一只白猫在草地上追逐一只花蝴蝶”),它才称得上有能力“看图说话”了。
关键词:机器视觉;系统组成;选型方法
中图分类号:TN949.199文献标识码:B
MachineVisionSystemDesignMethod
WANGYun-zhe,BAIYan-bing,ZHANGBo
(The2ndResearchInstituteofChinaElectronicsTechnologyGroupCorporation,TaiyuanShanxi,030024,China)
Abstract:Thearticleintroducestheconceptionandthedevelopmentalprocessofmachinevisionsystem,thecomponentandfundamentaltheoryofmachinevision,expatiatesonmainpointsofdesigningmachinevisionsystem,classifying,choosingtype,enumeratesthemostofmanufacturersinthefieldofmachinevisionsysteminchina.
Keywords:machinevision;systemcomponents;selectionmethod
引言
视觉是人类认知世界的重要手段,人类通过视觉感知外部世界信息,再通过大脑进行相应的判断,做出相应的动作。让机器像人一样也有视觉功能是人类长久以来的梦想,随着计算机、人工智能、光学、电子、控制技术的发展,特别是CCD、DSP、图像处理、模式识别、计算机视觉技术的飞速进步,一门新兴的技术――机器视觉(MachineVision),正在将这一梦想变为现实。
1机器视觉系统概述
1.1机器视觉的发展历程
机器视觉技术出现于20世纪中期,最初用于对二维图像的分析和识别,如光学字符识别、工件表面检测、航片解读、显微图像判读等,基本上属于图像处理和识别的范畴。20世纪70年代,一些机器视觉应用系统陆续出现,70年代中期,麻省理工学院(MIT)人工智能(AI)实验室正式开设“机器视觉”课程,由国际著名学者B.K.P.Horn教授讲授。同时,MITAI实验室吸引了国际上许多知名学者参与机器视觉的理论、算法、系统设计的研究,DavidMarr教授就是其中的一位,他于1973年应邀在MITAI实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界”分析方法的计算视觉理论(computationalvision),该理论在80年代成为机器视觉研究领域中一个十分重要的理论框架。到了80年代中期,机器视觉获得了蓬勃发展,新概念、新方法、新理论不断涌现,比如,基于感知特征群的物体识别理论框架、主动视觉理论框架、视觉集成理论框架等。同时,计算机、电子技术、CCD、DSP、光学、机械等硬件技术的进步也是日新月异,从光源、相机、图像采集卡到计算机和嵌入式系统,几乎每一个机器视觉系统的有关环节都出现了性能的大幅提升甚至质的飞跃。更高分辨率的图像、更快的处理器、更好的光源,同时还伴随着成本的降低和体积的减小,这一切为机器视觉的发展准备了坚实的硬件平台。
1.2机器视觉系统的工作原理
在机器视觉系统中,首先是摄像机将图像传感器所接收到的光学图像,转化为计算机所能处理的电信号,传送给专用的图像处理系统,图像处理系统对这些信号进行各种运算来抽取目标的特征,如面积、长度、数量、位置等,最后,根据预设的容许度和其它条件输出结果,如尺寸、角度、偏移量、个数、合格/不合格、有/无等。视觉系统的输出并非图像视频信号,而是经过运算处理之后的检测结果(如尺寸数据),上位机(如PC和PLC)实时获得检测结果后,指挥运动系统或I/O系统执行相应的控制动作(如定位和分类等)。
2机器视觉系统设计
典型的机器视觉系统一般包括光源、光学镜头、智能相机、图像处理单元(或图像采集卡)、图像分析处理软件、监视器、通讯/输入输出单元等。
从视觉系统的运行环境分类,可分为PC-BASED系统和PLC-BASED系统。基于PC的PC-BASED系统利用了其开放性、高度的编程灵活性和良好的Windows界面,系统总体成本较低,一般需要的二次开发,用户可用它快速开发复杂高级的应用。但这种系统开发周期较长,设计人员需要有较强的软件开发能力。在基于PLC的系统中,视觉系统的作用更像是一个智能化的传感器,图像处理单元独立于系统,通过串行总线和I/O与PLC交换数据。系统硬件一般利用高速专用集成电路或嵌入式计算机进行图像处理,系统软件固化在图像处理器中,通过类似于游戏键盘的简单装置对显示在监视器中的菜单进行配置。基于PLC的系统体现了可靠性高、集成化、小型化、高速化的特点,使用简便,上手快,但与PC-BASED系统相比,成本较高。
视觉系统设计时首先要选择适合自己的运行环境,视觉组成的选择主要有下面几个步骤。
2.1工业摄像机的选择
摄像机是机器视觉系统中的一个关键组件,其最本质的功能就是将光信号转变成为有序的电信号。选择合适的摄像机也是机器视觉系统设计中的重要环节,摄像机不仅直接决定所采集到的图像分辨率、图像质量等,同时也与整个系统的运行模式直接相关。一般摄像机的选用应考虑以下几点:
(1)CCD分辨率:摄像机分辨率指的是水平分辨率,其单位为线对,即成像后可以分辨的黑白线对的数目。常用黑白摄像机的分辨率一般为380~600,彩色摄像机的分辨率为380~480,其数值越大成像越清晰。一般的监视场合,用400线左右的黑白摄像机就可以满足要求。有效像素区域的大小,即CCD芯片尺寸同样是一个重要的参数。一些常见面阵CCD芯片的尺寸通常都会以英寸表示,有1″、2/3″、1/2″、1/3″、1/4″等规格。
(2)曝光方式(Exposure)和快门速度(Shutter):对于线阵摄像机都是逐行曝光的方式,可以选择固定行频和外触发同步的采集方式,曝光时间可以与行周期一致,也可以设定一个固定的时间;面阵摄像机有帧曝光、场曝光和滚动行曝光等几种常见方式,数字摄像机一般都提供外触发采图的功能。摄像机的电子快门一般设置为自动电子快门方式,可根据环境的亮暗自动调节快门时间,得到清晰的图像。快门速度一般可到10μs,高速摄像机还可以更快。
(3)同步:用摄像机内同步信号发生电路产生的同步信号来完成操作,外同步使用一个外同步信号发生器,将同步信号送入摄像机的外同步输入端。
(4)信噪比:即信号电压与噪声电压的比值,CCD摄像机信噪比的典型值在45~55dB之间,当环境照度不足时,信噪比越高的摄像机图像就越清晰。
2.2工业镜头的选择
镜头的选用应考虑以下几点:
(1)镜头尺寸应等于或大于摄像机成像面尺寸。例如,1/3″摄像机可选1/3″~1″整个范围内的镜头,水平视角的大小都是一样的。但镜头尺寸比摄像机CCD靶面尺寸大时,将使图像视野比镜头视野小,即不能很好地利用镜头的视野。如果镜头尺寸比摄像机CCD靶面尺寸小,则会发生“隧道效应”,即图像有圆形的黑框,像在隧道里拍的一样。只是使用大于1/3″的镜头能够更多地利用成形,更精确了镜头中心光路,所以可提高图像质量和分辨率。
(2)选用合适的镜头焦距。焦距越大,监看距离越远,水平视角越小,监视范围越窄;焦距越小,监看距离越近,水平视角越大,监视范围越宽。镜头焦距可按照以下公式估算:
f=A×L/H
其中,f-镜头焦距;A-摄像机CCD垂向尺寸;L-被摄物体到镜头距离;H-被摄物体高度。
(3)考虑环境光线的变化,光线对图像的采集效果起着十分重要的作用。一般来说,对于光线变化不明显的环境,我们常选用手动光圈镜头,将光圈手调到一个比较理想的数值后就可不动了;如果光线变化较大,如室外24小时监看,应选用自动光圈,能够根据光线的明暗变化自动调节光圈值的大小,保证图像质量。但需注意的是,如果光线照度不均匀,特别是监视目标与背景光反差较大时,采用自动光圈镜头效果不理想。
(4)考虑最佳监看范围。因为镜头焦距和水平视角成反比,因此既想看得远,又想看得宽阔和清晰,这是无法同时实现的。每个焦距的镜头都只能在一定范围内达到最佳的监看效果,所以如果监看的距离较远且范围较大,最好是增加摄像机的数量,或采用电动变焦镜头配合云台安装。
(5)镜头接口与摄像机接口要一致。现在的摄像机和镜头通常都是CS型接口,CS型摄像机可以和CS型、C型镜头配接,但和C型镜头接配时,必须在镜头和摄像机之间加接配环,否则可能碰坏CCD成像面的保护玻璃,造成CCD摄像机的损坏。C型摄像机不能和CS型镜头配接。
2.3光源的选择
合适的光源是机器视觉系统成功的关键,是机器视觉系统设计的重要环节。光源具有为图像提供光源、放大特征以及缺陷、削弱混乱及背景的作用。
市面上存在的几种视觉光源:荧光灯、卤素灯+光纤导管、LED光源、特殊光源,如激光、紫外光等。几种光源的性能对比如表1所示。
从上面的比较可以看出,LED光源的稳定性和使用寿命均比荧光灯、卤素灯等要好,LED光源具有使用寿命长、响应时间短、形状自由、可自由选择颜色、制作方便、运行成本低的特点,因此得到了广泛的应用。从照明结构上可分为同轴光源、背光源、环形光源、线型光源、低角度环形光源等。
选择光源主要从检测内容是外观检查还是定位、尺寸测定,从被测物的状态、材质、颜色以及视野范围、动态还是静态,从客观条件如安装尺寸、工作距离、周围环境等几个方面加以考虑。
2.4图像采集卡的选择
机器视觉应用对图像采集卡的特性要求与多媒体、医疗及军事等应用有所不同。在机器视觉系统中,图像采集卡主要完成对模拟视频信号的数字化过程。视频信号经低通滤波、A/D转换后,转变为数字信号输出,同时通过图像处理软件对视觉图像进行处理,包括图像的增强、平滑、边缘锐化、分割、特征抽取、图像识别等,当某一事件发生时,系统应能够实时获取当时的图像,并进行分析、处理和识别。例如,当零件在传送带上进行传输时,当某一零件通过图像传感器时,机器视觉系统应实时获取它的图像,并由计算机中的算法判定其质量。在选择机器视觉系统中的图像采集卡时,需重点考虑以下几个因素:
(1)相机的需求:所选择的图像采集卡是否支持相机?是否提供了相机所需的即插即用接口?
(2)检验图像采集卡的数字量化能力,其噪声是否对测量结构构成了影响?
(3)所选择的图像采集卡是否具有以下能力:
触发能力
选通能力
帧复位能力
锁相(PLL)采集能力
相机时序输出能力
输入信号调节能力
CPU进行图像处理时执行何种命令?图像采集卡是否占用大量CPU时间?
5结论
中国的机器视觉市场处在一个迅速发展期,随着市场的发展,一些国内的公司和系统集成商将成为市场的引领者,更多的客户将依赖他们在视觉和其它自动化技术方面的综合能力来解决问题,另外,将有更多的国内公司自己或者联合外国公司开发具有自主知识产权的视觉产品。能够自由而且合理地选择自己需要的视觉组件并且快速构造自己的系统,必将在很大程度上节约成本,同时提高产品的质量控制以及生产效率。
参考文献
[1]贾云得.机器视觉[M].科学出版社,2000.
机器视觉系统是综合现代计算机、光学、电子技术的高科技系统。机器视觉技术通过计算机对系统摄取的图像进行处理,分析其中的信息,并做出相应的判断,进而发出对设备的控制指令。机器视觉系统的具体应用需求千差万别,视觉系统本身也可能有多种不同的形式,但都包括以下过程:
图像采集利用光源照射被观察的物体或环境,通过光学成像系统采集图像,通过相机和图像采集卡将光学图像转换为数字图像,这是机器视觉系统的前端和信息来源。
图像处理和分析计算机通过图像处理软件对图像进行处理,分析获取其中的有用信息。如PCB板的图像中是否存在线路断路、纺织品的图像中是否存在疵点、文档图像中存在哪些文字等。这是整个机器视觉系统的核心。
判断和控制图像处理获得的信息最终用于对对象(被测物体、环境)的判断,并形成对应的控制指令,发送给相应的机构。如摄取的零件图像中,计算零件的尺寸是否与标准一致,不一致则发出报警,做出标记或进行剔除。
在整个过程中,被测对象的信息反映为图像信息,进而经过分析,从中得到特征描述信息,最后根据获得的特征进行判断和动作。最典型的机器视觉系统一般包括:光源、光学成像系统、相机、图像采集卡、图像处理硬件平台、图像和视觉信息处理软件、通信模块(如附图所示)。
总体上,一个成功的机器视觉系统需要重点解决图像采集(包括光源、光学成像、数字图像获取与传输)、图像处理分析几个环节的关键技术。
照明设计
照明是机器视觉系统中极其重要而又容易为人忽视的环节。其设计是机器视觉系统设计的重要步骤,直接关系着系统的成败和性能。因为照明直接作用于系统的原始输入,对输入数据质量的好坏有直接的影响。光源决不仅仅是为了照亮物体,通过有效的光源设计可以令需要检测的特征突出,同时抑制不需要的干扰特征,给后端的图像处理带来极大的便利。而不恰当的照明方案会造成图像亮度不均匀,干扰增加,有效特征与背景难以区分,令图像处理变得极其困难,甚至成为不可能完成的任务。
照明设计主要包括三个方面:光源、目标和环境的光反射和传送特性、光源的结构。由于被测对象、环境和检测要求千差万别,因而不存在通用的机器视觉照明设备,需要针对每个具体的案例来设计照明的方案,要考虑物体和特征的光学特性、距离、背景,根据检测要求具体选择光的强度、颜色和光谱组成、均匀性、光源的形状、照射方式等。
照明设计是一项非常复杂的工作,不仅需要理论知识和分析能力,也常常需要反复的试验和调整。“光源是基准,打光是艺术”,这句话道出了照明设计在机器视觉系统中的重要地位。由此也催生了一批以生产光源著称的厂商,如CCS、Moritex、东冠科技。国内如凌云公司等系统集成商也开始开发自主的光源产品。
光学成像系统与相机
机器视觉系统中,镜头相当于人的眼睛,其主要作用是将目标的光学图像聚焦在图像传感器(相机)的光敏面阵上。视觉系统处理的所有图像信息均通过镜头得到,镜头的质量直接影响到视觉系统的整体性能。一旦信息在成像系统有严重损失,在后面的环节中试图恢复是非常困难的。合理选择镜头、设计成像光路是视觉系统的关键技术之一。
镜头成像或多或少会存在畸变。较大的畸变会给视觉系统带来很大困扰,在成像设计时应对此有详细的考虑,包括选用畸变小的镜头,有效视场只取畸变较小的中心视场等。镜头另一个特性是其光谱特性,主要受镜头镀膜的干涉特性和材料的吸收特性影响。要求尽量做到镜头最高分辨率的光线应与照明波长、CCD器件接受波长相匹配,并使光学镜头对该波长的光线透过率尽可能提高。在成像系统中选用适当的滤光片可以达到一些特殊的效果。另外,成像光路的设计还需要重视各种杂散光的影响。
相机是一个光电转换器件,它将光学成像系统所形成的光学图像转变成视频/数字电信号。相机通常由核心的光电转换器件、电路、输出/控制接口组成。目前最常用的光电转换器件为CCD,其特点是以电荷为信号,而不像其他器件输出电流或者电压信号。上世纪90年代,一种新的图像传感器开始兴起,这种相机称为CMOS(ComplementaryMetalOxideSemiconductor,互补金属氧化物半导体)相机。
对相机除了考察其光电转换器件外,还应考虑系统速度、检测的视野范围、系统所要达到的精度等因素。
相机输出的模拟视频信号并不能为计算机直接识别,图像采集卡通过对模拟视频信号的量化处理将模拟视频信号数字化,形成计算机能直接处理的数字图像,并提供与计算机的高速接口。图像采集卡需要实时完成高速、大数据量的图像数据采集,必须与相机协调工作,才能完成特定的任务。除A/D转换外,图像采集卡还具备其他一些功能,包括:
接收来自数字相机的高速数据流,并通过计算机高速总线传输至系统存储器;
对多通道图像接收、处理和重构;
对相机及系统其他模块进行功能控制。
图像和视觉信息处理
上述机器视觉系统的前端环节,包括光源、镜头、相机等,都是为图像和视觉信息处理模块准备素材。这一模块才是机器视觉系统的关键和核心,它通过对图像的处理、分析和识别实现对特定目标和特征的检测。这一模块包括机器视觉处理软件和处理硬件平台两个部分,其中视觉处理软件可以分为图像预处理和特征分析理解两个层次。图像预处理包括图像增强、数据编码、平滑、锐化、分割、去噪、恢复等过程,用于改善图像质量。图像特征分析理解是对目标图像进行检测和各种物理量的计算,以获得对目标图像的客观描述,主要包括图像分割、特征提取(几何形状、边界描述、纹理特性)等。
机器视觉中常用的算法包括:搜索、边缘(Edge)、Blob分析、卡尺工具(CaliperTool)、光学字符识别、色彩分析。
目前,机器视觉软件的竞争已经从追求功能转变为算法的准确性和效率的竞争。已有专门提供视觉软件或者开发包的厂商。因为常规的机器视觉软件开发包尽管均能提供上述功能,但其检测效果和运算效率却有很大差别。优秀的机器视觉软件可对图像中目标特征进行快速而准确的检测,对图像的适应性强;而不好的软件则存在速度慢、结果不准确、鲁棒性差的缺点。
从硬件平台的角度说,计算机在CPU和内存方面的改进给视觉系统提供了很好的支撑,多核CPU配合多线程的软件可以成倍提高速度。伴随DSP、FPGA技术的发展,嵌入式处理模块以其强大的数据处理能力、集成性、模块化和无需复杂操作系统支持等优点而得到越来越多的重视。
总体而言,机器视觉是一个光机电计算机高度综合的系统,其性能并不仅仅由某一个环节决定。每一个环节都很完美,也未必意味着最终性能的满意。系统分析和设计是机器视觉系统开发的难点和基础,也是许多开发商所不擅长的,急需加强。
另外,在现场环境应用中,振动、粉尘、电磁干扰会严重影响系统的工作,这些问题都是设计和开发时应注意的。
关键词:嵌入式系统;机器视觉;测控系统;图像跟踪
中图分类号:TP391.41文献标识码:A文章编号:1009-3044(2010)08-1987-02
1概述
随着科学技术的发展,更高速,更可靠,更低成本成为各种技术开发的要求。因此,设计能实现实时视觉图像采集、视觉图像处理控制,使其结构更紧凑,甚至完全不需要计算机的介入,提高处理速度,并能有效降低成本的专用机器视觉控制系统,使得该系统具有安装方便、配置灵活、便于携带等突出优点。为此,本课题提出了基于嵌入式机器视觉测控系统的研究,在嵌入式系统上实现实时视觉图像采集、视觉图像处理及控制,构成处理速度快,成本低,结构紧凑,不需要计算机介入的专用嵌入式机器视觉测控系统。
2系统总体设计
2.1设计方案
目前,用于图像采集处理系统的嵌入式核心器件一般有FPGA、DSP和ARM芯片,出于成本控制与测控系统性能要求的考虑,这里选用FPGA方案。
FPGA内嵌的NiosII软核处理器是32位的,主要包括CPU微处理器、I/O中断、计时器、UART串口及大量通用寄存器。选用FPGA方案的优点在于,在单个芯片上既可以完成图像采集等复杂逻辑的控制,又可以用内嵌的NiosII处理器完成对图像的处理和识别,电路设计简单,成本低。
对于机器视觉测控系统,在选用了嵌入式处理器实现图像采集的功能之后,需要将视频图像进行数字化处理,这里采用标准工业摄像机+视频图像数字化模块的方法实现。标准工业摄像机的输出信号一般是PAL制式或NTSC制式的模拟信号,信号在进行数字图像处理前必须经过刀D转换,即视频采集。视频采集是整个系统中的一个重要组成部分,它是对模拟视频信号实现数字图像处理的第一个步骤。该方案具有通用性好、成本低的优点。
2.2总体结构设计
1)硬件设计
硬件设计包括系统硬件电路的连接和FPGA内部逻辑电路的设计。
FPGA内部逻辑电路的设计是以QuartusII为开发环境,用VHDL语言编程实现图像采集、SRAM总线切换等模块的功能,用SOPCBuilder配置、产生NiosII软核处理器及必要的外设(用户自定义外设用VHDL编程实现),然后一起编译并下载到FPGA的配置芯片中,再由配置芯片完成对FPGA的上电配置,由此形成硬件逻辑电路的连接,实现图像采集、处理、存储、显示、实时控制等功能模块。
2)软件设计
用SOPCBuilder生成NiosII处理器系统的同时,也会生成相应的SDK软件开发包。在这个软件包的基础上,开发者可以利用NiosIIIDE,移植嵌入式实时操作系统μc/OS-II,编写C或者C++程序来完成对图像的二值化、区域分割、特征提取、模式识别等处理过程,最终实现对目标轨迹的跟踪,实时控制机器人沿规定轨迹运行。
3关键技术问题探讨
3.1图像采集CCD模块设计
图像信息的获取就是捕捉待处理目标的图像信息并将其转换成适合一体机处理的数字信号,这一过程主要包括图像捕获、光电转换及数字化等几个步骤。目前图像信息获取可以使用CCD、CMOS、CIS等传感器,其中以CCD的应用最为广泛。
本设计模块采用1/3寸逐行扫描型黑白面阵CCD图像传感器ICX424AL。ICX424AL有效光敏单元为659×494,灵敏度高、暗电流小,带有电子快门。由三相垂直脉冲(V1、V2、V3)和两相水平脉冲(H1、H2)驱动工作,水平驱动时钟频率为24.154MHz,驱动电压5V。曝光之后,每一列成像势阱中的电荷在脉冲的驱动作用下被移至势阱旁的垂直寄存器当中,然后垂直驱动脉冲发挥作用,每次脉冲驱动垂直寄存器组中的像素电荷向下移一行,而此时最下面一行的像素电荷则被移动到水平寄存器当中。之后水平驱动脉冲发挥作用,脉冲驱动水平寄存器中的像素的电荷向输出口移动。被移出像素电荷,经过放大器后形成电压信号输出。水平寄存器被移空后,剩余电荷再次向下移一行,在水平驱动脉冲作用下,水平寄存器的电荷再次被依次移出。上述过程一直重复直至所有像素电荷被移出。
ICX424AL的驱动时序由CCD信号处理器AD9929产生。AD9929有一个三线式串行接的串行通信接口,通过该接口可以对AD9929时序发生器的相位寄存器组进行操作,发送配置信息或读取AD9929的工作状态。AD9929可直接与CCD传感器相连接,CCD像素模拟电压信号在AD9929驱动脉冲的作用下,由CCD_IN引脚输入到AD9929中,经模拟前端采样、放大和A/D转换后,产生8位的数字信号由DOUT[0-11]引脚输出,这些数字信号即为CCD图像传感器捕捉到的待测目标的原始图像信息。
3.2图像实时跟踪算法设计
由CCD模块负责采集图像,那么嵌入式系统必须要有完善的图像跟踪算法,才能够实现智能机器人对目标的跟踪,传统的图像跟踪算法由于运算量较大而存在实时性较差的问题,因此,有必要对图像跟踪算法进行实时性优化设计。
目标图像跟踪是一个序列图像处理、识别和测量过程。在跟踪过程中,目标可能出现大小、形状、姿态等变化,加上实际环境中的各种干扰,以及图像处理最小计量单位的精度问题,相关跟踪得不到绝对最佳的匹配位置,存在测量误差。因此,为了保证跟踪的稳定性,需要对图像跟踪模板进行自适应更新。图像跟踪模板的更新是目标跟踪中要解决的重要问题之一,图像跟踪模板更新过快或过慢,都有可能丢失所跟踪的目标。判断图像跟踪模板是否需要更新要根据相关的置信度信号,如果相关匹配的置信度高,就可以根据本帧图像的匹配点处的坐标来更新图像跟踪模板;如果置信度低,则说明匹配不稳定,要沿用以前的匹配图像跟踪模板对下一帧进行相关匹配。
相关置信度信号是在分析相关匹配算法的基础上设计出来的,它是一个非常重要的参数。经过分析可知:若匹配点处的峰值很大,且峰值与其它非匹配点的均值之差越大,则表明跟踪越可靠。定义帧内相关置信度为:
式中:C0是帧内相关置信度;maxR是当前帧匹配点处的误差累加次数;R是同一帧内M个依次比maxR小的误差累加次数的均值,如果maxR和R相差越大,则说明该匹配点越可靠。本算法可根据计算速度的需要对M取值,一般可以取M等于20~100的任何值。若C0大于阈值T0,则认为相关匹配值maxR符合帧内置信度,更新图像跟踪模板;否则,相关匹配不可靠,不更新图像跟踪模板。阈值T0根据图像的质量和经验来确定,这里我们取T0=0.6。
实践证明,在序列图像跟踪过程中,若单纯地利用当前图像的最佳匹配位置处的图像跟踪模板作为依据进行下一帧图像的匹配,则跟踪结果很容易受某一帧发生突变的图像的影响而偏离正确位置。因此,本系统采用基于置信度的加权自适应模板修正算法:如果当前帧匹配质量很差,则该帧图像数据不进行修正;而若当前帧匹配质量很好,则该帧图像数据进行修正,加权修正算法表示如下式:
上式中,T(i,j,t)为当前帧使用的图像跟踪模板,O(i,j,t)为当前帧最佳匹配位置的子图像,T(i,j,t+1)为预测得到的下一帧图像坐标,α为加权系数(0≤α≤1),该系数的大小根据帧内相关置信度C0,按照下式计算:
4结束语
本文在嵌入式系统与机器视觉控制系统的交叉点展开研究,目的是将具有重要意义的机器视觉控制系统应用到具有广泛基础的嵌入式系统平台上,拓展机器视觉的应用范围。通过对机器视觉控制系统及嵌入式系统设计方案的选择,并对基于嵌入式机器视觉控制系统的关键技术问题展开研究,以此为依据,设计了相应的硬件系统和软件系统,并将其应用到智能机器人视觉的控制上。
参考文献:
[1]王耀南,李树涛,毛建旭.计算机图像处理与识别技术[M].北京:高等教育出版社,2001.
[2]段峰,王耀南,雷晓峰.机器视觉技术及其应用综述[J].自动化博览,2002,19(3):59-61.
关键词:计算机辅助教学;视觉媒介;综合技能;教学形式
课题:2012年常州大学人文社会科学研究项目《非遗对高校艺术设计学科影响研究》(编号:2012QN01)
视觉传达设计是一门创意性、实践性较强的应用型学科,其教学具有自身的科学性和规律性,依据艺术设计教育的客观规律,着重培养学生的认知能力、思维能力、设计能力、创新能力、动手能力和应用能力,从而引发他们自觉尝试并完成对课程方案的‘无形’构建与‘有形’塑造。视觉传达设计是通过视觉媒介表现并传达信息的设计,是一门交叉学科。当前,高校纷纷加大对艺术类专业的投入,众多院校的视觉传达专业在课程设置上也是各有特色,但是有一点是相同的,即把计算机辅助课程归纳到教学计划之中的,且将其作为该专业的骨干课程。
一、视觉传达专业计算机辅助设计类课程的设置现状
在以往的视觉传达设计教育中,各院校把国内外的艺术院校的模式或是办学经验作为主要的参考对象,大多数的院校把建筑、设计、手工艺、绘画等归为一体,强调办学的综合性和专业性。艺术设计专业种类繁多,分为产品设计、平面设计、展示设计、陶艺设计、环艺设计、动画设计、多媒体设计、数码设计等。而根据目前市场的需要,我们应该把视觉传达设计划分为平面设计方向、动漫设计方向、影视媒体制作方向、广告策划设计方向四类课程体系,同时细化这四类课程体系,并开设有针对性的课程。
视觉传达设计是指利用视觉符号来传递各种信息的设计。总的来说,视觉传达专业计算机辅助设计类课程主要分为以下几类:平面设计软件类(Photoshop、Coreldraw、Illustrator、Indesign)、二维动画软件类(Flash)以及影视后期制作软件类课程(Aftereffect、Premire)。Photoshop作为一款图像处理和绘图软件成为该专业学生必须掌握的工具,其强大的功能几乎渗透到了视觉类专业的所有科目。Coreldraw、Illustrator软件作为视觉传达专业学生必须掌握的矢量软件,在制作插图、标志、书籍装帧、版式设计、VI设计、包装设计等主干课程中发挥着不可忽视的作用。二者作为基础性软件,容易学习和上手,是学生学习的入门软件。Flash软件可以用于二维动画的创作。Aftereffect是目前世界上应用最广泛的视频合成软件之一,广泛用于数字电视和视频的后期制作,在PC系统上可以完成较好的合成效果。
二、视觉传达专业计算机辅助设计类课程的设置原则
教学内容陈旧,更新不及时,会导致学生毕业后不适应市场的需要。因此,我们应顺应视觉文化时代的需求,将视觉传达专业教学与科学技术结合起来,提高对新媒体这个艺术设计载体的认识,把握静态知识和动态发展之间的联系。随着视觉文化时代的到来,视觉传达领域专业知识的更新,从前被前人奉为真理的理论和观点正在被颠覆,而教学内容只能针对过去或正在发生的事情,它是受到时效限制的。因此,设计专业要在不断地组织和再组织的过程中形成开放的计算机辅助设计类课程体系,打开学生的视野,让学生随时可以掌握目前最先进的设计技术和表达手法。
高校艺术教育以市场需要为导向,着重培养学生的动手能力。因此,计算机辅助课程相对于其他课程来说,实践课时较多,这样才能强化学生运用软件的能力。计算机辅助设计类课程要求学生利用日益增多的各类设计素材库,对图像进行处理,变化出更为丰富的视觉语言。如今软件升级换代十分迅速,这就要求学生及教师要不断地更新知识,学会质疑和尝试,触类旁通地去学习和寻找不同的操作方法。
三、视觉传达专业计算机辅助设计类课程的教学方法
(一)案例式教学法
案例式教学法指教师通过讲解具体软件的功能、界面、菜单、面板以及工具的基本使用方法,来让学生对计算机辅助设计软件有一个大致的了解,进而提升学生的软件运用能力。学生除了要在课堂上消化和吸收教学案例以外,还要学会举一反三,并开展大量的课外钻研。
(二)项目式教学法
项目式教学法是指在实践教学活动中教师对指导学生切实完成一个完整的“项目”的培训方法。在教学实践中,拿实际项目里的课题作为教学内容,能为学生日后进入工作岗位积累丰富的实践经验,这对学生设计实践能力的提高也有很大的帮助。
四、视觉传达专业计算机辅助教学存在的误区
在教学方面,有的教师侧重于工具的教授,并辅以大量的图例。有的教师则完全把软件课变成单独的软件培训班的模式,一味地进行填鸭式教学,而不去培养学生的创新能力。这样只会使学生的软件学习能力停留在很低的层次。
在学习方面,学生不愿意去探讨原理和基础工具的运用,只是默默地跟着范例走。另外,有些学生不善于做笔记,不勤加练习,今天会明天忘,并没有充分意识到软件的学习过程也是个需要潜心修炼的过程。
五、改进视觉传达专业计算机辅助教学的策略
(一)有针对性地设置课程
学校在开展计算机辅助设计类课程的初期,可以尝试着要求学生对常规软件(例如Photoshop、Coreldraw、Illustrator等)达到创新运用的程度。而对于其他的软件,学生可以根据自身的学习情况和接受能力进行多样性的选修。同时,学校也可以加大对三类基础软件的课时投入,以巩固学生的学习成果。
(二)教学与实践相结合
学校要与相关单位紧密协作,定期组织学生到单位参观实习。此外,学校还要鼓励学生积极参与国内外的各项比赛,以赛代练。
(三)加强师资培训,提高教师业务水平
教师在完成繁重的教学、科研任务的同时还需要不断地提高业务水平。教师的业务水平很大程度上决定了学生学习效果的好坏,对学生的影响是深远的。因此,学校应加强对视觉传达专业教师的业务培训,从而为计算机辅助教学提供强有力的师资保障。
综上所述,高校计算机辅助教学,必须要根据学校自身的特点,结合师资力量和学生的实际情况来开展。此外还要突出专业特色,利用多重手段和多重资源来促进学生的专业学习,从而切实提高计算机辅助教学的水平。
参考文献:
关键词:三目摄像机;标定;立体视觉;外部参数
一、绪论
1.1研究的背景及意义
计算机视觉是当今极为重要的学科之一,它在具有很强的挑战性的同时又拥有广泛的应用前景和实用价值。计算机视觉以视觉理论为中心,以图像处理、模式识别、计算机技术和生理学、心理学为基础,研究内容主要有两个方面:一是开发从输入图像数据自动构造场景描述的图像处理系统;二是理解人类视觉机理,用机器代替人去做人类难以达到或根本无法达到的工作[1]。
计算机视觉应用的广泛性体现在其不仅用于文字、指纹、面部、商标以及图像数据库、检测集成电路芯片、多媒体技术这些图像方面,还应用到机器人导航、工业检测和产品的自动装配、CT图像器官重建和遥感照片解释等空间物体的定位、识别以及重建上。现如今,计算机视觉已经应用到机器人、地理、医学、物理、化学、天文等各大的研究领域。
作为多个学科交叉与融合中心的计算机视觉,摄像机是其研究的重要工具,而摄像机标定又是计算机视觉研究的一个关键问题,故摄像机的标定越来越受到广泛的重视。摄像机标定是通过物体空间上的点与图像中的对应点的几何关系,来确定摄像机的内外参数的过程。标定结果是否准确影响着三维测量的精度和三维重建的结果,而且实时的标定更能满足自动导航机器视觉的需要[2]。
伴随着应用的发展,摄像机广泛地被应用于三维立体的测量、视觉检测、运动检测等领域。由此,对摄像机标定的精度要求也日益增加。摄像机标定结果的优劣影响了计算机视觉在各领域的应用。摄像机标定的准确与否,对能否提高计算机视觉在各领域测量的准确度有重要影响[3]。因此,研究摄像机标定方法具有重要的理论研究意义和实际应用价值。
1.2摄像机标定技术研究的发展及现状
摄像机有一个图像平面和提供三维空间到图像平面转换的镜头。由于镜头会产生畸变,不能把这个转化过程简单描述为投射变换。所以它表示的是畸变的模型,这些模型近似于真实数据,而其精确性则依靠于建立的模型及模型参数的准确性。
首先进行摄像机标定工作的是加拿大的Deville,他于1910年建立实验室,使用多个瞄准仪对他的“测量摄像机”(surveyingcamera)进行标定[4]。上个世纪三十年代后期,美国标准局发明了一种精确镜头,用来检测摄像机,同时将它用在摄像机标定上。四十年代后期,该项工作得到进一步加深,有了更多对高精度的需求和对易操作设备的需求。1955年,Carman出版了《棋盘平面度的干涉测量和控制》,该书引起了社会各界对摄像机标定的关注。二战时期,随着飞机的大规模使用,航空摄影与制图兴起,为得到更加精确的测量结果,对摄像机镜头的校正要求也变得更高。五十到七十年代也是镜头校正技术发展最为迅速的时间段。在这期间,各种镜头像差的表达式逐步被提出并且得到普遍认同与采用,建立了很多的镜头像差的模型,D.C.Brown等人作出了比较大的贡献,他们导出了近焦距情况下给定位置处径向畸变表达式并证明了近焦距情况下测量出镜头两个位置的径向畸变就可以求出任何位置的径向畸变[5]。这些径向与切向像差表达式成为后来各摄像机的标定非线性模型的基础。这段时间里,研究的重点是如何校正镜头与用何种方法补偿镜头像差,这些研究对促进各性能镜头组的研制起到了重要作用。在1999年,张正友提出了一种简便的摄像机标定方法,该方法介于传统标定和自标定之间,操作方便灵活,能够得到不错的精度,满足了众多拥有桌面视觉系统的用户在摄像机标定方面的需求。
1.3本文的主要研究内容
本文的主要研究多个摄像机的标定问题。标定主要是对摄像机内外参的测量计算,利用这些参数对多个摄像机识别的物体尺寸进行衡量并建立起多摄像机系统的数字环境。
论文的内容包括:
第一章为绪论,介绍摄像机标定相关的研究背景、国内外研究现状。
第二章为摄像机标定理论基础:主要介绍标定的坐标系与待标定的参数。
第三章提出本文的多摄像机标定方法与实验过程。
第四章进行全文的总结。
二、摄像机标定方法研究
2.1摄像机标定原理
摄像机通过透镜将三维物体投影到--维图像平面上,这个成像变换的过程称为摄像机成像模型。摄像机成像模型有多种,最常用的为小孔成像模型。由于实际的摄像机镜头会发生一定的畸变,使得空间点所成的像不在线性模型描述的位置而会发生一定的偏移,为了能准确的标定摄像机参数,标定的过程中要考虑非线性畸变因子。
一般来说,得到标定结果后要对其精度进行评估,然而很难得到准确的摄像机标定参数真值作为参考,其中基于图像坐标和世界坐标的绝对和相对误差的评价方法应用广泛,本文将对这些方法的原理进行探讨。
2.2摄像机标定坐标系建立
首先定义了四个坐标系,如图1所示,图像坐标系的坐标原点为O0,列与行由坐标轴u和v表示;成像平面坐标系的原点是摄像机光轴与图像坐标系的交点0l,x、y轴分别与u、v轴平行;在摄像机坐标系中,坐标原点0c即为在摄像机的光心,Xc、Yc轴与x、y轴平行,与图像平面垂直是摄像机光轴作为Zc轴,0c0l为摄像机焦距f;世界坐标系是假想的参考坐标系,可固定于场景中某物体上,用于描述摄像机的位置,由Xw,Yw,Zw轴组成。
图(1)
2.3摄像机外部参数构成
主动视觉传感器从在笛卡尔直角坐标系中的运动表现为相应的旋转矩阵和平移矩阵,故摄像机外部参数表现为旋转矩阵R和平移矩阵T,则摄像机坐标系与世界坐标系的转化关系可以表示成:
上式中(Xc,Yc,Zc)表示空间点在摄像机坐标系下的坐标,(Xw,Yw,Zw)表示空间点在世界坐标系下的坐标。根据靶标点在像空间坐标系和物方空间坐标系中的坐标,通过分解旋转矩阵线性计算像空间坐标系与物方空间坐标之间的转换参数,即外方位元素(摄站参数)[6]。
2.4各摄像机相对位置确定
三目摄像机拥有三个视觉传感器,而三个传感器之间的相对位置可通过已获得的外部参数进行确定。将三个摄像机坐标系设置为,Ocixciycizci(i=1,2,3),由2.3中所介绍的内容可知,这三个摄像机坐标系与世界坐标系的关系为:
i=(1,2,3)
由此我们可以得到任意两个摄像机i,j的坐标系转换关系:
其中:==i,j=1,2,3
三、摄像机标定实验过程及结果
3.1实验系统介绍
实验中被用来标定的是一个多摄像机系统,摄像机标定有关的基本参数、系统组成和开发环境如下:
(1)硬件环境
标定板、三目摄像机和图像采集卡等。
(2)软件环境
OpenCV开源视觉库,它仅由一系列C函数和少量C++类构成,为Python、MATLAB等语言提供了接口,在图像处理和计算机视觉方面实现了很多通用算法。
3.2实验过程
本系统以棋盘格模板作为标定模板。采用激光打印机打印棋盘格黑白方块间隔纸,方块边长为3cm,共6行9列,将打印纸固定在一块平板上,作为标定模板,如图(2)。安装三目摄像机系统,调节固定好个摄像机位置,如图(3)。手持标定板在三目摄像机前方各个位置拍摄5组共15张各姿态的照片,利用Canny算子进行像点灰度中心提取、同名像点匹配并解算出三个摄像机在标定板坐标系中的外部参数值。
3.3标定结果
摄像机1:
R=T=
摄像机2:
R=T=
摄像机3:
R=T=
四、总结
随着计算机技术的高速发展,计算机视觉成为当今热门的研究课题,受到了广泛关注。本文就如何在机器视觉的理论基础上对三目视觉系统进行标定进行了研究,讨论了计算机视觉理论知识,分析摄像机标定原理以及标定坐标系的建立。同时通过计算机视觉知识的分析讨论了基于三目视觉系统的摄像机标定技术,完成了三目视觉系统的外部参数标定实验。三目摄像机测量系统外部参数的标定能够解决测量作业现场、测量控制场建立难的问题,为快速地建立简单实用的控制场提供了方案,有一定的实用价值。
参考文献
[1]荆丽秋.双目视觉系统标定与匹配的研究与实现[D].哈尔滨工程大学,2009.DOI:10.7666/d.y1489086.
[2]马颂德.计算机视觉―计算理论与算法基础[M].北京:科学出版社,1998.
[3]王荣一.摄像机标定及关键技术研究[D].哈尔滨理工大学,2011.DOI:10.7666/d.y2012483.
[4]ClarkeTA,FryerJG.Thedevelopmentofcameracalibrationmethodsandmodels.PhotogrammetricRecord,1998,16(91):51-66
[5]BrownDC.Decenteringdistortionoflenses.PhotogrammetricEngineering,1966,32(3):444-462.
[6]范亚兵,黄桂平,高宝华等.三目立体工业摄影测量系统外部参数的快速标定[J].测绘工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949.2012.05.013
关键词:ICA-HMAX模型;视觉相似度;卷积核;语义相似度
中图分类号:TP317文献标识码:A文章编号:1009-3044(2016)08-0177-05
Abstract:Thispaperfirstlyintroducesamulti-levelconvolutionalICA-HMAXmodel;thenproposevisualizationmethodsoftheconvolutionkernelconvolutionkerneltoachievedifferentlevelsofunderstanding.ProposedusingS3layerfeatureoftheICA-HMAXmodeltoachievevisualsimilaritycalculationofdifferentcategories.ByimplementingdifferentcategoriesofvisualsimilaritybetweencalculatedonCaltech101datasets,andcomparedwiththesemanticsimilaritybetweencategoriesandfurtherexploretherelationshipbetweensemanticsimilarityandvisualsimilaritybetween.
Keywords:ICA-HMAXmodel;visualsimilarity;kernelconvolutionkernel;semanticsimilarity
1概述
21世纪以来,数字成像技术和存储技术得到了空前的发展;使得每天有数量巨大的数字图像进入人们的生活,成为人类生活、工作、娱乐中的组成部分。另一方面,互联网技术的发展给图像的迅速传播提供了有利的条件。此外,图像是视觉信息的重要来源之一,蕴含丰富的语义信息。图像理解是人工智能领域中的一个新的方向,其核心问题是研究如何使计算机能够像人脑一样有效正确理解图像中所表达的高层语义信息。
仿生多层模型在计算机视觉和人工智能邻域取得了显著的成果。20世纪末,Poggio和Riesenhuber根据IT皮层的生理学数据提出了标准HMAX模型[1],该模型模拟视皮层中腹侧通路中简单细胞(SimpleCell)和复杂细胞(ComplexCell)的交替处理的功能,实现多层次特征提取。在此基础上,Serre等人提出一种具有随着层次的增加复杂度和不变性逐渐增强的图像特征表达[2],并将其应用到真实场景的目标识别中,其识别性能明显优于传统的特征表达(如SIFT特征[3]);Hu等人根据大脑神经元响应的稀疏特性进一步扩展HMAX模型,提出了Sparse-HMAX模型[4],在分类性能上远远优于HMAX模型,同时较好模拟和解释神经元对视觉信号的稀疏响应。
本文内容章节安排如下:第2节首先简要描述了本文的ICA-HMAX模型;然后介绍卷积核的可视化方法;第3节介绍基于WordNet的语义相似度计算和基于ICA-HMAX的视觉相似度计算方法。第4节实验结果和分析。第5节总结与展望。
2ICA-HMAX模型与卷积核可视化
2.1ICA-HMAX模型简介
前馈ICA-HMAX模型由五层构成如图1所示。自底向上依次为S1C1S2C2S3五层,其中S1层卷积核(W1、V1)由独立成分析(IndependentComponentAnalysis,ICA)方法从彩色图像的数据块中学习获得,为了使得C1层具有局部空间平移不变性,在S1层的每个二维平面响应图上进行局部最大值汇聚(maxpooling)操作;同理,S2层卷积核(W2、V2)也是采用ICA方法从C1层采样块中学习获得;同样,为了使得C2层也具有局部空间平移不变性,在S2层的每个二维平面响应图上进行最大值汇聚(maxpooling)操作;同理可以获得S3层的卷积核(W3、V3)以及S3层的特征表达。值得注意的是该前馈模型的卷积核均为单尺度。
2.2卷积核的可视化
若要实现对多层模型ICA-HMAX的深入的了解,需要知道不同层次的卷积核编码的图像信息。由于S1层特征卷积核是在彩色图像的原始像素层上学习,可以在像素空间上直接观察S1层卷积核编码的图像信息。而S2、S3层的卷积核是在图像C1、C2层的响应图上经过ICA学习获得高维数据,因此不能直接观察其卷积核编码的图像信息。为了观察S2、S3层的卷积核所编码的图像信息,当给定一个某个类别的卷积核的条件下,本文提出在该类别的图像上找出使得该卷积核的刺激最大的前50个感受野区域,并将这些区域与其刺激的响应值进行加权求和,然后取平均;所得结果具有表示S2、S3层卷积核所编码的图像信息从而作为S2、S3层的卷积核可视化。
3相似度计算
3.1基于WordNet的语义相似度计算
WordNet是由普林斯顿大学心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。一般来讲,国内外的研究学者将经典的基于语义的相似度的计算方法分为三个类型[6,7]:基于距离的相似度计算(PathCountingMeasures)、基于信息内容的相似度计算(InformationContentMeasures)和基于特性的相似度计算(Feature-basedMeasures)。本文主要介绍基于距离的相似度计算方法――ShortestPath算法和LeacockandChodorow算法。
3.2基于视觉的类别相似度
众所周知,不同类别之间存在部分外观相似性,比如山猫和豹、狼和哈士奇、浣熊和果子狸等等。可见,分别在两个类别的训练集上训练ICA-HMAX模型,若两个类别视觉相似度越高,则这两个类别的S3层卷积核相似的基元个数越多;反之,两类别的S3层卷积核中的相似的基元个数越多,两个类别的视觉相似度越高。
我们知道两个类别的相似度越高,则两个类别的ICA-HMAX模型越能较好地实现对异类图像的相互表达。因此采用配对字典的方法[10]实现对S3特征表达的重构。然后,将重构图像与输入图的结构相似度[11](SSIM)作为衡量S3层特征对输入图像描述的好坏。若重构图像与输入图的结构相似度越高,则两个类别的视觉语义相似度越高,反之亦然。基于目标类别的视觉语义相似度算法流程如表1所示:
4实验结果与分析
实验设置:实验所使用的PC机配置为Intel(R)Core(TM)i7-4770、CPU3.4GHz×8cores、RAM16GB、Windows7操作系统。为了探索不同类别之间的语义相似度和基于ICA-HMAX模型S3层的特征描述子的视觉语义相似度之间的关系,本文选择了Caltech101数据集[12]进行实验,该数据集以彩色自然场景图像为主(包含一定数量的人造图像)。包括动物、花、人脸等101个目标类别以及一个背景类别。除背景类别之外,每个类别中的每张图片只包括一个类别中的一个实例,这有利于本实验进行。在进行实验之前,首先对数据集中每张图像做如下预测处理:统一图像高度为140个像素,保持图像的长宽比不变,采用双三次插值对其进行缩放。将每个类别中的图片按照4:1的比例分成训练集和测试集,在训练上训练各个类别的ICA-HMAX模型,采用3.2节介绍的视觉语义相似度方法在测试集上测试不同类别之间的视觉相似度。
4.1卷积核的可视化
图3(b)、(c)、(d)分别给出了S1、S2和S3层卷积核的可视化结果。结果表明,不同层次的卷积核编码了图像不同类型的特征。图3(b)中的S1层卷积核均编码了图像底层特征(如彩色边缘、彩色表面、拐角等结构信息等),并且不同类别的底层特征具有相似的结构特征;值得注意的是,通过ICA在彩色图像上的学习,获得了重要的颜色信息如彩色边缘、彩色表面等。S2层卷积核编码了各类别的中层部件特征,例如face_easy类别的S2层编码了人脸的眼睛、嘴巴、鼻子等信息,如图3(c)所示。由图3(d)可以看出,由于S3层卷积核的感受野比S2层大,编码信息更趋于类别信息。研究表明:这符合图像理解的层次特性[13]。
4.2相似度
数据集Caltech101图像部分类别之间的基于路径的ShortestPath算法和LeacockandChodorow的相似度矩阵分别如图4和图5所示。由图4和图5可以看出这两个矩阵都是对称矩阵。与一个类别最相似的类别有的不止一个,如与ant类别最相近的类别是butterfly、dragonfly、mayfly。值得注意的是图5中基于路径的LeacockandChodorow算法的类别相似度数据是经过归一化处理后的数据。
本文采用基于ICA-HMAX模型的S3层的特征计算视觉相似,其视觉相似度矩阵的结果如图6所示。在该相似度矩阵中,把同一类别之间的视觉相似度设置为1作参考,来衡量不同类别之间的视觉相对度。在图6中横轴表示ICA-HMAX模型的类别。纵轴表示测试图像的类别。由图6可见,不同类别之间的视觉相似度矩阵不是对称。比如用airplane的ICA-HMAX模型对helicopter类别的图像进行表达,并计算其视觉相似度其值为0.506;而当用helicopter的ICA-HMAX模型对airplane类别的图像进行表达,并计算其视觉相似度其值为0.253。且与一个类别最相似的类别只有一个。在Caltech101数据集中helicopter类别的直升机的实例图片上都存在较为明显的螺旋桨。在airplane类别的飞机图像没有明显的螺旋桨。而在忽略helicopter类别的直升机螺旋桨后,直升机的机体形状与airplane类别的机体在视觉上存在相似。基于语义和视觉的相似度统计如表2所示。
两种相似度之间的差异性分析:由表2可知,基于语言的语义的相似度与基于视觉的相似度之间存在一致性和差异性。一致性:由表2可知,20个类别中基于语义和视觉的相似度一致有5对,分别sunflower和bonsai、rhino和llama、airplane和helicopter、ant和mayfly、hedgehog和llama。比如airplane和helicopter这两个类别的实例如图7所示。由图可见,不同类别之间存在视觉相似,两个类别实例在的某些局部形状、颜色、纹理等方面具有视觉上的相似性。差异性:由表2可知:20个类别中基于语义和视觉的相似度不一致的较多。如图8所示,ant、butterfly和dragonfly这三个类别的语义相对度很高但是它们的视觉相似度相差较大。原因在于:语义即语言意义,是人脑对客观上事物的认识和理解,它具有高度的概括性和抽象性。类别之间的语义往往根据类别所属范畴、关系、属性、功能等综合特性来进行划分。而仅仅从事物的视觉外观上无法体现出上述种种关系。
5结论与展望
通过ICA-HMAX不同层次卷积核的可视化分析可知:自底层到高层不同层次的卷积编码规律如下:不同层次的卷积核编码了图像不同类型的特征。模型的层次越高,卷积核编码的信息越趋向于反映目标类别的特性,S1层卷积核编码体现底层共享特征(如拐角、彩色边缘、彩色表面等)。S2层卷积核编码中层部件特征,比如face_easy类别的S2层编码了人脸的眼睛、嘴巴、鼻子等局部信息。S3层编码信息更趋于类别的全局信息。研究表明:这符合图像理解的层次特性。
通过视觉的相似和语义的相似度分析可知,基于ICA-HMAX模型的S3层特性的视觉相似度与语义相似之间存在一致性和差异性。这种一致性和差异性在计算机视觉和人工智能领域具有互补性。比如对于那些语义和视觉的相似度一致的类别,尤其是视觉相似度较高的类别之间可以进行迁移学习,使得计算机实现人类的类比学习能力。对于语义和视觉的相似度差异性在图像的检索和图像理解等方面可以实现互补。通过语义的相似度我们可以检索到较多的相似类别,如与ant语义相似的有ant、dragonfly、butterfly。这样我们可以实现大范围的查找。然后在通过视觉的相似度进一步筛选正确的类别图片。反之,通过语义可以指导基于视觉的机器学习。
参考文献:
[1]RiesenhuberM,PoggioT.Hierarchicalmodelsofobjectrecognitionincortex[J].Natureneuroscience,1999,2(11):1019-1025.
[2]SerreT,WolfL,BileschiS,etal.Robustobjectrecognitionwithcortex-likemechanisms[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2007,29(3):411-426.
[3]LoweDG.Distinctiveimagefeaturesfromscale-invariantkeypoints[J].Internationaljournalofcomputervision,2004,60(2):91-110.
[4]HuX,ZhangJ,LiJ,etal.Sparsity-regularizedHMAXforvisualrecognition[J].PloSone,2013,9(1):e81813-e81813
[5]NairV,HintonGE.Rectifiedlinearunitsimproverestrictedboltzmannmachines[C]//Proceedingsofthe27thInternationalConferenceonMachineLearning(ICML-10).2010:807-814.
[6]HliaoutakisA.SemanticSimilarityMeasuresinMeSHOntologyandtheirapplicationtoInformationRetrievalonMedline[J].2005.
[7]RaftopoulouP,PetrakisE.Semanticsimilaritymeasures:Acomparisonstudy[J].TechnicalUniversityofCrete,DepartmentofElectronicandComputerEngineering,Tech.Rep.TR-TUC-ISL-04-2005,2005.
[8]R.Rada,H.Mili,E.BicknellandM.Blettner,“DevelopmentandApplicationofaMetriconSemanticNets”,IEEETransactionsonSystems,ManandCybernetics,vol.19,Issue1,(1989)January-February,pp.17-30.
[9]H.Bulskov,R.KnappeandT.Andreasen,“OnMeasuringSimilarityforConceptualQuerying”,Proceedingsofthe5thInternationalConferenceonFlexibleQueryAnsweringSystems,(2002)October27-29,Copenhagen,Denmark.
[10]VondrickC,KhoslaA,MalisiewiczT,etal.HOGgles:VisualizingObjectDetectionFeatures[C]//ProceedingsoftheIEEEInternationalConferenceonComputerVision.2013:1-8.
[11]WangZ,BovikAC,SheikhHR,etal.Imagequalityassessment:fromerrorvisibilitytostructuralsimilarity[J].IEEETransactionsonImageProcessing,2004,13(4):600-612.