首页 > 范文大全 > 计划安排

计算机视觉的意义范例(12篇)

发布人:收集 发布时间:2024-03-29

计算机视觉的意义范文篇1

在用常见的手势进行交流时,人们很容易就能互相理解,在经过学习之后,聋哑人或是正常人都可以运用手语进行交流。不过,想象一下,当你对计算机(或机器)做一个手势,它就能领会你的意图会是怎样的情景呢?如果计算机(或机器)看得懂手语,又意味着什么呢?姑且不管实现这样的人机交流有何深远的意义,还是先让我们来探究一下这样的可行性吧,想想看得懂手语的计算机(或机器)能有什么用途。

人机交互:从呆板到员活

人类之间的交流往往声情并茂,既采用自然语言(口语、书面语言),还广泛采用人体语言(表情、体势、手势)。与人类之间的交流相比,人机交互就显得呆板多了。以计算机的输入方式为例,人要向计算机下达指令,最常见的方式还是通过键盘输入。当然,手写输入也正为许多人所接受和喜爱,语音输入的研究也进行得热火朝天,最初单一而呆板的输入方式已经得到了扩展。然而,科学研究是永无止境的,人体语言这种简单快捷的信息交流方式得到了很多研究者的关注,他们想,能不能把这种灵活的信息交流方式也引进人机交互中呢?

于是研究人员展开了对人体语言理解的研究。人体语言的感知、人体语言与自然语言的信息融合对提高计算机的人类语言理解水平,加强人机接口的可实用性有着积极的意义。手语(手势)是人体语言的一个非常重要的组成部分,它是包含信息量最多的一种人体语言,它与语言、书面语等自然语言的表达能力相同。因而完全可以把手语作为人机交互的一种手段,它具有很强的视觉效果,生动、形象、直观。可见,将手势运用于计算机能够很好地改善人机交互的效率。

计算机怎样识别手势?

从不同的角度可以对手势进行不同的分类。分为交互性手势和操作性手势,前者手的运动表示特定的信息(如乐队指挥),靠视觉来感知,后者不表达任何信息(如弹琴);分为自主性手势和非自主性手势,后者需要与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息),分为离心手势和向心手势,前者直接针对说话人,有明确的交流意图,后者只是反应说话人的情绪和内心的愿望。

手势的各种组合、运动相当复杂,不过简单来看,手势主要有如下的特点:手是弹性物体,因此同一手势之间差别很大,手有大量冗余信息,由于人识别手势关键是识别手指特征,因此手掌特征是冗余的信息:手的位置是在三维空间,很难定位:手的表面是,非平滑的,容易产生阴影。

了解了手势的这些特点,就可以在手势研究中对手势做适当的分割、假设和约束。例如,可以给出如下约束:如果整个手处于运动状态,那么手指的运动和状态就不重要,如果手势主要由各手指之间的相对运动构成,那么手就应该处于静止状态。比如鼠标和笔式交互设备就是通过识别手的整体运动来完成人与计算机的交互,但它们不能识别手指的动作,其优点是仅利用软件算法就能实现,适合于一般桌面系统。只有当用鼠标或笔式交互设备的运动或方向变化来传达信息时,才可将鼠标或笔式交互设备看作手势表达工具。笔式交互设备发展很快,它提供了充分的交互信息,如压力、方向、旋转和位置信息,但现有交互主要是简单地替代鼠标。

计算机识别手势的手段主要有两种:

1.数据手套。数据手套是虚拟现实系统中广泛使用的传感设备,用户通过数据手套,能做出各种手势向系统发出命令,与虚拟世界进行各种交互操作:比如通过一只与数据手套对应的在计算机屏幕上显示的虚拟手,使用户成为虚拟世界中的一员:抓取物体,如果手套有力反馈,还能让用户感觉到物体的重量和材质等。美国在“洞穴”虚拟系统中就是利用数据手套来研制武器。数据手套的主要优点是可以测定手指的姿势和手势,但是相对而言代价较为昂贵,并且有时会给用户带来不便(如出汗)。

2.计算机视觉。即利用摄像机输人手势,其优点是不干扰用户,这是一种很有前途的技术,目前有许多研究者致力于此项工作。但在技术上存在很多困难,目前的计算机视觉技术还难以胜任手势识别和理解的任务。

目前较为实用的手势识别是基于数据手套的,因为数据手套不仅可以输入包括三维空间运动在内的较为全面的手势信息,而且比基于计算机视觉的手势在技术上要容易得多。

更好地为人服务

日本三菱电子研究实验室的研究人员已经使用低成本的视觉系统,通过手势就可以控制一台电视机。由计算机控制的美国航空航天局虚拟太空站也是采用美国Cybernet公司开发的手语识别软件,通过一部架设在顶部的摄像机来追踪指挥者的手势。当系统捕捉到挥手等手势时,就会做出相应的反应,让指挥者像航天员一样在计算机虚拟的阿尔法国际太空站上移动(确切地说是飘动)。

Cybemet公司的软件还能识别一系列的特定手势,就像工地上的工人或交通警察经常用的那种手语,通过这些手势你能够旋转在虚拟旅行中看到的三维图像,还可以向上或是向下改变你的视角。美国航空航天局正在考虑把这套系统用于真正的太空站,因为笨重的航天服和微重力环境使得鼠标和键盘都变得难以操纵。也许不久之后,航天员就能用简单的手语来控制机器人在太空中抓取物体。

手语(手势)识别系统的研究还有助于改善和提高聋哑人的生活学习和工作条件,为他们提供更好的服务。同时也可以应用于计算机辅助哑语教学、电视节目双语播放、虚拟人的研究、电影制作中的特技处理、动画的制作、医疗研究、游戏娱乐等诸多方面。另外,手语识别系统的研究涉及到教学、计算机图形学、机器人运动学、医学等多学科。因此,手语识别系统的研究非常有意义。

计算机视觉的意义范文篇2

关键词:目标跟踪技术;意义;问题;解决方法

中图分类号:TP18文献标识码:A文章编号:1009-3044(2015)02-0171-01

1.目标跟踪研究技术分类

1.1图像序列中目标跟踪技术

在图像中,根据点与点之间的关系,可以通过相邻两幅图像的点集中用以实现跟踪目标。同样的,根据线在目标跟踪中的使用,可以更加清晰的分解出图像的轮廓信息用以描述目标图像。更进一步,可以将面应用于目标跟踪,了解整个区域的外观信息,在经过后期的优化和分类处理实现目标跟踪。

在图像识别中,可以根据图像本身的空间位置相互依赖的关系以及图像块与图像块之间的关系在建立模型和构造置信度图的时候,融合空间的上下文信息。使得建立的目标跟踪的模型更加具有科学的根据,同时置信度图更加精确,更利于研究目标跟踪。

1.2视频序列中目标跟踪技术

目标跟踪可以通过对视频序列中正在运动的目标进行分析检测、提取数据、更进一步的进行识别和跟踪。这样的过程中,可以获得目标运动的参数,例如移动速度、加速度、运动的轨迹等,再将所得的结果进行下一步的分析处理,以此实现对目标的理解以完成任务跟踪的目的。

对于目标跟踪和测量可以分为三个阶段。首先,有目标的检测和特征提取,在这两个阶段中,需要一定的理论知识和灵活的应变能力,可以根据场合的不同进行不同的设计。第三个阶段就是目标的跟踪,简单来说可以理解为目标初始状态和特征提取从而得到目标视觉特征,以此为基础,进行时间和空间相结合对目标的状态进行估计。因此,一个良好的跟踪系统必须能满足顾客准确、实时、可靠的要求。“准确”顾名思义,就是要提高目标跟踪的精准度,最低的要求即要可以跟踪出目标的大致位置,高的要求下必须给出目标的准确方位。“实时”是指的跟踪目标信息的更新速度,数据的输出速度必须要在物体的实际运动速度内,满足控制系统的动态指标要求。“可靠”则是要求目标跟踪结果的真实可靠性,过程必须保证稳定,即使是在跟踪失败的情况下,也要求具有良好的恢复能力。只有满足以上三点,才能达到很好的综合性能。

2目标跟踪研究技术意义

2.1在民用领域的意义

在民用领域中,目标跟踪技术研究的新兴方向是拥有核心技术的智能化视频监控。智能化视频监控是高层计算机视觉技术,简单描述则是摄像机进行前期采样,通过视频序列图,对其中的信息进行更进一步的分析和理解,从而实现视频监控系统的智能化。例如有的视频监控中可以智能识别场景内人的行为和语言对话。从而可以甄别出危险的人员自动报警。在交通管理中,也可以通过智能检测实现对车辆的管理,实时监控道路车流量和对异常的车辆进行调查,可以很大程度上减少交通事故的发生,和更快速的进行事后处理。

2.2在军事领域的意义

在军事领域中,目标跟踪技术对于增强国防有很大的意义。视频监控可以及时掌握战争中的环境和更快速地对敌方的目标进行搜索和跟踪。对于环境的掌握和检测有利于寻找和提取目标和场景、还有摄像机的机位等信息来进行实时的反馈控制,可以了解敌方动态在战争中处于主导地位。还可以将目标跟踪技术和机器人技术结合,研究机器人视觉导航系统,安装在机器人体内的摄像机可以实现实时环境检测,获取更为详细的环境信息。同时,目标跟踪中的智能视频监控也有利于发现边防的不利状况和嫌疑人员,更大程度上保护我国军事机密。

3目标跟踪研究技术应用

3.1在道路车辆监控上的应用

在现实生活中,可以利用目标跟踪技术实时监控道路上的车辆,在移动过程中,车辆在视窗中的大小和形状会发生特定的变化。例如我们可以选取一组在实际环境中拍摄的照片进行研究,车辆由近及远的移动过程中,车辆目标区域的形状会慢慢变小,目标形状变化不大会取得比较成功的跟踪效果。但是存在缺陷的是,目标变小时,跟踪的准确性也随之变小,有时所反应的结果已经偏离了目标所在的实际位置。导致目标跟踪出现问题,甚至错误的跟踪了其他目标。因此,在道路中车辆的监控方面,还要进一步改正,加强精准度,才能让科技更好为交通事业做出贡献。

3.2在矿井安全监控中的应用

在生活中,井下工作是安全风险最大的工作之一。可以利用目标跟踪技术,对井下危险区域运动目标进行检测和跟踪,在这样的检测下,可以提前得到风险预测,提前预警可以有效防止危险事故的发生。利用数学领域的利用背景建立模型和利用背景差法在线有效的调节速率,这种方法可以应对光线的变化和突变的环境下对移动目标的监控,利用目标跟踪技术在发生突发状况时可以准确的定位和实时的跟踪目标。可以提高突发事故的存活率,给矿工们的生命多一层保障。

3.3在社会生活中的作用

在社会工作中,未来发展的趋势电子化越来越普及于生活的任何角落,与现有阶段的键盘和鼠标表达思想不同,未来的人和计算机的交互影响应该会更加方便,科学家希望计算机能够像一个人一样善解人意,这就需要计算机能够读懂人类的语言、表情、手势、动作等。利用目标跟踪技术,实现视频的智能化,计算机可以通过采集人们的动作图像等进行分析,更理解场景中的人和事。例如在医疗领域,可以利用这个智能的电脑来监护生病的儿童和老人,他可以很快的明白病人的需求,所以可以更好的照顾从而促进医疗事业的革新;在教育领域中,利用视频智能的分析技术,比普通老师更快的了解学生对于知识的掌握了解情况,判断学生的学习兴趣,可以因材施教,更好更快的教好学生;在游戏时,智能的计算机能更快地了解游戏者的意图和兴趣,分析出更适合游戏者的游戏,让游戏者开心的融入氛围体验娱乐生活的乐趣。

参考文献:

[1]丁业兵,王年,唐俊,等.基于颜色和边缘特征CAMShift目标跟踪算法[J].华东理工大学学报:自然科学版,2012,38(l):69-74.

计算机视觉的意义范文篇3

关键词:源程序;美;效率

引言

美与效率相长相消.人类所有工作的一个重要目的是为了追求美,发现美,创造美.美好的事物不仅给人以享受,也能带来工作效率的提高和生活质量的改善.C++之父STROUSTRUPB先生在他的重要著作中[1]常提到“优雅”的字眼,“优雅”代表的就是简洁、漂亮、美观和高效.对此所有从事过多年程序设计工作的人肯定会有同感.从各层面精心设计的程序,会给人以整体美的感受,甚至就是一件精雕细刻的艺术品,这样设计出来的程序使用及运行效率一般会较高.事实上,计算机程序设计语言的演化过程就是一个很好的例子,从二进制的机器语言到汇编语言,再到高级语言,再到现在的4GL,每次进化都会使程序设计更接近人类语言,更符合人类审美观念,语言学习,程序设计工作,程序的运作更具效率.计算机是人类追求效率的直接产物,源程序的美学表现力直接影响人、程序和计算机的工作效率.软件设计中的美学表现可以体现在各个层面上,从整体规划到代码编制,从界面到源程序,从一个符号、一条指令到一个文件,从视觉表现到逻辑结构都是如此.我认为能把美学思想融到软件设计的各个层面,能在各层面透射出美学表现的软件会有更高的效率,也会有更多的成功机会.软件设计中,凡能透射美的每一个层面会带来各种效率的提升.美观的源程序编排格式自然提高人们阅读和理解的效率.精致的用户界面和简洁易用的操作流程必然赢得用户的青睐,自然也能提高他们的工作效率.代码合理顺序,精良的算法体现出程序的逻辑美,这总是带来空间、时间、应用及运行效率的改善.这里我将就源程序方面的美学表现和效率问题谈一些自己的看法,当然这些看法更多是对别人类似观点的汇总.

1视觉美学表现与效率

源程序中最小的元素应该是各种符号、运算符和基本命令,一直大到整个软件的所有源程序,其间还有表达式、复合语句、过程、函数到一个源程序文件,每个层次都需要有合理的美学表现,从基本单元到文件整体及单元和整体相互作用各角度融入美学思想,才能打造出视觉效果优良的源程序代码.透射美学表现的源程序对别人的阅读,程序员间交流,设计人员日后查询提供极大方便,显著提高工作效率.一个实用软件中会涉足许多符号,例如变量名、函数名、类名等等,为一实体命名,也就是编制一个符号是大有学问的,不但要求视觉美观,还要含义准确简单,于是出现了各种符号命名风格,其中著名的要数“匈牙利表示法”(为了纪念Microsoft程序员CharlesSimonyi)[2],这种方法里,变量名以一个或多个小写字母开始,这些字母表示变量的数据类型,当然也有各自形成的习惯或随意命名.这里并不存在哪个更好的问题,重要的是根据实际情况和需要来确定.例如循环控制变量一般用i,j,k等简短的符号即可,如果用a,b,c等就不太好,若用匈牙利表示法表示为iI,iJ,iK或iA,iB,iC(这里i为整型)就明显不好,而用iNumberOfPeople,count_of_element等表示几乎是一种丑陋.事实上在含义清楚,不引起混淆的前提下,任何符号要尽可能短小.简短明了,意义清楚的各种符号,不仅阅读容易,书写方便,占据更小的空间,也为以后整个源程序良好编排奠定基础.如果把整个程序比作画,符号就是画的一笔,每一笔画好了,是画好一幅画的基础.

1.1源程序视觉表现分析

下面是一个VisualFoxpro函数示例的程序使用a,b就很好了.函数名前缀fun显得可笑,这一方面是由于VisualFoxpro本身有过程和函数之分,另一方面也是程序员的多此一举.关键字FUNCTION,ENDFUNCTION,PARAMETERS太长也是火上浇油.VFoxpro的鼻祖设计者(DBase的设计者)们大概也意识到了这个问题,作为弥补,VFoxpro中可通过4字符关键字缩短符号应用.显示表达式中ALLTRIM(),STR()的频繁使用也潜在着丑陋的地方.STR()不该无原则给转换结果添加空格,那应该是用户可选择的事情,STR()的失误带来不必要的ALLTRIM()调用.关键字过长、库函数设计缺陷这是语言设计的缺美之处,过度使用大写字母这是语言及程序员不妥之处,毫无道理使用长符号是程序员的过失,看来,这是典型的缺乏美学表现的例子,这样的源程序显然缺乏各层次的效率.下面改造可能好些.源程序版面对阅读的影响显而易见.版面编排与实体有一定关联.例如在C/C++中,有头文件(.h或.hpp)和实现文件(.c或.cpp)之分,它们不仅完成接口和实现的分离,为代码保密带来便利,同时也为阅读和使用带来益处.

1.2颜色对源程序的视觉影响

尽管目前源代码还不支持颜色(指编译器不支持),但C++之父STROUSTRUPB先生正在设想未来的C++可能重载颜色.到那时,源程序中红色a和黄色a是不同的.如此一来我们就能编排出更美的源程序,源程序将会有更强的美学表现力,并且提供更高的应用效率.这里要说明的是,目前,多数源程序编辑器支持语法颜色,实践证明,编辑器语法颜色支持增强了源程序的美学表现力,同时提升了源程序使用效率.

1.3源程序注释的美学表现

对源程序中的注释,人们依然有许多显然不同的说法.为源程序添加适当数量的注释是大多数人的共识.但添加许多注释或干脆不加注释的源程序也是可以见到的.注释问题会涉及到添加还是不添加,添加多少,添加在代码的什么层次的什么位置.对此我个人的看法是:美观并且富有效率应成为添加注释的基本准则.其实代码原本具有自解释性,为什么还要有注释,因为计算机语言毕竟不是人类语言,更何况就是人类语言,还有语言不通的时候.因此适当的,言简意赅的注释再加上源程序一定程度上的自明性,辅以恰当的注释位置,源程序的阅读就成了一件轻松愉快的事.相反,缺乏必要的注释,罗嗦多余的注释,含义不清的注释,位置不当的注释都会带来阅读上的困难和不适,甚至出现理解错误.源程序中代码块的规模显著影响人们对源程序的阅读和应用,例如C/C++中的结构,类和函数.一个体积庞大的结构,类或函数,无论从阅读还是应用都可能造成困难,尤其可能引起人们理解上的误差.例如MFC中的CDC类就是超大的C++类[3],我想,设计和维护这个类的Microsoft的工程师们在摆弄这个类的源代码时至少会有点累吧,至少会感到它真的有点大吧.我觉得类似这样的类有点丑陋,从心理上会影响我对它的使用,换句话说,这会引起使用效率的下降.函数体也一样,一个大规模的函数体不仅丑陋,也很可笑,甚至是危险的.其实,理论上不管多大的软件都可只有一个函数,这就好比巴黎的埃菲尔铁塔,它完全可以一次成型造就,但那意味着什么?意味着至少会有更为巨大的投入和难以想象的浪费.将函数中最小的不可分的逻辑相关代码块分离出来成为小函数,就可避免胖子函数,对于类也有类似情况.一个源程序文件中的各类要素保持美的表现,多个源文件保持相同风格,一个软件的源程序从视觉上就会具有很强的美感,由此会显著提高阅读和应用效率.

2逻辑美学表现与效率

与视觉美学表现相比,逻辑美学表现并不直观,逻辑美感表现在更深的层次上.逻辑上的美学表现除了一定程度上对视觉的影响外,更多的隐藏在视觉背后.源程序视觉美学表现直接影响到源程序使用人员的工作效率和心理体验,但对最终目标程序的效率影响要弱于对人的影响,逻辑美学表现更多的是对目标程序工作效率的影响,同时逻辑美学表现从更深一层影响着人的视觉美感,并由此上升到更高一层的美的欣赏.

2.1编译系统的逻辑表现

计算机语言的编译或解释系统在生成机器代码时,并非对源程序做一一对应的翻译,而是要做各种加工,人们熟知的是优化处理,但有时也会画蛇添足.例如前面的表达式:?ALLTRIM(STR(pnFIRSTDATA)),“*”,ALLTRIM(STR(pnSECONDDATA)),;“=”,ALLTRIM(STR(pnFIRSTDATA*pnSECONDDATA))从逻辑上讲这个表达式也是丑陋的,例如ALLTRIM()和STR()的使用就有问题,悄悄的加上空格,再去掉它,真是糟糕.

2.2源程序语言要素的逻辑表现

源程序语言要素的选择,语句顺序,算法设计,类与函数的合理设计,代码在文件中的分布等都可以体现源程序的逻辑美学表现.完成某个程序功能,可有许多途径,例如在C/C++中,一个循环任务就可以选择for(),while,dowhile(),goto等多种语句,增一等工作可选a=a+1,a+=1,a++等,随意的选择定会让C/C++发明人失望.具体情况,需要合理选择才能体现出清晰的设计意图,同时也折射出逻辑的美.毋庸置疑,语句的顺序许多时候至关重要,另一些时候则无关紧要,但也有一些情况貌似无关紧要,却很有文章.假设有一个有关中学生身高的统计程序,将身高小于150厘米看作矮个,150~169厘米看作中等个,170厘米及以上看作高个,下面的(a)、(b)程序片段很有区别.函数与类的定义不仅影响它们的视觉美学表现,同时也对它们的逻辑美学表现产生影响,很明显,我们这里谈论的逻辑美学表现是源程序中蕴含的逻辑成分与人的逻辑思维的共鸣,可以想象,一个函数拥有成百上千条,甚至更多的语句,一个类有几百个成员那是一种什么景象,何止会引起视觉混乱,也很容易造成函数、类在逻辑含义上的失误.无论函数、类还是它们内含成分,采用逻辑美学准则去定义它们,能编制出无论视觉还是逻辑上都美的源程序.这不仅影响到人的工作效率,同样也影响到目标程序的效率.算法设计、代码在文件中分布等对源程序逻辑美学表现及效率的影响不言而喻.

3结语

软件工业进入二十一世纪,无论设计理念,设计工具,还是设计规模,都发生了重大变化.从设计规模上讲,现在每设计一个有用的程序都是一个工程,要涉及到许多文件,大量源程序代码,面对上万行甚至几十万行的源程序必须从视觉上、逻辑上全面考虑美学表现,符合美学准则的源程序才是易于管理,易于应用,富有效率的源代码.就让我们努力编写视觉优良,逻辑完美的源程序吧.

[参考文献]

[1]STROUSTRUPB.C++程序设计语言[M].北京:机械工业出版社,2002.

[2]PETZOLDC.Windows程序设计[M].5版.北京:北京大学出版社,1999.

计算机视觉的意义范文

“计算”是一个无人不知无人不晓的数学概念。无论是人们的日常生活,还是平常的生产实践和科学研究,都离不开计算。同时,“计算”也是一个历史悠久的数学概念,它几乎是伴随着人类文明的起源和发展而起源和发展的。但是,真正能够回答计算的本质是什么的人恐怕不会太多。应该说,在20世纪30年代以前,还没有人能够说得清计算的本质是什么,以及什么是可计算、什么是不可计算的等问题。30年代中,由于哥德尔、丘奇、图灵等数学家的工作,人们终于弄清楚了计算的本质,以及什么是可计算的和什么是不可计算的等根本性问题。由此也就形成了一个专门的数学分支——递归论或可计算性理论。在此我们就是以这一理论为背景,概括出计算的本质,并阐明其他一些根本性问题。

计算首先指的就是数的加减乘除,其次则为函数的微分、积分、方程的求解等等;另外还包括定理的证明推导。抽象地说,所谓计算就是从一个符号串f变换成另一个符号串g。比如说从符号串12+3变换成15,这就是一个加法计算。如果符号串f是x•x,而符号串g是2x,从f到g的计算就是微分。定理证明也如此,令f表示一组公理和推导规则,令g是一个定理,那么从f到g的一系列变换就是定理g的证明。从这个角度看,文字翻译也是计算,如f代表一个英文句子(由英文字母及标点符号组成的符号串),而g为含义相同的中文句子,那么从f到g就是把英文翻译成中文。这些变换间有什么共同点?为什么把它们都叫做计算?

为了回答究竟什么是计算、什么是可计算性等问题,人们采取的是建立计算模型的方法。从30年代到40年代,数理逻辑学家相继提出了四种模型,它们是递归函数、λ演算、图灵机和波斯特系统。这种种模型各不相同,表面上看区别很大,它们完全是从不同的角度探究计算过程或证明过程的。但事实上,这几种模型却是等价的,即它们完全具有一样的计算能力。在这一事实基础上,最终形成了如今著名的丘奇—图灵论点:凡是可计算的函数都是一般递归函数(或都是图灵机可计算的,或都是λ演算可计算的,或都是波斯特系统可计算的)。这就确立了计算与可计算性的数学含义。这一表述过于抽象,下面我们给出一个比较直观的说法:所谓计算,就是从已知符号串开始,一步一步地改变符号串,经过有限步骤,最后得到一个满足预先规定的符号串的变换过程。现已证明:凡是可以从某些初始符号串开始而在有限步骤内计算的函数与一般递归函数是等价的。这就是说,所有可计算的函数都是通过符号串的变换来实现其计算过程的,即计算就是符号(串)的变换。(1)

与计算具有同等地位和意义的基本概念是算法。从算法的角度讲,一个问题是不是可计算的,与该问题是不是具有一个相应的算法是完全一致的。一般而言,算法就是求解某类问题的通用法则或方法。也就是一系列计算规则或程序,即符号串变换的规则。

正是这样一个原本只是数学中的基本概念,如今却成为各门科学研究的一种基本视角、观念和方法,上升为一种具有世界观和方法论特征的哲学范畴。

我们认为,人类最早把计算作为一种哲学性观念和方法而不仅是一种数学观念和方法,并自觉运用到有关领域的研究中,是一些人工智能的专家们做出的,尤其是在后来的认知科学研究中很明显地表现出这一倾向。由于纽威尔、西蒙、福多、明斯基等一大批学者的努力,物理符号系统假说、心灵的表达计算理论,心脑层次假说等相继提出。这些理论的一个共同主题就是:思维就是计算(认知就是计算)。他们明确主张:思维是一种信息加工过程,亦即计算过程,这种计算就是指某种符号操作或加工,指在能对其提供语义解释的符号代码的形式表达式上所进行的受规则制约的变换,如问题求解这种思维活动就是通过一定的算法对初始态空间进行操作,直达到目标态空间。有人更进一步主张:心灵有一套程序或一组规则,类似于控制计算机的程序,思维是一种包括对单词在内的符号的操作。(2)

除了思维、认知可看作是一种计算,一些研究视觉认知理论的学者把视觉也看作是一种计算。这主要是来自马尔的《视觉计算理论》。这一理论认为,在计算理论层次上,视觉信息处理过程由三种内部表象表征:描述图像光强度与局部几何结构的要素图;描述以观察者为中心的物体可见表面的朝向、轮廓线、深度及其他性质的二维半图;识别和理解物体的三维表象。这个理论把视觉过程理解为功能模块(像元空间、图像空间、景物空间)的变换。这意味着视觉计算的基本单位是符号表象。3在此基础之上,后来人们又提出了视觉拓扑计算理论等各种视觉计算理论。其共同点是均认为视觉过程就是一种计算过程,但是对它是一种什么样的计算还存有较大分歧。

在对认识、思维、视觉等内容进行计算主义研究的同时,人们确立了大脑就是一台计算机的信念:大脑的生物结构是其硬件,大脑的运作规律是其软件,大脑的(广义)思维过程就是其计算过程。20多年前的“计算机能否思维”的问题已经演化为当今的“人脑是否计算”的问题。更重要的是,“思维就是计算”这已不仅仅是一个哲学性的命题,而且已成为科学方法论意义上的一个科学假设。人们早已从科学意义上探究思维的计算本质,计算已成为当前认知科学中占主导地位的一种基础观念和研究方法,人们试图从计算的角度揭示出思维、意识以及整个大脑的全部奥秘。

把计算作为哲学性观念和方法运用到具体学科研究中的另一个范例是与生命科学相关的一些研究。这主要体现在20世纪80年代以来,人工生命科学、遗传算法理论和dna计算机等新型学科的相继涌现。这些学科或理论的共同之处就在于都是以计算作为自己研究的观念和方法,主张生命就是一种算法,一个程序,一个能够实现自我复制、自我构造和自我进化的算法。人工生命的基本信条是:生命的特征并不存在于单个物质之中,而存在于物质的组合之中。生命的规律是一种动力形式的规律,这种规律独立于45亿年前地球上形成的任何特定的碳化物细节之外。即生物体的“生命力”存在于分子的组织(软件)之中,而不是存在于分子本身。人工生命就在于用计算或算法的观念与方法探索生物学领域中的奥秘。把生命与计算机类比,似乎是19世纪机械论在当今的延续,看起来有背于时展的潮流。但人工生命的奠基者朗顿认为,答案就在于进一步的伟大洞见之中:生命系统这台计算机具有与通常意义上的机器全然不同的组织形式,有生命的系统几乎总是自下而上的,从大量及其简单的系统群中突现出来,而不是工程师自上而下设计的那种机器。朗顿强调说:“最为惊人的认识是:复杂的行为并非出自复杂的基本结构。确实,极为有趣的复杂行为是从极为简单的元素中突现出来的”。4这就是说,生命包含着某种能够超越纯物质的能力,不是因为有生命的系统里被某种物理和化学之外的一种生命本质所驱动,而是因为一群遵循简单的互动规则的简单物体能够产生永远令人吃惊的行为效果。生命就是这样一种生化机器,只要启动这台机器,而不是把生命注入这台机器,即将这台机器的各个部分组织起来,让它们产生互动,从而便具有了“生命”。生命就是这样一种算法。算法对于生命的意义,就在于以过程或程序描述代替对生物的状态或结构描述,将生命表达为一种算法的逻辑,把对生命的研究转换成对算法的研究,特别是把对真实生命的研究转换成对人工生命的研究。

1994年11月美国科学家阿德勒曼在《科学》上公布的dna计算机理论,更是从另一个角度揭示了生命就是算法,进化就是计算的观念。5dna是生命的基石,任何生命类型的所有特征都以严格的规则编码在其dna序列上,不管是生命的结构,还是生命的过程,在这个意义上它是一个信息库或数据库。另外,dna所有的行为都是以程序化、模块化的形式表现,在这个意义上它又是一个程序库。无论它是作为信息库还是程序库,dna都具有基本的计算特征。而生物体中所有现象的基本形式都是dna的复制、切割、粘贴,这一事实深刻表明,生命本身就是由一系列复杂的计算或算法组成的。生命系统就是一台以分子算法为组织法则的多层次生物计算机,dna计算机就是对生命这种自然计算机的一种表征。从前,分子算法,如自复制自动机、胞格自动机、遗传算法、人工生命等全都是在电子计算机上实现的,dna计算机概念的出现是分子算法的化学实现的开端。这种立足于可控的生物化学反应或反应系统,无疑更加有力地直接地表明了生物现象与过程的计算特征。正如有人所言:dna计算宣称数学处于生命的核心。

运用计算、算法观念和方法研究认知问题和生命系统,有着深刻而普适的科学方法论意义,它们是人们运用算法观念和方法研究其他自然现象或自然系统的两个有益的重要范例。如今,计算或算法的观念与方法已经深入到宇宙学、物理学、化学乃至经济学、社会学等诸多领域。计算、算法已经成为人们认识事物、研究问题的一种基本的普适的观念和方法,人们的科学实践,已经使计算、算法上升到哲学性的观念和方法。在这一现实背景之下,我们以为,把计算、算法作为一种哲学范畴正式提出并引入哲学已是十分必要的。这不仅是因为已经有了一些成功的范例,而且还有着更深层的学理:生命、大脑是最复杂的自然现象之一,是自然界进化的最高代表。因此,我们完全有理由猜测:整个自然界也是按算法构成的,是按算法演化的。现实世界之万事万物只不过是算法的复杂程度的多样性。从虚无到存在、从非生命到生命、从感觉到意识、思维,或许整个世界的进化过程就是一个计算复杂性不断增长的过程。这就是说,自然界就是一台巨型计算机(硬件),任何一种自然过程都是自然规律(软件)作用于一定条件下的物理或信息过程(计算过程),其本质上都体现了一种严格的计算和算法特征。生命系统作为自然界中最复杂最有特色的系统,它也就是形形的自然计算机中的一种。这或许就是人工生命与dna计算理论所蕴含的最重要的哲学道理。

把计算、算法作为一个哲学范畴,还有着哲学史上的渊源关系。也许人们还没有忘记,在2500多年前,一位名叫毕达哥拉斯的古希腊人曾向世人宣称:万物皆数。今天,我们何以不能说:万物皆算法。严格地说,当年毕达哥拉斯率先提出的“数”这个重要范畴,并不是一个纯粹哲学性范畴,而是一个从数的角度寻求世界万物之本原,考察事物生成演化过程,由自然科学思维方式与哲学思维方式相互融合的过渡性范畴。这种观念在近代和现代科学与哲学中得到了充分的继承和发扬。这说明,哲学范畴在其生成、演化和发展的过程之中,总要受到各个历史时期数学发展程度、数学思维方式的影响和规定。这或许可以称为哲学范畴的数学规定,正因为如此,当今计算机科学的发展,使得我们完全可以把毕达哥拉斯的“数”向前推一大步。毕达哥拉斯哲学在当代有了更深刻更丰富的内含。

最后我们要指出的是,已经泛化到整个科学领域中的计算、算法这个概念,完全具有哲学范畴的基本特征。众所周知,哲学范畴是反映事物本质属性和普遍联系的基本概念,人类理性思维的逻辑形式。它是人类在一定历史时论思维发展水平的标示器,是帮助人们认识和把握自然现象和社会现象之网的网上扭结;是对自然、社会和思维发展过程最本质、最普遍的联系的表征。哲学范畴对各门具体科学都具有普适的哲学方法论意义。如今,人们在各方面都开始用算法的观念来看待问题、用计算的方法来解决问题,不正表明计算与算法的一种范畴性吗?历史上每次重大的科技进步,都要改变当时的哲学范畴,有时甚至是直接把科学中的基本概念移植到哲学中。当今计算机科技对哲学的影响也不例外。这正是有人所说的哲学范畴的科技命运。因此,及时总结和概括当代科技成果,把最为精华的人类理念上升为一种哲学范畴,不仅是哲学范畴自身发展之所需,更是各门科学文化进一步发展所必须。只有渗透着时代最主要、最有效的观念和方法的科学与文化,才能真正体现时代之精神,成为时代之主流。

参考文献

(1)莫绍揆.递归论.科学出版社,1987年。

(2)邱仁宗.当代思维研究新论.中国社会科学出版社,1993年。

(3)(美)d.马尔.视觉计算理论.科学出版社,1988年。

计算机视觉的意义范文篇5

关键词:Web;Web碎片信息;CSS;信息抽取

中图分类号:TP391

随着网络技术的发展,互联网的信息呈现方式正在发生日新月异的变化,微博的出现使人们随时随地都可以分享自己的信息。同时,微博的出现也正在改变着人们关注信息的习惯,网民们获取信息的方式越来越“碎片化”,从传统的“一对多”的信息分享方式变成的“多对多”的信息分享方式。也就是说,在信息碎片化的时代,每个人都是信息的制造者,也是信息的获取者。由于每个人均可以通过碎片信息平台(如新浪微博、腾讯微博)信息,使得碎片信息出现了很大的随意性,信息的构成不再像传统方式的规范化,而出现了多元化、异构化及碎片化。在进行碎片信息抽取的时候,由于其本身可能只是“只言片语”,就有可能被当成信息“噪声”过滤了,因此给信息的抽取与整合带来了一定的困难,针对碎片信息所固有的特点,考虑到信息的分享者是“人”,而非浏览器本身,对信息的抽取应该从浏览器给人的视觉分块出发,提出了一种基于CSS视觉分块的Web碎片信息抽取算法。首先对Web信息抽取的技术进行分析,其次基于CSS视觉分块的Web碎片信息抽取算法,然后通过实验对提出的算法进行验证与分析,最后对算法进行总结。

1Web信息抽取技术

Web信息抽取的目的就是便于检索或者数据挖掘,从松散的、半结构化的Html网页中抽取出有价值的、隐含的数据信息,并将其结构化存入数据库中。这一概念最早是由Gwiederhold提出的[1]。相应地,Web碎片信息抽取就可以引申为:从无结构或半结构的Web碎片信息网页制取出用户关心的、有价值的信息片段,并形成结构化数据的过程[2]。

目前,有很多研究者在研究Web信息抽取的技术,力求达到准确、高效的效果。纵观目前关于Web信息抽取的研究成果,不难发现,抽取的效果取决于是否能准确找出Web页面中的抽取规则,即抽取规则的生成。通常有基于统计理论的抽取技术、基于DOM树的抽取技术及基于归纳的抽取技术。

基于统计理论的抽取技术是一种传统的抽取方法,主要思想是通过统计网页标签所包含的信息量或链接文本与普通文本的比值来获取网页的主题信息。如孙承杰等人提出的通过获取网页中的标签的源码信息,去掉所有的HTML标签,对文本的长短进行统计,长度较大的就是主题信息[3]。如Gupta等人提出利用链接文本与普通文本的比值来确定页面中的正文分块,如果普通文本比例较大,则认为是所要抽取的目标文本,否则认为是噪声(如广告信息)[4]。可针对Web信息碎片的抽取,这种方法有其局限性,因为Web信息碎片所占的比重小,有可能会被当作噪声去掉,会直接影响抽取算法的召回率。

基于DOM树的抽取技术是通过DOM解析器将Web页面解析为Dom语法树[5],Dom语法树的本质就是在内存中构建XML语法树,它主要包括根元素(DocumentElement)与节点(Node),其中Node能反映出所有Web页面的所有结构信息,包括文本信息与属性信息,方便了对各节点的操作。基于DOM树的Web信息抽取算法在抽取时先获取HTML源码,再经过预处理,构造XML语法树,然后去噪,最后根据需求抽取信息。如刘军等人提出的基于DOM的网页主题信息的提取技术[6],那赫提出的基于DOM的Web主题信息提取系统的设计与实现[7]。

基于归纳的抽取技术是基于样本训练的模式,假设某网站具有信息公用模板,并且此模板下生成了大量的页面,然后对这些页面进行样本训练,寻找出网页的结构及文本特征的变化规律,从而获得页面之间相对稳定的相似结构特征,发生变化的只有文本特征。以此来归纳内网页的统一公用模板,并利用公用模板抽取出页面的信息。如石倩等人提出的基于规则归纳的信息抽取系统实现[8]。但基于归纳的抽取技术需要大量的相似页面作为训练的对象,不适应一些页面较少的网站。

2基于CSS视觉分块的Web碎片信息抽取算法

众所周知,HTML页面的编写具有很强的灵活性与随意性,不同的网页设计者可以按自己的方式设计页面,就导致了页面呈现出异构性,给信息的抽取带来了困难。但网页开发的目标是在浏览器上显示所设计的内容,把设计的视觉效果通过浏览器根据设计的CSS样式将其展现给用户,网页设计的目的给“人”看的,浏览器只是一种显示的手段。因此,在进行Web碎片信息抽取时,将CSS视觉分块引入信息抽取是必要的,因为CSS视觉分块是从“人”的角度出发的,不仅仅是浏览器。2003年微软亚洲研究院首先提出了将VIPS(aVision-basedPageSegmentationAlgorithm)[9]将视觉分块引入到了网页信息的分块之中,VIPS主要依靠计算分块的背景颜色、内容字体的大小及空白区域等视觉特征,根据HTML标签特征及相关规则计算Web页面的视觉分块。VIPS算法在某种程度上达到了Web页面视觉分块的要求,但算法本身所采用的启发式规则是基于HTML标签结构的。如果能将CSS视觉特征引入页面分块中,会更加符合网页设计的意图。

定义1CSS视觉块构成Web页面的基本单位,也是一个CSS盒子,如图1所示。其是一个矩形的视觉区域,由CSS盒子模型的高(height)、宽(width)、外边距(margin)、内边距(padding)、边框(border)及内容(content)构成。即:

CSS-V={height,width,margin,padding,border,content}

其中,content可以是CSS视觉块,也可以是文本内容,也可以为空。

定义2CSS页面视觉块BWeb页面本身就是一个CSS视觉块,由若干其他的CSS视觉块所构成。

定义3CSS普通文本视觉块T内容为文本信息的CSS视觉块。

定义4CSS链接文本视觉块A内容为文本信息且含有链接指向的CSS视觉块。

定义5空块N内容为空的CSS视觉块。

算法主要思想:对于Web碎片信息的抽取往往中关心上述几种视觉块信息,对于其他的块可以作为干扰噪声去掉。由此根据Web页面的DOM树(DocumentObjectModelTree),计算出CSS所有的CSS视觉块,去掉不属于{B,T,A}的视觉块,生成视觉块描述文件。如腾讯微博http:///xiangchengguan的视觉块描述文件如图2。常言道“物以类聚”,对于Web碎片信息所在块的识别,尽管信息较短,但它们是以“聚集”的方式出现的,所占用块的面积在整个页面视觉块中占有比率应不小于30%,同时它们的个数在整个页面中也是最多的。因此,需要对所有的CSS视觉块进行分类,分类采用统计的方法进行,即根据CSS-V中的height、width、margin、padding、border及content进行相似度计算,如果结果相同就可视为同一类CSS视觉块,如对图2所示的视觉块描述文件进行分类可得到表1所示的分类结果。

由表1可以计算出,视觉块个数最多为20,它占用的面积在整个页面中的比率最大,因此其必为Web碎片信息的视觉块。

抽取算法分为四步进行:

Step1计算出CSS所有的CSS视觉块;

Step2删除不属于{B,T,A}的视觉块,并生成描述视觉块的XML文件;

Step3统计分类结果,找出Web信息所在的CSS视觉块,并删除其他视觉块;

Step4对Web信息所在的CSS视觉块进行信息抽取,并将结果格式化后写入数据库。

3实验

为了验证算法的有效性,实验以随机选取的1000个Web碎片信息站点作为测试的数据集,分别对基于统计理论的抽取算法(Ext-ST)、基于DOM树的抽取算法(Ext-DOM)、基于归纳的抽取算法(Ext-I)与基于CSS视觉分块的Web碎片信息抽取算法(EXT-CSSV)进行对比测试。算法均采用C#语言实现,实现过程中通过微软的VisualStudio2008提供的WebBrowser控件调用IE内核,从而生成CSS视觉分块。实验中运行的硬件环境为Intel?Rentium?IIIXeonprocessor(2CPUS),2.6GHz。160G硬盘,内存为1GB。存储数据的数据库为Microsoftsqlserver2000,操作系统为MicrosoftWindowsXP。

实验中主要检测查准率与查全率两个指标。查准率为算法抽取到的Web碎片信息中准确的信息数与实际Web碎片信息数的比值。查全率为算法抽取的Web碎片信息数与应抽取的Web碎片信息数的比值。实验结果如表2所示。

为了进一步验证算法的效率,实验中分别采用随机选取500、1000、1500、2000、2500、3000、3500、4000、4500、5000个页面作为输入页面,各算法运行的对比结果以图3所示。

从表2可以看出,基于CSS视觉分块的Web碎片信息抽取算法的查准率为97.14%,查全率为96.87%,均比基于统计理论的抽取算法、基于DOM树的抽取算法及基于归纳的抽取算法要好。在时间效率上,从图3可以看出,随着输入页面数量的增多,基于CSS视觉分块的Web碎片信息抽取算法越占优势。

4结束语

从半结构化的Web页面中抽取出相关的Web碎片信息,可以作为相关研究工作获取数据的重要前提,可以为研究人员获取相关的Web碎片信息,例如对于Web舆论导向研究具有十分重要的意义。基于CSS视觉分块的Web碎片信息抽取算法从CSS视觉效果出发,不仅考虑到浏览器的因素,更重要的是考虑了网页设计的对象是“人”的因素,从用户所见的视觉效果的角度对Web页面进行分块,可以快速地寻找出碎片信息所在的块,方便了信息的抽取,在一定程序上提高了碎片信息抽取的准确性与效率。目前,基于CSS视觉分块的Web碎片信息抽取算法已经被用于贵州省优秀科技教育人才省长专项资金项目——基于信息碎片与移动网络的信息传播与舆论导向研究中,作为前期获取信息碎片的主要工具之一,并体现出了较强的实用价值。

参考文献:

[1]王贤.基于树结构的DeepWeb数据抽取研究[D].昆明,昆明理工大学,2007.

[2]詹沐清,朱颖.基于Web的信息抽取技术探讨[J].中国科技信息,2013(4):69-70.

[3]王贤.基于统计的网页正文信息抽取方法的研究[J].中文信息学报,2004,18(5):17-22.

[4]GUPTAS,KAISERG.DOM-basedcontentextractionofHTMLdocuments[C]//Procofthe12thWorldWideWebConference.NewYork:ACMPresses,2003:207-214.

[5]李文,郑邦习,邓武.基于XML和DOM技术的Web信息抽取模型[J].大连交通大学学报.2013,34(3):96-99.

[6]刘军,张净.基于DOM的网页主题信息的抽取[J].计算机应用与软件,2010,27(5):188-190.

[7]那赫.基于DOM的Web主题信息提取系统的设计与实现[J].计算机与网络,2010(7):30-31.

[8]石倩,陈荣,鲁明羽.提出的基于规则归纳的信息抽取系统实现[J].计算机工程与应用,2008,44(21):166-170.

计算机视觉的意义范文篇6

[关键词]新媒体;VIDEO;技术;艺术;数码

观看先于词语表达,儿童在能说话之前就具备注视和认知的能力。

――约翰•伯杰

一、新媒体艺术的概念

简单地说新媒体艺术是指所有使用媒介和技术手段创作的艺术作品。严格地讲,这里的“媒介”不仅指各种技术,也包括各种新的材料。与任何一门学科一样,新媒体艺术是一门理论性和综合性非常强的学科。由于新媒体艺术还处在一个新生并且正在发展的阶段,因此还无法非常准确地给其下一个定义,在当下我们可以把新媒体艺术作为数字录像艺术、网络艺术、声学艺术、计算机艺术、网络广播等艺术作品的统称。

新媒体作为艺术的媒介形式有效地将纯粹的个人视觉认知创造转换成具有社会性的视像产品,同时又可以将已有的社会视觉现象有效地吸纳转换成极具个人特色的视觉资源,在互相消解中改变了“看”与“被看”的身份认同。什么是Video艺术?Video一词的直接词义是指电视、录像、视频。作为一种电子媒介,在电视、录像和视频出现之前,即20世纪的初期,摄影、霓虹灯、电视机械等手段已经在未来主义、达达主义、构成主义等现代艺术中被使用。从Video艺术在技术和观念上丰富的实践历史看,Video艺术在后来的发展中实际上已经远远超出了Video这个词在字典中所指的“电视、录像、视频”的含义。Video艺术几乎是一种以“电视、录像、视频”为核心媒介的多种影像处理、装置环境和视觉形态综合使用的艺术。他充分体现了当代艺术的拓展性和批判性以及技术在其中的用意。数字媒体艺术不单纯是对艺术本体思考的结果,也并非技术上的简单递进,它正日益与社会发生互动,也正是数字媒体艺术适应社会生活,反映社会生活的特别之处。

二、新媒体中VIDEO艺术的主要特征

由于科技的发展,Video艺术和电影如今仅在很多技术上有一些影像质感上的差异,在媒介层面即数字录像、光盘或者胶片之间实际上已经彼此转录。媒体和技术在我们的工作空间和程序中所引发的巨变超过了以往任何一个我们所熟知的时代。显而易见,它也在众多的艺术领域产生了重要的影响。媒体艺术,也就是录像、计算机图像、动画、网络艺术以及以最前卫的形式出现的交互/虚拟艺术和它的分支遥在艺术和生成艺术,已开始主导图像和艺术理论。比如一些Video作品先是用电影胶片拍,然后转录成DVD数字光盘在展示空间投影;或是先用DV拍摄,再翻转成电影胶片播放。我们正经历着从计算机控制的虚拟空间和图像本身,到那些显示独立生成能力和栩栩如生的生命系统图像,再到包罗万象的视觉和感官领域这一发展过程。也正是由于这样的原因,研究新媒体艺术的最佳方法之一是沿着技术性的线索展开研究。

(一)技术性

20世纪初期的艺术家们表现出了把技术融于艺术创作的特殊兴趣,立体主义艺术家发明了全方位观察和表现物体的形式,未来主义艺术家则对速度和运动感表现出了特别的幻想,他们的创造性活动,开创了20世纪以时间和运动为特征的动态艺术表现历史。大致可以归结为以光、机械、磁力、电器装置、电子系统化学反应等的内在艺术以及运用声波、幻灯投影、电影、电视的视觉技术创作的艺术作品。例如,20年代以马达、合成材料为主要技术手段的“活动艺术”(KineticArts);战后以各种复合材料为中心的“复合媒体艺术”(MixedMediaArts);60年代以电视媒介为主要技术的“影像艺术”(VideoArts);70年代以后以计算机为主要工具的“计算机艺术”(ComputerArts);80年代以后以数字技术支撑下的“数字艺术”(DigitalArts);基于计算机和人工智能技术的“人工生命艺术”(ArtificalArts)以及目前各种以传感技术为手段、具有反馈功能的、广义的“交互艺术”(InteractiveArts);各种与网络和软件技术相关的“生成艺术”(GenerativeArts)和“软件艺术”(SoftwareArts)等各种新形式的艺术。这些在新的技术环境中诞生的技术型艺术使人类的创造型活动朝着扩展传统艺术领域和美学概念的方向又迈出了一步。

(二)连结性

Video艺术创作需要经过五个阶段:连结、融入、互动、转化、出现。

新媒体可以通过两种方式进行操作:不在线方式,通过随身听、电脑和办公设施;在线方式,通过互联网。无论在线还是不在线新媒体凭借数码语言,可以将书面文字、视听资料和信息数据整合在一起。很多艺术家正是运用这种超链接进行艺术创作,最后会出现全新的思维、关系、影像与经验。

新媒体艺术以其与传统艺术完全不同的语言形态以及独特的方式关注着社会和生活。如网络艺术最大的特征是人们可以跨越地理和空间障碍进行交流和沟通,除此之外,网络艺术和一般交互艺术作品的不同之处在于网络艺术中的交互不局限于观众的“选择”,而是在图形或声音的程序中直接加入观众的命令,引发图像或声音产生无法预测的变化。同时,因为是在线交互,所以多位观众可以在同一时间从不同的地方与作品进行链接,发出各种指令,这样的即时和匿名现象所引发的许多不可预测的效果也是网络艺术作品的魅力所在。

(三)互动性

首先表现为艺术家与观众的互动。因为个人表达与个人创意已经由艺术家延伸到观众,人们对艺术家的要求不再是创作动人的内容,而是设计环境、空间,让观众能够参与其中。还有艺术家与智能化机器的互动。在互动性Video中,图像在真实时间中的瞬时传统打开了新的途径,从而确立了计算机艺术的特性以及它要求成为一种全新艺术媒体和风格的主张,这样的风格建立在一个真实和虚拟之间的分界点上。但也有批评家认为,艺术中的计算机首先不应作为新媒体对待,而应作为“概念”的内容。从一种历史主义的观点,如果现代主义主要关注新媒体和进步的概念,并且概念艺术可以被视为导向现代主义和后现代主义的分水岭,那么计算机艺术则可以被理解为连续的所有三个组成部分,保持对新媒体的关注,一个概念的定位,一种对互动性的专注。但这种互动或许体现在间接的不在场和直接的在场,或许是根据观众的理解直接去完成作品,或许是按程序演绎别的样式。由于艺术与技术的共生关系,往往艺术家无法独自完成,必须向资讯、工程、物理学家、生物学家等专业人才寻求辅助。这也象征着艺术家身份的转移。

“互动艺术”一词在20世纪90年代初开始使用,它界定了多种媒体的实验和革新的广泛范围。互动艺术展现了一种数据(图像、文本、声音)的流动和一系列虚拟的智能结构、环境和网络(像表演、事件、个人经历和私人体验)。在这样一种方式中,观众能影响这种流动,修改结构、环境或驾驭网络。对艺术的互动性问题不能不提的一个贡献是彼得•韦伯(PeterWeibel)致力于互动艺术的特辑《艺术论坛》和题为《在系统的网络中》的文章。伴随着录像和录像装置的出现,互动性开始成为录像艺术超越其他传统艺术媒介的优势。数字化的出现使计算机作为一种创造工具的互动性自由的服务于艺术家和公众。计算机化模拟的独创性和互动影响的组织化使观看的概念之路更加具象化。

三、VIDEO艺术的美学思考

Video艺术作为一种新的艺术意识形态,它与社会环境、科技发展、经济基础有着密切的关系。显然,随着照相和电影以及今天随着数码技术和其他后照相的已经能在三维空间里模仿抽象的、平面的、“不存在”的物体种种高尖端方式的成像设备的出现,另一个再现真实的重要界线被穿越了。所有这些手段都提出了主体特性对抗称之为眼睛客观特性这个问题:影像的经验性真相(图像永远不撒谎,一个在言说之时不攻自破的谬见)。就像摄影术和电影胶片是上个世纪之交的重大视觉技术发展一样,数码技术是一个新的世纪之交的视觉技术发展。同样,它也必然会影响到视觉艺术的发展。

就Video艺术创作来说,它是社会发展的必然产物。“艺术品”的概念总是受制于历史的变迁。一种形式会在某一时期享有特权并获得牢固的地位,直到它被另一种形式所取代。任何被称为艺术品,也因此值得被铭记的事物,就像莫里斯所证实的那样,会受制社会群体的架构。一件艺术品象征并汇聚了关于世界的特殊的艺术观念。除了所有风格上的不同外,它聚集了概念、意识和假设,美的取向和标准,并且有意无意地遵循着社会的风格。新媒体艺术在西方已经有40多年的历史,作为一种艺术形态,它从反叛传统开始,逐渐为社会所接受,到今天已经发生功能性的变化,并广泛影响到社会的各个层面。一件开放式的作品,依赖于当时观众的交互或者遵循博弈论的高级变┝俊―作品被假设为一种游戏,观众遵循“自由程度”而成为游戏者――这是图像失去其历史记忆和见证能力的有效方式。取而代之的是一个以持续的技术系统为框架的、短暂的、任意的、不可再生的、无限的可操作图像。作为一个独立体的艺术品已经消逝。计算机可能成为信息最好的储存库,只要操作系统或者存储的媒介不过时,但是它无法记录或者复制一件物质化了的艺术的感觉。特别是在这个图像泛滥的时代,任何人面对这些鲜活的图像,都不会无动于衷。除了我们所熟悉的事物,新媒体生成的虚拟现实还允许我们进行不仅限于物理规则的美学创造,随着科技的发展这种创造会更加真实、引人入胜。感知的潜能将处于失重状态,在图像的世界里漂流触摸并传递到新媒体创造的生物,表面和文本的改变,个体或集体经历的庞大得可怕的空间,迅速变化并导致人的欣赏的麻木,感觉的高度、深度、和速度。被沃尔特•本雅明判断为电影审美创造的“震撼”,将完全有可能以更明智的方式得到复兴和强化。

随着科学技术的发展,计算机的出现和逐步普及,信息对整个社会的影响在逐步提高,逐步在实现着尼葛洛庞帝描述里“数字化生存”的社会景象。由于社会发展外在与内在种种因素的改变,无论科学技术会给艺术带来怎样的前景,可以明确的是,在信息时代,由于科学技术与艺术的融合带来了美学结构性上的变化,使新媒体艺术呈现出多学科交叉,科学与艺术、现实与虚拟、大众化与个性化之间的整合特点。人类的发展是没有终极的,艺术的进化也是不可穷尽的,艺术的生命力就在于无止境地推陈出新。

[参考文献]

[1][德]奥利弗•格劳.虚拟艺术[M].北京:清华大学出版社,2007.

[2]陈玲.新媒体艺术史纲[M].北京:清华大学出版社,2007.

[3][法]吉尔•德勒兹.时间―影像[M].长沙:湖南美术出版社,2005.

[4]王南溟.观念之后艺术与批评[M].长沙:湖南美术出版社,2006.

[5]徐沛君.传媒与当代艺术[M].南昌:江西美术出版社,2007.

[6]孟建,[德]StefanFriedrich.图像时代――视觉文化传播的理论诠释[M].上海:复旦大学出版社,2005.

计算机视觉的意义范文篇7

关键词:Halcon振动实验平台图像采集处理系统

中图分类号:TP391.41文献标识码:A文章编号:1007-9416(2015)11-0000-00

1研究的背景及意义

伴随着计算机技术、通讯技术及工业相机技术的发展,用视觉方法实现对环境中有效信息的采集及提取变得越来越重要。振动现象大量存在于工业环境中,如何对振动模糊图像进行处理、分析及特征提取,是一项具有工程应用价值的研究课题。课题结合冶金车间天车调运钢包的环境,考虑到天车调运过程中存在的振动现象,通过对振动模糊图像的处理、分析,得到环境图像的特征。为了模拟实际振动环境,设计了单质体振动实验平台,模拟不同振幅、频率的调制,并实时采集振动模糊图像,基于HALCON软件实现对振动图像的复原处理,课题对研究振动模糊图像的处理、分析及特征提取,解决振动环境下的图像信息利用问题具有重要意义。

2基于振动实验平台的视觉系统

单质体振动平台主要有振动平台基础、减振弹簧、上质体、激振器、相机、相机支架六部分组成。可在激振器的激励下做横向、纵向、上下的三维振动。振动平台的振动机构主要由两台振动电机和传动板构成,振动电机的型号决定了三维振动平台的主要技术参数。减震机构主要由减震弹簧组成。单质体振动平台的机械结构图如图1所示。

3基于Halcon的图像采集与处理

Halcon机器视觉算法软件包由德国MVtec公司开发,包含了众多独立的图像处理、机器视觉函数,极大的方便了机器视觉的应用。Halcon与Linux、Windows、Unix等兼容,通过HDevelop工具可以用C、C++、C#、VB等多种普通编程语言访问Halcon函数库。在图像采集方面,Halcon充分照顾到了目前存在的众多款式的工业相机接口问题,可为百余种工业相机、图像采集卡提供接口应用,常用的如GigE、1394、USB等形式的相机接口。

HDevelop为HALCON交互式编程环境,可方便、有效的满足用户的图像采集及处理等方面的需求。当图像处理结果或视觉应用程序满足用户需求时,可将Halcon代码转换为C、C++、VB等源代码,进而集成到应用程序中。

Halcon函数库极为丰富,常用的功能有:图像滤波、图像增强、亚像素边缘提取、Blob分析、图像分割、形态学处理、几何变换、模式匹配、条码及二维码识别、三维标定、双目立体视觉等。可方便的满足工业、科研等领域的应用。Halcon图像采集系统的相机选用德国映美晶DFK23G274工业相机,其主要性能指标为:相机分辨率1600像素×1200像素;像素尺寸4.4×4.4μm;帧速率20fps;输出方式为千兆以太网;外部触发或内部触发。镜头选用日本pentax工业镜头,C接口形式。视觉系统构成框图如图2所示。

采用Halcon软件可方便的实现图像的采集、处理及特征提取。相机安装驱动程序并进行千兆网卡配置,设置网络的IP地址后,即可打开相机进行实时图像采集。编写Halcon程序时,首先打开HDevelop,采集目标图像,打开算子菜单,应用算子及后继算子对图像进行相关处理,目标图像处理及特征提取如图3所示。

参考文献

计算机视觉的意义范文篇8

(广东农工商职业技术学院,广州510663)

(GuangdongAIBPolytechnicCollege,Guangzhou510663,China)

摘要:本文就计算机视觉的理论框架进行阐述,对计算机视觉理论框架存在的问题进行分析,提出计算机视觉理论框架的新发展,以确保通过计算机视觉获得的景物信息更加完整。

Abstract:Thispaperexpoundsthetheoryframeworkofcomputervision,analyzestheproblemsoftheoryframeworkofcomputervision,andputsforwardnewdevelopmentofthetheoryframeworkofcomputervisiontoensurethatthesceneinformationobtainedthroughcomputervisionismorecomplete.

关键词:计算机视觉;理论框架;问题;新发展

Keywords:computervision;theoryframework;problems;newdevelopment

中图分类号:TP391.4文献标识码:A

文章编号:1006-4311(2015)02-0209-02

0引言

在计算机系统中,计算机视觉是通过模拟人类视觉,从而对不同事物进行相关描述,以获得更全面的信息。随着计算机视觉在文字识别、漫步机器人和导航中的成功应用,计算机视觉的理论框架研究显得越来越重要,对于促进我国计算机应用技术水平不断提升具有重要意义。

1计算机视觉的理论框架

随着计算机视觉的不断研究和总结,从二维景物图像发展到三维景物图像,计算机视觉的理论框架主要有如下三个:

1.1计算视觉理论框架在七十年代中期,有关研究人员提出了第一个计算机视觉理论框架,即计算视觉理论,将视觉过程看作是信息处理过程,并将信息处理过程分为三个不同的层次,它们分别是计算理论层次、数据结构层次和硬件实现层次,从而对计算机视觉进行全面分析。根据相关数据和资料显示,视觉是对图像的位置、形状和特征等进行描述,因此,计算理论层成为了研究的重点,进而将视觉过程看作是从二维图像信息中对图像进行重塑,从而将三维物体的形状、位置和空间等反映出来,最终形成三维图像。由此可见,早期的视觉处理是从输入的二维图像中获得二维要素图,即图像中强度变化较强时的位置和几何分布情况、结构等;中期的视觉处理是从二维要素图中获得二点五维图,即以观察者为中心,对表面的法向、深度和不连续的轮廓等进行观测。虽然二点五维包含的深度信息比二维要多,但还不是真正意义上的三维表示,而仅仅是有多个相对独立的视觉模块组成的,在相关研究中被称作是“shapefromX”模型,将运动视觉、立体视觉等融入到其中;后期视觉处理是指从二点五维图中获取物体的三维描述,从而将场景中的物体识别处理,确定物体的确切位置和姿态。

1.2基于知识的视觉理论框架在计算机视觉理论中,基于知识的视觉理论框架,是围绕感知特征群集来进行相关研究的,从而通过人类感知的经验来描述目标,最终确定物体在场景中的真正位置、形态等。相关研究人员认为,基于知识的视觉理论可以通过知识的引导来直接完成三维重建,以将相对应观察方向保持不变动二维特征称作是非偶然性聚类,而人体中视觉识别发挥重要作用的一种感知组织,通过对非偶然性聚类的检测,可以有效辨别出目标。因此,首先是利用感知组织来提取图像中相对于观察方向大范围变化,并且保持不变的分组和结构等;然后,利用概率排队的方法来进行模型匹配,从而缩小检测空间;最后,通过对观察点的未知求解和寻找模型参数对应关系,使三维模型的投影和图像得到最合适的匹配,最终完成三维重建。

1.3主动视觉理论框架第三种计算机视觉理论框架是中东视觉理论矿坑,是根据人类视觉的主动性特征提出的。由于人类视觉会根据自己的意识选择视野范围内所看见的事物的主次,从而移动身体、转向或者改变视角,因此,人们的视觉过程是与所在环境交互感知和动作的过程。在计算机视觉理论框架的主动视觉框架中,视觉行为不需要三维物体的相关精确信息,就可以完成物体重建。主动视觉系统根据所需的物体对象特征、分析结果和当前要求等,通过控制摄像机的相关操作,如取向、位置、焦距等,就可以完成相关处理任务和信息交换。与此同时,主动视觉还可以用改变摄像机的参数和处理摄像后的数据等,使图像的时间、空间和分辨率等发生变化,从而增强图像的感知效果。

2计算机视觉理论框架存在的问题

现展中,计算机视觉理论框架的提出,是计算机视觉领域研究的重要突破,而在这个发展过程中,存在着如下一些问题,影响计算机视觉理论框架的更完善构建。由于视觉过程是成像过程的逆过程,存在着混合、投影、噪音和畸变等干扰因素,使图像三维重建存在不稳定性和不确定性,因此,从一幅景象到多幅景象的重建存在很多困难,使三维图像的准确性和通用性大大降低。并且,计算视觉理论认为输入是被动的,整个视觉过程自下而上不存在反馈,处理目的没有发生任何改变,因此,对物体的确切位置和形状有一定要求。另外,有关学者提出计算机视觉理论框架没有充分运用知识,对知识表达没有给以高度重视,从而忽略知识推理和知识库的构建,没有对空间约束和场景假设进行充分考虑,从而使场景假设受到局限。并且,没有进行多次的分析和试验,致使计算机视觉理论框架构建存在很多问题。

基于知识的理论框架忽略了计算视觉理论的重要性,认为人类视觉和重建无关,然而,在进行物体尺寸判断、物体距离估算等情况时,光靠识别是不够的,必须要依靠三维重建,才能将物体的确切位置、形状等准确地描述出来。

主动视觉理论没有排除三维重建,通过改变摄像机的参数和角度等,来改变物体空间、时间和分辨率的感知效果,从而对图像出来过程进行相关约束,使很多不稳定和不合适的问题得到有效解决,最终完成三维重建。运用主动视觉理论框架,可以大大降低问题的难度,但主动视觉理论框架仍存在缺乏高层知识指导的问题,导致主动视觉框架还不够完整,使计算机视觉理论框架构建受到一定影响。

3计算机视觉理论框架构建的新发展

在计算机视觉理论框架的构建过程中,计算视觉理论比较系统地解释了从二维图中获取三维物体形态的方法和可能性,而基于知识的实际理论和主动视觉理论则对计算视觉理论进行了补充和进一步提升。因此,计算机视觉理论框架的新发展,可以以计算视觉理论为主,将基于知识的视觉理论和主动视觉理论结合到一起,从而使计算机视觉系统框架变得更加完善。

在实际应用过程中,将早期视觉处理分为图像分割、图像预处理和二维模式识别等,以对二维图像进行滤波降噪和图像增强等,因此,不需要知识引导和控制视觉目的。在图像分割、二维图像模式识别、中期处理、后期处理和三维模式识别的过程中,没有知识引导和模型匹配,最终得出的图像效果会更好、更完整。在早期视觉处理和后期视觉处理中,二维模式和三维模式的识别,需要根据物体的实际情况来确定,由于特征、模型等各不一样,所以,二维物体和三维物体的描述方式也各不相同。由于二维信息的质量会影响三维信息的效果,因此,在计算机视觉中,二维信息应当给以高度重视。而模型库和视觉目的的应用,为计算机视觉理论框架构建提供了更多的信息。由此可见,在计算机视觉系统中,通过视觉目的来进行物体形象、位置等的输出判断,同时,运用视觉目的可以对图像分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别等进行有效控制,最终使三维重建的图像信息更加完整。

4结束语

随着高科技信息技术的不断推广,计算机视觉理论框架的研究已经成为目前重点关注对象之一,虽然取得了一定的成绩,但计算机视觉理论框架构建还不够完善。因此,计算机视觉理论框架未来的发展,需要对计算实际理论、基于知识的视觉理论和主动视觉理论进行更深层次的研究,将理论和实践应用紧密结合在一起,从而使计算机视觉理论框架研究的成果可以更加辉煌。

参考文献:

[1]尹宏鹏.基于计算机视觉的运动目标跟踪算法研究[D].重庆大学,2009.

计算机视觉的意义范文

由于人们对于信息的获得和感知绝大多数都是通过视觉,因此视觉传达是一项十分重要的信息传递方式。人们通过对文字、图像、色彩等基本元素的观察,来获取相关的信息。因此信息的发送者利用发送相关的文字、图像、数字、视频、摄影、模型等具体内容,向人们进行信息的传递。而视觉传达设计就是将以上这些内容进行修饰和美化,使其具有更高的艺术性和观赏性,让人们在观察这些内容的同时保持愉悦的享受,以便更好的获取信息。视觉传达设计涉及到很多的领域,例如街道上的广告牌、产品的包装盒、舞台效果的设计、网络媒体的宣传等。所包含的元素有字体、图形、色彩、标志、排版、印刷等。例如,在中央电视台播放的公益广告“FAMILY”当中,设计者将字母进行拟人化的设计处理,用这些字母来比喻家庭当中的爸爸、妈妈和孩子。利用时间的快速流逝,将父母变老、孩子长大的过程体现了出来。通过设计的动画内容,让人们看到了小时候孩子不懂事,经常顶撞父母,让父母伤心。而长大后明白了生活的责任,照顾父母并成为了父母的依靠。广告中对于字母的图形设计和动画的形象设计,起到了很好的视觉传达效果,给人们带来了极大的视觉冲击。通过对家庭内涵的诠释,激起了很多人对亲情的渴望和重视。而如果仅仅使用文字和图片,是无法达到这种效果的[2]。因此,视觉传达设计在信息传递当中具有很重要的意义。

2计算机图形图像设计和视觉传的设计的关系

2.1二者的共同点。从某种意义上来讲,计算机图形图像设计和视觉传达设计之间使相同的。二者在应用的过程中都会应用到色彩、绘画、平面设计等方面的技术。而二者不但具有十分相似的发展经历,其对于现代的设计风格和设计方式都是共通的。在美学赏析的角度,对于点、线、面、体、光、形等方面的排列原则也是相同的。在对于符号的创造和运用,也是基于相同的文化基础。

2.2二者的不同点。在某些方面,计算机图形图像设计和视觉传达设计又存在着很多的不同之处。具体可分为以下几个部分:(1)设计背景。计算机图形图像设计则是在上个世纪中后期,随着计算机技术和多媒体技术的不断发展,才逐渐开始兴起和推广,并且从二维领域向三维领域进行过渡。而设觉传达设计是在二战之后,利用绘画和广告的方式,逐渐得到发展,使沟通系统发生了改变。(2)设计目标。计算机图形图像设计的目的使将动态与静态进行有机的融合,形成相应的造型,同时实现对二维空间以及三维空间的塑造。而视觉传达设计则是为了增强目标形象的艺术感和美感,提高其欣赏价值,同时对媒体动态进行掌握。(3)设计原则。计算机图形图像设计使进行色彩与图形、动态与静态的有机融合,注重的是相关素材的开发和软件技术的应用。而视觉传达设计则是目标的形、意、像等元素进行转换,使其呈现在点、线、面、体之上,从而带来更好的视觉效果。(4)设计技术。计算机图形图像设计需要具备熟练的计算机操作技术和相关软件的实用技巧,包括制图软件、绘画软件、视频编辑、照排印刷等口技术。而设觉传达设计不但重视广告设计、包装设计等方面的技术,还对相关的理论知识非常重视。

3计算机图形图像设计和视觉传达设计的结合应用

3.1文字设计。在图形图像的设计中,文字设计是最为基本的应用。传统的文字设计中,很多制图软件和文字处理软件都能够实现对字体、字号、颜色、造型等简单的艺术处理[3]。而图形图像设计的应用,带来了不同的效果。通过专业的图形图像设计软件,可以使文字发生不同的变化,而不同的文字形象可以带来不同的视觉传达效果,以应对不同的需求。例如,一些商家在进行节日促销时所使用的文字宣传广告,可以体现出很强的节日气息,大大提高了广告的效果。

3.2包装设计。人们在商场或超市逛街购物的时候,能够吸引人们兴趣的主要是独特的包装设计。而这些包装的设计需要计算机图形图像设计和视觉传达设计的应用,才能达到更好的效果。包装是商品实现其价值和使用价值的重要渠道,要想吸引人们的注意,达到更好的视觉传达效果,就需要利用计算机图形图像设计对其进行改造,使其更具艺术性和视觉冲击力,进而提高人们对其的关注,以达到视觉传递信息的效果。

3.3插图绘画设计。在计算机图形图像设计的相关软件当中,通常都具有绘画和调色的功能。因此,很多设计师在进行插图绘画设计的时候,先利用铅笔绘制草稿,然后利用这些软件进行艺术设计和调色处理。此外,世界上很多像素画设计师也是利用计算机图形图像技术来进行创作,结合视觉传的设计的要点,创作出了很多优秀的绘画作品。

3.4界面设计。在很多计算机、平板电脑、手机等电子产品的应用界面当中,都运用到了计算机图形图像设计和视觉传达设计。这两项技术的结合应用,使得这些电子产品的界面具有很强的观赏性和艺术感。在保持原有功能和可操作性的基础上,体现出了更高的艺术品质,使人们在使用这些电子产品的同时,也能获得视觉上的享受。

4结束语

计算机视觉的意义范文篇10

关键词:计算机辅助环境艺术设计起源现状及发展

随着计算机软硬件的进步,计算机辅助设计逐渐成为建筑效果图表现的主流。所谓计算机辅助环境艺术设计是指设计师通过计算机技术表现设计意图,最终以图像的方式告知客户,使客户清晰地理解设计师的设计意图和创意,它是一种更为直接、有效的表现方式,通常又被人们称为计算机建筑效果图。

一、计算机辅助环境艺术设计的起源

计算机的发展及应用,使人们的生活日新月异。计算机辅助设计源于计算机图形技术的产生,计算机辅助设计的研究构想发端于1950年,但使用计算机绘图的最早记录是在1963年,美国麻省理工学院的研究人员伊凡·苏泽兰在美国计算机联合会会议上发表了名为《画板》的博士论文,从而开始了计算机辅助设计的发展历程。他从1950年开始着手开发通过图形技术来处理人与电脑交互对话的操作系统。1963年,这套以电脑主机、显示屏、光电笔和键盘为工具的图形画线系统得到实现。这套图形画线系统开发和引进了许多计算机绘图的基本思想和技术,使用户可以运用电脑画出直线、复杂曲线以及简单的标准部件。

最初CAD被解释为“计算机辅助绘图”,由于当时计算机在设计上的作用是替代传统手工绘图的一种新工具,但随着后来信息技术的飞速发展,计算机技术在各领域的广泛应用,CAD的含义也在不断变化扩展,随着20世纪70年代像素的产生、80年代三维曲面造型系统的开发等,使电脑绘图从只能用“线”这一基本绘制元素发展到可以用点、面、体进行绘制计算机图形,从而使CAD的含义也发展成现在人们比较熟知的计算机辅助设计这个概念了。1970年的威尼斯双年展首次接纳了计算机绘画作品,这也标志着新的视觉艺术形式的诞生得到了社会的承认。

我国的计算机辅助设计起源于20世纪70年代。与国外计算机辅助设计发展的轨迹相似,国内计算机辅助设计的研究与应用基本上是从各高等院校发展起来的。20世纪90年代初,随着我国现代化进程的迅速发展以及计算机的进一步普及,在环境艺术设计和创作领域,计算机技术应用的价值,逐渐得到人们的重视。

二、我国计算机辅助环境艺术设计的现状

计算机作为信息时代重要的技术工具,在环境艺术设计领域得到普遍应用。在20世纪90年代前,国内对环境艺术设计效果的表现是使用手工绘制的方法,到了20世纪90年代初期,计算机辅助设计技术开始在我国建筑业应用。计算机辅助设计技术在建筑设计表现领域以不可逆转的潮流迅速发展。尤其是到了20世纪末,计算机辅助设计逐渐成为建筑效果表现的主流。起初,设计师主要运用AutoCAD软件进行施工图的绘制,在方案阶段还以手绘为主。但随着相关专业软硬件的更新和进步,它自身的强大优势得以显示,同时对传统手绘表现产生了越来越大的冲击。

随着近十几年来我国计算机辅助环境艺术设计的发展,计算机建筑效果表现的类型己经有了很细致的划分,可以分为:计算机建筑效果图、计算机建筑漫游动画和计算机建筑效果虚拟现实。计算机建筑效果图主要是通过3DSMAX,Lightscape,Photoshop等计算机软件制作的静态的效果图。通过计算机三维软件从平面、立面数据中得到透视图,透视点位置及视点角度均可变换,然后再渲染出二维图像,这种方式是目前社会上应用最广泛的。计算机漫游动画是利用3DSMAX软件的三维动画功能,在建筑物的室内或室外的设计阶段就能以可视的、动态的方式全方位展示建筑物所处的地理环境、建筑物外貌和各种附属设施以及建筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。

三、计算机辅助环境艺术设计的发展趋势

当前,随着计算机软硬件技术的迅猛发展,计算机辅助设计在环境艺术设计领域受到了广泛的重视和应用,比如各种方案的汇报、投标以及招商广告中随处可见,从而出现了大量的绘图软件的教程以及在教学上更加重视计算机绘图软件的教学课程。人们更多的关注计算机技术,想方设法掌握各种绘图软件,在模型、材质、灯光以及各种渲染技法上花费大量的时间,而忽略了最终的效果图的艺术性。计算机辅助设计是科学与艺术以及计算机与艺术设计相结合的边缘学科。计算机辅助设计在视觉艺术创造规律、形式法则和审美方法与传统的艺术设计是相同的。所谓视觉艺术,是通过人的视觉感受而将客观内容纳入主观心灵并予以对象化呈现的艺术形态。一些美学研究者认为,从审美主体的角度来看,艺术离不开创造者和欣赏者两个方面,而这两个方面都要通过一定的感官和相应的感性物质媒介,前者创造出审美对象,后者达到审美愉悦。所以说,作为视觉艺术的计算机辅助设计作品既要真实的描绘场景,又要使欣赏者达到审美偷悦。不可否认,人们的欣赏水平在不断提高,求新、求异的视觉口味也越来越高。这源于技术的发展、审美的进步,计算机技术的发展对于社会和艺术创造产生了重大的推动作用。

在计算机辅助环境艺术设计发展的初级阶段,设计师的目标是使效果图具有真实感,能够模拟未来场景的真实效果,具有一定的实用性。目前的计算机建筑效果图的风格单一,已经不能满足大众的不断提高的视觉口味。计算机建筑效果图既是表现的技术同时它又是视觉艺术。设计师创造出审美对象,筑物内部空间的效果,使人们能够在未来的建筑物中漫游,因而成为建筑设计方案及装修效果展示、建筑方案投标、论证、评审的有力工具。使用的软件有Creator系列三维建模工具及Vega场景管理软件。计算机建筑效果虚拟现实技术强调的是一种身临其境的感觉,采用的是人与人之间自然的交互方式。它可以实现逼真的、纯三维的场景,可以全方位、多角度、完全由用户自由控制在场景中漫游。作为建筑师可以从多个角度观察建筑方案,所以说虚拟现实技术不仅可以使用于建筑表现,而且也是一种推敲方案的有利手段。VR技术在我国的环境艺术设计领域中有着广泛的应用前景,将给环境艺术设计带来革命性的改变。

设计师创造出审美对象,要使欣赏者达到审美愉悦而不是审美疲劳。为此,根据目前我国计算机辅助环境艺术的发展情况,未来计算机建筑效果图应呈现艺术化、人情化和多样化趋势。

参考文献:

[1]邓庆尧.环境艺术设计[M].济南:山东美术出版社.

[2]张绮曼.中央工艺美术学院环境艺术设计系—室内设计的风格样式与流派[M].北京:中国建筑工业出版社.

[3]张绮受.中央工艺美术学院一环境艺术设计与理论[M].北京:中国建筑工业出版社.

计算机视觉的意义范文1篇11

工科学生的数学学习目标是学会数学工具并用以解决工程问题,因此学习的重点应该是数学思想和概念、如何建立数学模型并获得正确的结果。采用数学软件辅助教学,将复杂的数学计算交给软件完成,把宝贵的学习时间更多的投入到数学模型的建立上,一方面可以提高学生学习积极性、提高课堂效率,另一方面提高学生应用数学工具分析、解决问题的能力,解决工程问题。常用数学工具软件有Matlab、Mathematica、Mathcad、Maple等,其中又以matlab应用最为普遍。Matlab是matrix和labo-ratory两个词的组合,意为矩阵实验室,是美国MathWorks公司的主要面对科学计算、可视化以及交互式程序设计的商业数学软件,将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了C、Fortran等传统程序设计语言的非交互式编辑模式。Matlab的数值计算、符号计算、可视化图形显示等功能为工程数学的学习提供了便利工具。

1.1数值计算数值计算与分析在现代工程技术和科学研究中得到越来越广泛的应用,这使得现代科技越来越依赖数学工具的同时,也促进了数值计算与分析技术的发展。Matlab软件的功能很强大,但是最成熟、最强大的还是其数值计算与分析功能。Matlab在数值计算方面主要有矩阵的定义、运算、分解、线性与非线性方程组的数值解、系数矩阵技术、多项式运算、插值与拟合、差分与导数、数值积分、微分方程的数值解、数理统计等,Matlab数值计算的部分功能函数如表2所示。

1.2符号计算在科学研究和工程应用中,除了大量数值计算外,有时需要对符号对象进行运算,得到以符号形式表示的比数值计算更一般的结果。Matlab基于Maple内核,开发了用以进行符号计算的符号运算工具箱(SymbolicMathToolbox),可以完成包括符号函数与符号方程的定义、运算、复合、化简,符号矩阵算,符号微分,符号积分,符号代数方程和符号微分方程求解,符号积分变换和符号特殊函数在内的几乎所有符号运算功能。在Matlab中通常先用sym或syms来构造符号变量和符号表达式,再用工具箱的中函数求解。极限是非常重要的概念,是基本的数学工具,是工程数学教学中的重点,也是工程数学教学中的难点,采用Matlab软件,可以通过limit函数实现函数极限运算。

1.3图形绘制和数据可视化工程数学中常常会遇到各种图形,图形绘制、特别是空间立体图形的绘制,往往繁冗复杂,难以得到理想的图形和效果;工程计算中的大量数据对于普通用户而言,往往是复杂抽象、晦涩难懂的,如果能用图形表示数据,直观地显示数学函数、计算数据和仿真结果,能达到事半功倍的效果。Matlab具有数百个和图形操作方面的命令和函数,不仅可以绘制二维、三维甚至四维图形,还可以对图形的线型、平面、色彩、光线、视角等要素控制,使绘制的图形尽善尽美。基于Matlab等数学工具软件的工程数学教学,具有便于理解抽象概念、理解记忆数学定理、建立空间思维模型、拓宽数学的知识面、节约学习时间等优点,但是过多依赖于软件,又会影响学生抽象能力的提高、影响学生手算能力的训练和提高,同时具有重工具轻理论的倾向。

2基于3D软件的机械专业课程教学技术

3D软件具有三维几何建模、二维工程图等功能,可以将抽象的三维几何模型自动转化为二维工程图形,建模简单、操作方便,因此,基于3D软件进行专业课程教学,不仅可以降低空间抽象想象能力要求、解放学生,而且可以提高效率。

2.1辅助机械制图教学机械制图的核心是要将三维空间在二维图纸上表达,不仅有抽象的空间想象,而且要进行投影计算,机械制图课程历来是机械工程专业学生最头痛的课程之一。机械制图教学中,常规的方法是教师借助于模型及各类挂图以及大师的立体图和三视图进行有效教学,而学生也需通过不断反复的训练,并进行立体图和三视图的不断比较才能达到一定的教学效果,但是效果依然不如意。借助于3D软件,完成机械制图中用到的各类模型的创建,而且,可利用其动态剖视功能,随心所欲的展示结构的内部结构及任意位置的剖面情况,再通过模型生成所需的各类工程视图,清晰、形象而生动的完成知识的教授。Solidworks软件功能强大、操作简单方便、易学易用,是目前市场上所见到的三维CAD解决方案中设计过程比较简便而方便的软件之一,由此得到了广泛的应用。教学过程中,可以利用Solidworks高精度、高质感、形象逼真、色彩丰富的特点,将复杂形体的外形和内腔、相贯线的变化趋势、装配体各零件之间的连接关系、配合关系等充分展示出来,简化教学,而且可以根据教学需要,作适时修改,达到低成本、高质量的教学目的。

2.2辅助机械原理课程教学机械原理中的各种机构,不管是采用图解法还是解析法求解都是静态的,如果采用SolidworksMotion将物理模型与工程条件关联,利用其提供的多种代表真实运行条件的运动副和作用力选项,如铰链、螺钉、万向节等复合运动副、阶梯函数和谐波函数等输入函数;线性和非线性弹簧、力、力矩和3D接触等,捕获或定义零件间的相互作用,使用功能强大且直观的可视化工具来表示任意点的位移、速度、加速度、运动副位置上的力向量等在整个模拟期间的轨迹,同时检查装配体移动时碰撞的零件等,使参与产品开发过程的所有人都能够轻松、高效地协作并共享分析结果。

2.3辅助机械设计课程教学可以利用Solidworks软件的装配功能及动画模拟功能进行充分的展示,达到形象、生动的教学效果,利于学生掌握相关的知识点,利于验证各种设计的合理性。另外,利用Solid-works快捷的多配置功能及系列化零件的功能,可迅速地完成系列化零件的创建工作。Solidworks的插件Animator可用于制作产品的演示,交流设计思想,同时能有效促进多方设计人员的协同工作。使用Animator能将Solidworks的三维模型实现动态的可视化,并且及时录制产品设计的模拟装配过程、模拟拆卸过程和产品的模拟运行过程,将设计者的意图更好地传递给各户。

2.4辅助工程力学教学Solidworks软件提供了强大的有限元分析功能,可在Solidworks环境下迅速、准确的完成构件的应力、应变、受力分析,进行强度分析、优化设计等工作,在工程力学教学过程中,利于学生掌握各相关的知识点,并学会利用现代化工具优化设计的方法及理念。

3基于VR技术的设计与体验

VR,全称为VirtualReality,虚拟现实技术,由拉尼尔(JaronLanier)在80年代初提出的,也称灵境技术或人工环境,是一种基于计算机的高技术模拟系统,集成了计算机图形技术、计算机仿真技术、人工智能、传感技术、显示技术、网络并行处理等技术,其特点在于计算机产生一个以视觉感受为主,也包括听觉、触觉的综合可感知的人为虚拟环境,从而使得在视觉上产生一种沉浸于这个环境的感觉,可以直接观察、操作、触摸、检测周围环境及事物的内在变化,并能与之发生“交互”作用,使人和计算机很好地“融为一体”,给人一种“身临其境”的感觉。虚拟现实系统组成包括硬件和软件,其系统模型如图4所示,系统硬件主要是输入工具和演示设备,如头盔式显示器、跟踪器、传感手套、屏幕式、房式立体显示系统、三维立体声装置;软件包括VRP、Quest3D、Patchwork3D、EONReality等。在工业设计中,利用VR技术和科学计算可视化技术,根据产品的计算机辅助设计(CAD)模型和数据以及计算机辅助工程(CAE)仿真和分析的结果,所生成的一种具有沉浸感和真实感,并可进行直观交互的产品虚拟样机。VR在机械工业中的应用主要有工业园模拟、机床模拟操作、设备管理、虚拟装配和工控仿真。由于VR技术本身特性的原因,所以从事以上相关工作的模拟就变得十分方便、快捷,并能做到真实和准确。

4结语

计算机视觉的意义范文1篇12

【关键词】多模态;多媒体大学英语;口语教学;

科技的日新月异及媒体的普及丰富了信息的传递方式,如音频、视频、肢体动作等。由此,多媒体技术和多媒体设备也广泛应用于课堂教学中,使得传统课堂变得多模态化(multimodality),各种符号资源如语言、图像、声音、颜色、空间结构等被用来完成意义表征,实现教学目的。与此同时,人们也越来越关注多模态与多媒体对教学的影响及如何趋利避害。本文首先对多媒体与多模态进行区分;然后讨论在多模态话语理论框架下,现代多媒体技术在大学英语口语教学中的应用,探析口语教学中存在的多模态符号;从而推导出大学英语口语教学中模态选择应遵循的原则,以最优化口语教学的效果。

一、多模态与多媒体

1.多模态

模态指人类通过感官(如视觉、听觉、触觉等)同外部环境(如人、机器、物件、动物等)的互动方式。单个感官的互动叫单模态,两个的叫双模态,三个或以上的叫多模态。这个定义跟计算机科学里研究人机互动时对模态的定义接近(参见Hill,2000)。依此定义,正常人之间的互动都是多模态的。

2.多媒体

物理媒介指装载内容或信息的物理介质,如纸张、磁带、磁盘、光盘、硬盘等。

逻辑媒介指物理介质上承载内容或信息的编码手段,如文字、模拟音频流、数字音频流、图像、视频流等。一般用逻辑媒介来界定某个内容是否是多媒体材料。单逻辑媒介的叫单媒体,两个的叫双媒体,三个或以上的叫多媒体。如:声音录制在磁带上是单媒体材料,文字、图像印在纸介上是双媒体材料,附带图像、字幕、声音的计算机是多媒体材料。[1]

模态与媒体是形式和实体的关系。对多媒体与多模态的认识,不仅利于加深人机的互动,尤其是计算机辅助教学在理论上的认识,而且也利于为设计计算机辅助教学课件提供理性化的依据。

二、多模态话语分析理论

多模态话语指运用听觉、视觉、触觉等多种感觉,通过语言、图像、声音、动作等多种手段和符号资源进行交际的现象。[2]

多模态话语分析理论主要基于系统功能语言学理论,由五个层面的系统组成:(1)文化层面,包括作为文化的主要存在形式的意识形态和作为话语模式选择的体裁结构潜势;(2)语境层面,包括由话语范围、话语基调和话语方式组成的语境构型;(3)意义层面,包括由几个部分组成的话语意义,即概念意义、人际意义和谋篇意义;(4)形式层面,实现意义的不同形式系统,包括语言的词汇语法系统和其他各种模态的表意形式、语法系统以及各种模态的语法之间的关系;(5)媒体层面,是话语最终在物质世界表现的物质形式。[3]多模态话语主要在形式和媒体层面,扩大了语言学的研究范围。另外,系统功能语言学的社会符号学理论使它把语言作为社会符号所具有的功能延伸到除语言外的其他符号,并把包括语言在内的各种符号看作是各自独立而又相互作用的符号资源,在分析语言特征的同时强调图像、颜色、声音和动作等视觉、听觉和行为方面的符号模态在话语中的作用。[4]

三、大学英语口语教学中的多模态符号

大学英语口语教学以听觉模态符号和视觉模态符号为主。两种模态相互配合,相互协调,共同促进英语口语教学。

1.听觉模态符号

口语教学旨在提高学生的口语交际,而交际需要听觉系统识别发声器官发出的模态符号。口语教学中最重要的模态符号,主要有:口语语言符号,包括教师讲课的元口语语言符号,学生练习发出的口语语言符号,多媒体播放的电子音频符号及音调、音频、语气等次级要素;音乐符号即创设情景或营造氛围;其他声音符号指外界噪音或特制音效。

2.视觉模态符号

多媒体条件下的大学英语口语教学中视觉模态符号丰富,是对听觉模态的补充。主要包括:书面语言符号,由粉笔生成的语言符号和通过PPT等呈现的字幕语言符号;图像符号指图片以及动态的视频图像符号;肢体语言符号,主要指教师授课时伴随的肢体动作,如表情、眼神、五官表达的视觉模态符号和手势、姿势、身体朝向、走路等视觉模态符号,肢体语言符号运用的时机、幅度的大小和频繁程度等对意义传达具有辅助作用;课堂布局,合适的教学空间、桌椅的摆放方式等也是视觉模态符号。

四、遵循多模态选择原则,优化口语教学效果

口语教学中,多模态话语符号的整合有两种效果:一是多模态协调使用,在意义构建中相互补充,最大化教学效果;二是多模态不协调使用,对意义构建起消极作用,甚至会对意义传递具有抵消作用。因此,为了更好地发挥多模态符号构建话语意义的作用,促进大学英语口语教学,对模态的选择应遵循以下三个原则:

1.为英语口语教学提供教学情景和便利条件

口语教学旨在培养学生在真实场景中的交际能力。而传统的外语口语教学,受限于技术条件,无法提供逼真的交际场景,教师只能模拟教学。多媒体凭借图像、录像、声音等为学习提供真实语境,这既能使学生认识到真实交际语境的现状,在近乎真实的情景中学习交际,又利于克服“文化休克”现象。

2.为多模态话语交际提供多元化意义表达方式

现代多媒体技术发展的一个基本理念是多模态交际使受话人通过多通道获取信息,比单模态话语更易使受话者理解和记忆。如:多媒体技术为教师教学和学生学习搭建平台,“TheearthquakeoccurredinSichuan..”教师在讲解时可以用语音提示,也可以借助PPT呈现地震的图片,还可以播放与地震相关的声音,即强风声,哭喊声及山崩地裂声等等。这种语言与非语言的搭配使用,刺激了学生的感官,引起了注意,利于提高教学的效果。

3.为英语口语教学提供辅助条件

这儿的辅助指现代技术从内部提供动力,使教师和学生从内心愿意从事这种活动。特殊的东西、显眼的东西或幽默的东西更能引起兴趣,激发学生参与的热情,外语教师要充分利用多媒体创设语境、开展任务来活跃课堂气氛,提高口语教学效果。

参考文献:

[1]顾曰国.多媒体、多模态学习剖析[J].外语电化教学,2007(4)

[2]张德禄.多模态话语分析综合理论框架探索[J].中国外语,2009(1)