发布时间:2024-01-12 15:34:33
导语:想要提升您的写作水平,创作出令人难忘的文章?我们精心为您整理的13篇计算机视觉概述范例,将为您的写作提供有力的支持和灵感!
【关键词】计算机视觉 交通领域 探究
近年来,随着科技水平的提高,计算机视觉技术逐渐被人们熟知并广泛应用。相较于其他传感器来说,视觉能获得更多的信息。因此,在我国交通领域中,也对计算机视觉技术进行研究完善,将计算机视觉技术应用在交通领域各个方面中,并取得了显著的成效。
1 计算机视觉的概述及基本体系结构
1.1 计算机视觉概述
通过使用计算机和相关设备,对生物视觉进行模拟的方式,就是计算机视觉。对采集到的图片或视频进行相应的技术处理,从而获得相应的三维信息场景,是计算机视觉的主要任务。
计算机视觉是一门学问,它就如何通过计算机和照相机的运用,使人们获得被拍摄对象的数据与信息所需等问题进行研究。简单的说,就是让计算机通过人们给其安装上的“大脑”和“眼睛”,对周围环境进行感知。
计算机视觉是一门综合性学科,在各个领域都有所作为,已经吸引了各个领域的研究者对其研究。同时,计算机视觉也是科学领域中一个具有重要挑战性的研究。
1.2 计算机视觉领域基本体系结构
提出第一个较为完善的视觉系统框架的是Marr,他从信息处理系统角度出发,结合图像处理、心理物理学等多领域的研究成果,提出被计算机视觉工作者基本接受的计算机视觉系统框架。在此基础上,研究者们针对视觉系统框架的各个角度、各个阶段、各个功能进行分析研究,得出了计算机视觉系统的基本体系结构,如图1。
2 计算机视觉在交通领域的应用
2.1 牌照识别
车辆的唯一身份是车辆牌照。在检测违规车辆、稽查被盗车辆和管理停车场工作中,车辆牌照的有效识别与检测具有重要的作用和应用价值。然而在实际应用工作中,虽然车牌识别技术相对成熟,但是由于受到拍摄角度、光照、天气等因素的影响,车牌识别技术仍需改善。车牌定位技术、车牌字符识别技术和车牌字符分割技术是组成车牌识别技术的重要部分。
2.2 车辆检测
目前,城市交通路口处红绿灯的间隔时间是固定不变的,但是受交通路口的位置不同、时间不同的影响,每个交通路口的交通流量也是持续变化的。此外,对于某些交通区域来说,公共资源的配备,比如交通警察、交通车辆的数量是有限的。如果能根据计算机视觉技术,对交通路口的不同时间、不同位置的交通情况进行分析计算,并对交通流量进行预测,有利于为交通警察缩短出警时间、为交通路口的红绿灯根据实际情况设置动态变化等技术提供支持。
2.3 统计公交乘客人数
城市公共交通的核心内容是城市公交调度问题,一个城市如何合理的解决公交调度问题,是缓解城市运力和运量矛盾,缓解城市交通紧张的有效措施。城市公交调度问题,为公交公司与乘客的平衡利益,为公交公司的经济利益和社会效益的提高做出了巨大的贡献。由于在不同的地域、不同的时间,公交客流会存在不均衡性,高峰时段的公交乘客过多,平峰时段的公交乘客过少,造成了公交调度不均衡问题,使有限资源浪费严重。在计算机视觉智能公交系统中,自动乘客计数技术是其关键技术。自动乘客计数技术,是对乘客上下车的时间和地点自动收集的最有效的技术之一。根据其收集到的数据,从时间和地点两方面对客流分析,为城市公交调度进行合理的安排。
2.4 对车道偏离程度和驾驶员工作状态判断
交通事故的发生率随着车辆数量的增加而增加。引发交通事故的重要因素之一就是驾驶员疲劳驾驶。据相关数据显示,因车道偏离导致的交通事故在40%以上。其中,驾驶员的疲劳驾驶就是导致车道偏离的主要原因。针对此种现象,为减少交通事故的发生,计算机视觉中车道偏离预警系统被研究开发并被广泛应用。针对驾驶员眨眼频率,利用计算机视觉对驾驶员面部进行图像处理和分析,再根据疲劳驾驶关注度与眨眼频率的关系,对驾驶员的工作状态进行判断。此外,根据道路识别技术,对车辆行驶状态进行检测,也是判断驾驶员工作状态的方法之一。这两种方法,是目前基于计算机视觉的基础上,检测驾驶员疲劳状态的有效方法。
2.5 路面破损检测
最常见的路面损坏方式就是裂缝。利用计算机视觉,及时发现路面破损情况,并在其裂缝程度严重之前进行修补,有利于节省维护成本,也避免出现路面坍塌,车辆凹陷的情况发生。利用计算机视觉进行路面检测,相较于之前人工视觉检测相比,有效提高了视觉检测的效率,增强了自动化程度,提高了安全性,为市民的出行安全带来了更高保障。
3 结论
本文从计算机视觉的概述,及计算机视觉基本体系结构,和计算机视觉在交通领域中的应用三面进行分析,可见计算机视觉在交通领域中的广泛应用,在交通领域中应用的有效性、显著性,以此可得计算机视觉在现展过程中的重要性。随着计算机视觉技术的越来越成熟,交通领域的检测管理一定会加严格,更加安全。
参考文献
[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2015(06).
[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2015(04).
[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2015(08).
[4]马良红.三维物体影像的摄取与分析[J].中国公路学报,2014(05).
[5]朱学君,沈睿.关于计算机视觉在交通领域中的探讨[J].信息通信,2013(01):123.
[6]王大勇.关于计算机视觉在交通领域中的应用分析[J].科技与企业,2013(01):115.
作者简介
中图分类号:TP37 文献标识码:A 文章编号:1009-3044(2016)03-0242-02
计算机人工智能技术中的一项重要技术就是计算机视觉技术,这种技术主要是让计算机利用图像来实现认知环境信息的目的,这一目的的实现需要用到多种高尖端技术。近年来随着计算机技术以及计算机网络的普及与发展,计算机视觉技术也得到了较快发展,并且在实际生产与生活中的应用也越来越广泛。
1 计算机视觉技术概述
1.1 基本概念
计算机视觉技术主要研究计算机认知能力的一门技术,其具体主要是通过用摄像机代替人的眼睛,用电脑代替人的大脑,最终使计算机具备类似于人类的识别、判断以及记忆目标的功能,代替人类进行部分生产作业。人们目前研究的人工智能技术中的一项重要内容就是计算机视觉技术,通过研究计算机视觉技术可以让计算机拥有利用二维图像认知三维环境的功能。总的来说,计算机视觉技术是在图像与信号处理技术、概率分析统计、网络神经技术以及信息处理技术的基础上,利用计算机来分析、处理视觉信息的技术,它是现代社会新兴起的一门高新技术。
1.2 工作原理
在亮度满足要求的情况下,首先使用摄像机对具体事物的图像信息进行采集,利用网络把采集到的图像信息向计算机内部输送,然后在计算机系统内部处理加工图像信息会把事物的原始图像得到,随后利用图像处理技术进一步处理原始图像,获得优化质量效果之后的图像,分类与整理图像中有特征价值的信息,通过智能识别技术识别与描述提取到的图像信息特征,最后把得到的高层次的抽象信息存储起来,在进行识别事务时分析对比这些储存信息就可以实现事物的识别,这样视觉系统的基本任务也就完成了。其具体视觉系统如图1所示:
1.3理论框架
人类研究视觉技术虽然起步比较早,但取得较大进步是在20世纪80年代初伴随着视觉计算理论的出现。它的出现把研究视觉理论的策略问题解决了,视觉技术是一项特别复杂的信息处理过程,要想对视觉的本质准确完整的理解,必须从不同角度与层次研究与分析视觉本质。视觉计算理论研究层次大致可分为:计算机理论、算法以及实际执行。站在计算机理论的角度分析视觉技术,我们可知必须用要素图、维图、以及三维模型表像来描述视觉信息。
所以,可以把计算机视觉技术当做从三维环境图像中抽取、描述与解释信息的过程,其主要分析步骤可分为感觉、处理、描述、识别、解释等。若依据上述各过程实现需用到的方法与技术的复杂性划分层次,可大致把计算机视觉技术划分为:低层视觉处理、中层视觉处理、高层视觉处理三个层次。
2 计算机视觉技术在自动化中的应用
2.1 农业自动化中计算机视觉技术的应用
在农业自动化中应用计算机视觉技术可以全天候实时监测农作物的生长状况,便于科学管理农作物。还可以应用计算机视觉技术来检测农产品的质量,例如可以应用计算机监测技术来监测大多数蔬菜的质量,传统的人工检测蔬菜质量的方法,不仅费时费力,而且检测结果的准确性也不能很好的保证,在实际人工检测过程中还容易伤害蔬菜,可以通过利用计算机视觉技术来感应蔬菜自身释放的红外线、紫外线以及其他可见光的能量大小,然后和质量达标蔬菜的光线能量大小进行对比,根据这些对比结果可以把蔬菜质量的好坏准确判断出来,在蔬菜质量检测过程中应用计算机视觉技术,把传统的蔬菜检测方法完全颠覆了,极大的方便了农产品的质量检测,由此可见,计算机视觉技术在农业生产中有很高的使用与推广价值。
2.2 在工业自动化中计算机视觉技术的应用
计算机视觉技术在工业自动化应用的一个重要领域就是可以精密测量零件尺寸,其测量与被测对象的原理如图2所示。
光学系统、计算机处理系统以及CCD摄像头,是计算机检测系统的主要组成,被测物体由光源发出的平行光束进行照射,利用显微光学镜把待检测部位的轮廓图像呈现在摄像机的面阵CCD上,然后再通过计算机处理这些图像,进而把被测部位的轮廓位置信息获取下来,若被测对象是出现位移时,可通过两次重复测量,利用两次测量的位置差就可以得出,被测物体的位移量。
此外计算机视觉技术还可以应用于逆向工程中,应用3D数字化测量仪可以快速准确的测出现有工件轮廓的坐标值,同时还能构建曲面,保存成CAD或CAM图像,把这些图像送入CNC制作中心加工,便可制作出产品,这也就是所谓的逆向工程。由上述分析我们可知逆向工程要想实现,最关键的一环就是如何通过精密测量系统来测量样品的三围尺寸,获得各部位数据,进而做曲面处理进而加工生产。对于这一难题我可以通过利用线结构光测量物体表面轮廓技术来实现,器具体轮廓结构示意图如下图3所示。
这种测量方法的工作原理为:利用激光穿越平行、等距的振幅光栅组件,或直接采用干涉仪发出的干涉条纹,形成平面条纹结构光,再向物体表面投射,由于物体各表面的深度与曲率的不同,条纹会自动出现变化,然后再通过使用CCD摄像机对变形条纹进行拍摄。这样就可以把物体表面轮廓的变化情况分析出来。摄像机在拍摄图像的过程中,把图像信号转化为模拟信号,再转化为数字信号,然后经过传送再还原信号到图形处理系统,就得到三维轮廓图像。
在工业自动化中计算机视觉技术的深入广泛应用,不但使工业产品的生产质量得到了保障,而且跨越式的提高了工业产品的生产速度。如计算机视觉技术可以很好的检测产品包装质量,封口质量以及印刷质量等等,如我国重点指定的印刷造币机器的南京造币厂,由于货币制造印刷是由印刷造币机器来实现的,所以要严格要求其生产工艺,一丝一毫的生产差错都不允许存在,为了保障印刷制造出来的造币机器质量完全达标,必须严格精确检测生产出来的成品。在印刷造币机器的过程中要求要有非常高的计算机视觉技术,随着计算机视觉技术的不断进步,计算机视觉技术已经对印刷造币机器的需求完全满足了,实际的应用效果也非常理想,印刷造币机器在实际生产的过程中,南京造币厂把计算机视觉技术应用在了每个应刷造币机器最后的生产工序上,硬币受到重力下落的瞬间,计算机视觉技术可以瞬间采集图像的信息,准确拍摄硬币在下落过程中的图像,通过高速光纤传感器可以把硬币图像向计算机系统快速传输,利用计算机系统处理信息与识别信息的超强能力,可以及时识别硬币质量,经大量实践研究得出,在印刷造币机器上应用计算机视觉技术已经几乎没有检查差错现象的发生,由此可知,在工业自动化中计算机视觉技术的应用不但可行,而且发展空间还很大。
2.3 在医学自动化中计算机视觉技术的应用
在医学领域计算机视觉技术也得到了广泛应用,如医学中经常用到的CT图像以及X射线图都用到了计算机视觉技术,这些技术的广泛应用很大程度上方便了医生准确判断病人病情,另外,在生产药品的过程中,应用计算机视觉技术可以高效检测药品包装的合格与否,其基本流程是:传送装置先准确运输药品到指定位置,传送装置自身又可分为检测与分离两个区域,在传送药品的过程中药品的图像信息会被特定的摄像机采集,采集完成后向计算机系统传递采集信息,然后计算机系统会分析与处理这些信息,把没有包装好的药品自动识别出来,并且向分离区传递识别信息,分离区的自动装置会依据传输的分离信息,隔离开没有包装好的药品,这样就可以有效分类包装好的药品与没有包装好的药品,在药品包装检测方面应用计算机视觉技术代替传统人工检测,不但可以实现药品准确无误的检测,而且还可以大大提高检测药品包装质量的效率,完善了药品生产的自动化,由此可见,在医学自动化中应用计算机视觉技术可以积极促进医学自动化的发展。
3 结束语
总之,计算机视觉技术是一门研究计算机识别能力的高新技术,它涵盖了很多其他技术,具有一定复杂性。要想使其在自动化生产中得到更好地推广与应用,我们必须在明白其基本概念、工作原理以及理论框架的基础上,结合实际生产情况,不断进行深入研究,只有这样才能使计算机视觉技术得到更好地推广与应用,才能使这项现代化的高新技术更好的服务于社会,服务于人类。
参考文献:
[1] 龚超,罗毅,涂光瑜.计算机视觉技术及其在电力系统自动化中的应用[J].电力系统自动化,2003(1).
1.1计算机视觉学概述
从某种意义上说,计算机视觉学是一门在20世纪60年代兴起的新学科。它是一门边缘学科,融入了很多学科的特点,具有很强的工程性特征。比如,图像处理、应用数学、光电技术。换个角度来说,计算机视觉同属于工程领域、科学领域。
1.2计算机视觉的应用
计算机视觉的应用能够使计算机具有和人一样的视觉功能。在生活和生产过程中,照片资料、视频资料的处理是计算机视觉应用的主要方面。比如,在航空事业方面,对卫星照片的翻译;在医学领域中,主要用于辅方面的诊断;在工业生产方面,由于各种复杂因素的影响,计算机视觉在这方面的应用显得特别简单,有利于相关系统的实际构成。
2目标图像检索存在的问题
从某种角度来说,目标图像检索需要分为特征匹配、特征提取两个方面。它们表达了不同的含义。对于特征提取来说,它是图像进行检索的第一步,其提取结果会对进一步的研究造成直接的影响。而对于特征匹配来说,其匹配的准确度会直接影响图像检索系统的返回结果。但在目标图像检索完善的过程中,遇到一些问题阻碍了这两个方面的完善。因此,本文作者对其中的一些予以了相关的探讨。
2.1环境因素不断变化
对于目标图像来说,环境因素是影响其准确率的重要因素。同时,在复杂混乱的环境中,由于受到众多干扰物的影响,加上部分目标图像区域被遮盖,致使目标图像信息不够全面,使目标物体特征的提取难度进一步加大。
2.2图像噪声的影响
子为了更好地模仿生活中的图像检索,数据库中的图像也会随之发生一系列的变化。比如,尺度、角度、光照。而其中图像噪音的影响会使目标物体的外观发生对应的变化。在此基础上,严重降低了目标图像信息获取的准确度。
2.3目标图像检索训练数据的自动标注
由于处于网络中的图像资源信息过于繁多,需要采用手工的方式对它们进行标注。但这种方法非常浪费时间,准确率也比较低。很显然,这就需要目标检索图像能够具有自动标注的能力。实际上,图像检索方法过分依赖人工标注信息。而这些信息很多收到来自各方面因素的影响。比如,认识差异因素、个人经验。以至于对图像产生误解。
3基于计算机视觉下的目标图像检索技术
3.1以多尺度视觉为纽带的目标图像检索方法
该种目标检索技术的应用主要是为了提高目标图像检索的准确率,能够实现目标图像训练数据的自动化标注。该类技术主要是用于那些没有遮挡,不需要进行监督的目标图像检索方面。具体来说,它需要经过一系列的训练。在训练的过程中,以统计学习为纽带,对相应多尺度的目标检测模型进行适当的训练。在此基础上,以该模型为基点,对图像中那些显著性的区域进行合理地提取。比如,该区域的亮度、颜色。最后,需要对用于该实验研究中的概率潜在语义分析模型进行合理地利用。总之,利用这种检索方法可以对图像中那些显著目标所处的区域自动进行检测。同时,对其中目标图像的显著性进行合理地排序,能够提高检索引擎所返回图像结果的准确度。
3.2以彩色LBP局部纹理特点为媒介的目标图像检索方法
这种目标图像检索方法能够有效地解决图像信息采集过程图像噪声以及其它相关因素对所提取纹理特征的影响,提高了图像目标的准确率。对于这种图像目标检索方法来说,它把图像彩色空间特征和简化的LBP特征有机地相融合。在此基础上,该类方法增加了光照的不变特性,却保留了LBP局部的旋转特点。在提高图像检索速度方面,主要是利用原来的LBP特征来丢失其中的彩色信息。以此,使其中的特征维度能够在一定程度上降低。同时,这种目标图像检索方法的应用可以使对应计算方法的难度得以降低,还能对角度等变化状态下的目标图像进行准确地识别以及检索。
3.3以视觉一致性为桥梁的目标图像检索方法
从某个角度来说,它的应用主要是为了提高图像搜索引擎的返回效果,使局部噪声图形具有更高的显著性特征。一是:站在客观的角度,对搜索引擎返回结果的目标显著图予以准确的计算。此外,还要对其中的目标显著系数进行适当地过滤。二是:以所有图像为基点,以显著目标为导向,采取视觉一致性的模式。三是:以视觉一致性为基础,对其中的不同目标图像信息进行客观地分类。这种以视觉一致性为核心的方法能够有效地提高图像检索结果的准确率。更重要的是,在提高图像搜索引擎检索性能的同时,能够及时为用户选出最优的图像信息。而这些信息资源和用户寻找的主题信息密切相关。
中图分类号:TM862 文献标识码:A 文章编号:1671-2064(2017)01-0054-02
计算机图形学、计算机视觉以及可视化技术三者均是计算机领域重要组成部分,要做好计算机知识,就要先学好计算机图形学,但计算机图形学学习相对枯燥,尤其是算法教学难以理解,为解决这一问题,计算机视觉与可视化技术被应用到计算机图形学中。可见,三者之间存在一定的联系,因此,有必要对计算机图形学、计算机视觉以及可视化技术展开研究。
1 计算机图形学概述
1.1 计算机图形学目的
所谓的计算机图形学实际上就是怎样利用计算机表示图形,并利用计算机完成图形计算与处理,而这一过程的实现需要得到相关算法的支持。学习计算机图形学的目的是利用计算机技术为人们呈现既带有美感又不缺真实的图形(如下图1所示),为实现这一目标,就需要按照图形的要求创设合适的场景,并在一些光照模型的作用下,做好光照效果设计,在这一过程中需要计算机图形学能够与其他计算机技术相配合。经过计算机图形学出来的图像,多会以数字图像的方式展示出来,总的来说,计算机图形学与图像处理之间存在着一定的联系[1]。计算机图形学的涉及范围相对宽泛,不仅有图形硬件设计,还包括动画制作,虚拟现实等多个部分。此外,计算机图形学在动画制作中的应用频率也很高,如45分钟一集的动画影片中,85%的画面都需要用算机图形学来完成,由此可见,计算机图形学的应用频率极高,并在动画制作中发挥着不可替代的作用。因此,应重视计算机图形学的应用。
1.2 计算机图形学应用
随着计算机图形学的发展,它被应用到各个领域中,并发挥着重要作用。首先,在计算机辅助设计与制造中的应用,这是计算机图形学应用最多的领域,在计算机图形学被应用以后,不仅可以设计出更精准的图形,还能做好人机交互设计,强化修改能力。计算机图形学还被应用到三维形体重建中,利用该技术可以将原理的二维信息转化为三维信息,如在某次工程图纸设计中就应用了计算机图形学,经过一系列的处理以后,三维形体逐渐形成,最终实现了重建。其次,在医学领域中的应用。计算机图形学在医学领域中的应用多以计算可视化的形式展示出来,如在脑部手术中,医生为看清患处真实情况,经常需要利用在可视化技术的作用下将复杂的数据转化为图像,这时就体现了计算机图形学在其中的应用[2]。再者,在计算机动画中的应用,人们看到的动画影片就是计算机图形学作用的结果,以动画人物的行走为例,为保证动画人物的行走与自然人不存在过大差异,就需要应用大量的计算机技术,并在计算机图形学的作用下完成设计。最后,在计算机艺术中的应用。计算机图形学在计算机艺术中也有广泛应用,它不仅可以用于艺术制作,很多场景都是通过计算机图形学来完成的,现阶段,一些人正在利用计算机图形学创设人体模拟系统,其目的是让已故人士再次出现在荧屏上,这一目标的实现就需要得到计算机图形学的支持。
2 计算机视觉技术
2.1 计算机视觉技术含义
所谓的计算机视觉技术,实际上就是用计算机取代人眼做识别、跟踪以及测量等,同时也兼顾图形处理,其目的是让图像在计算机被处理以后更适于识别。对于计算机视觉技术来说,意在实现人工智能,主要是从图像与多维数据等方面实现人工智能系统设计[3]。计算机视觉是一种在相关理论与模型基础上发展起来的视觉系统,其主要构成部分有以下几种:
(1)程序控制,这一点主要体现在机器人设计上;(2)事件检测,多体现在图像监测上;(3)信息组织,主要体现在图像数据库等方面。计算机视觉三个阶段如图2所示,通过观察图1可以发现,计算机视觉存在于图像处理始终,从早期处理直到后期结束都存在,最终实现了3D描述,可见,计算机视觉具有十分重要的作用[4]。
2.2 计算机视觉技术的应用
现阶段,现代社会已经进入信息化时代,计算机技术也被应用到各个领域,并发挥着重要作用。计算机视觉的应用促使计算机实现了智能化,在该技术的支持下,计算机可以像人一样透过视觉看待世界万物,且具有良好的适应能力,但这一目标的实现还需要很长时间,需要一系列的努力才能实现。现阶段,计算机视觉应用最多的就是车辆视觉导航,然而,这种导航还没有实现完全自主导航,这也是需要进一步研究的地方。计算机视觉技术的适应性较好,特别适合在工业领域应用,即便是存在电子在干扰或温度变化较大的地方都能很好的运行,其整体效果也不会受到影响,再者,计算机视觉技术的嵌入性较好,成本相对较低,尤其适合在PC方案中使用,同时,具有一定的非接触能力,能够获取大量信息,且不受距离限制,总的来说,计算机视觉技术总体效果较好,适合利用在各种工业环境中应用,因此,应重视计算机视觉技术的应用[5]。同时计算机视觉还被应用到移动机器人设计中,主要是利用小波模板展示人体形态,然后做图像扫描,这样就可以顺利完成小波变换,进而了解到人的存在。同样,将计算机视觉应用到机器人设计上,可以自动检测出正在行动的人或车辆,而无法检测到静止的人,之所以会出现这样情况,主要是由于其中采用率步态分析法。
3 可视化技术
3.1 可视化技术含义
可视化技术是一种综合了计算机图形学与图像处理于一体的技术,它可以将复杂的数据转化为图像并在屏幕上展示出来。在可视化技术中,融合了以上两种技术的特点,并在多个领域都有应用,随着可视化技术的应用,不仅有效实现了数据表示,还强化了数据处理能力,更对数据决策分析有一定作用[6]。现阶段,虚拟现实技术已经成为可视化技术主要发展方向。
3.2 可视化技术的应用
首先,在计算机图形学教学中的应用,计算机图形学相对枯燥,相关知识也很抽象,不便于学生理解,在计算机图形学中最重要的部分是曲线曲面,而这些曲线曲面多是与数学模型有关,具有一定的抽象性,学生理解难度较大,以往教师只能通过一系列的公式演算帮助学生理解,尽管这样依然难以让学生掌握曲线变化情况,学生依旧无法正确理解。为减少这种情况的发生,可视化技术被应用到计算机图形学教学中,教师将抽象的知识用动画的形式展示出来,学生只要观看动画,拖动一定的控制点就可以了解到曲线变化情况,这样一来不仅增加了教学趣味性,学生也可以随意变动曲线,让复杂的知识变得简单,深化学生对计算机图形学知识的深度理解,同时,利用可视化技术在一定条件下,还可以完成代码编译,如在Actoin ScriPt中做编译,这样也可以增强学生的理解能力[7]。
其次,在医学领域中的应用。医学领域对于可视化技术的应用主要体现在放射治疗与矫正手术上。通过可视化技术可以屏幕上看到手术整个过程,并将原来细节部位放大,手术医生观察的更加细致,手术成功几率也会大幅度提升,患者生命也能得到保证(如图3所示)。如在对某名患者进行身体检查的过程中需要应用到可视化技术,由于通过检查会获得大量数据,而这些数据又相对复杂,但在可视化技术下就可以通过图表、曲线图或立柱图的方式展示出来,经过可视化技术的作用,了解到患者的血糖为5.6mmol/L,医生可以根这一数据做出诊断,而不必再分析这些数据。据不完全统计,80%的医疗检查工作都是需要利用可视化技术。
地质勘探是我国最重要的工作之一,由于多数矿藏都深埋地下,即便使用探测仪受多种因素影响也无法了解到实际矿藏情况,这就需要应用到可视化技术,在可视化技术的作用下,相关工作人员可以了解到地下有无矿藏,如果存在矿藏,相关工作人员也可以了解到矿藏所在位置与实际储备量,进而为矿藏开采奠定基础。如在地质勘探中,相关工作人员利用可视化技术做地形图整理,然后从中提取地形数据,再用CATIA做导入,这样就可以完成地形模型创建,这样就完成了三维地质模型创建工作,同时在相关工作台的影响下,还可以完成地形数据导入,进而生成一定的地形云点,如果其中存在错误,可视化技术也可以将其中的错误内容删除,这些都是可视化技术所带来的好处[8]。由此可见,可视化技术已经成为地质勘探中不缺少的技术。
最后,在气象预报中的应用(如图4所示)。利用可视化技术能够将数据转化为图像,通过观察图像就可以了解到云层变化情况,同时也能了解到实际风力大小与风走向等,气象预报人员就可以根据图像做出精准分析,需要了解气象变化的人也能了解到现实情况,如果气象条件恶劣,相关工作人员也可以及时做出工作调整,减少危险事件的发生。据不完全统计,可视化技术在气象预报中的应用频率高达100%,由此挽回的经济损失高达13.2亿元,可见,可视化技术在气象预报中的应用十分有必要,因此,应重视可视化技术在气象预报中的应用。
4 结语
通过以上研究得知,计算机图形学、计算机视觉以及可视化技术三者各具特色,三者间也存在一定的关系,尤其是可视化技术综合了前两者的特点,并融合了其他技术,在很多领域中都有应用。可视化技术是现阶段应用最多的一种技术,在计算机图形学教学中也有应用,并发挥着不可替代的作用。本文分析了计算机图形学、计算机视觉以及可视化技术的含义与应用,希望能为相关人士带来有效参考,正确利用这些技术。
参考文献:
[1]陈敏雅,金旭东.浅谈计算机图形学与图形图像处理技术[J].长春理工大学学报,2011(01):138-139+146.
[2]柳海兰.浅谈计算机图形学的发展及应用[J].电脑知识与技术,2010(33):9551-9552.
[3]滑瑞朋.计算机图形学的应用及研究[J].山西科技,2012(05):37-38+45.
[4]刘涛,仲晓春,孙成明,郭文善,陈瑛瑛,孙娟.基于计算机视觉的水稻叶部病害识别研究[J].中国农业科学,2014(04):664-674.
[5]关然,徐向民,罗雅愉,苗捷,裘索.基于计算机视觉的手势检测识别技术[J].计算机应用与软件,2013(01):155-159+164.
中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2014)07-0001-01
随着科学技术的快速发展,计算机技术也得到了飞速的发展。将计算机技术应用于人类的视觉系统,并辅助人们观察到一些眼睛难以看到的东西,已经逐渐成为一门大家所热捧和追逐的技术。随着人们对视觉传感器技术越来越多的探索,人们也逐渐实现了古代时想拥有千里眼的梦想。目前,人们已经把视觉传感器技术和计算机技术良好的结合在一起,并把这些技术应用到食品、建筑、医药、电子、航天航空等众多领域当中。而该项技术的快速发展,也帮助人们解决了一些日常工作当中人类视觉存在盲区的问题,保证了人们工作过程的安全。视觉技术与IT技术的完美结合使得人们的生活变得更加便利,让人们亲身体会到了IT技术给人们生活带来的便捷。
1 双目立体视觉概述
双目立体视觉又称双目视觉技术,是目前计算机视觉应用领域的重要研究内容。双目立体视觉控制系统的组成因其采用的原理和应用功能的不同,组成也都各不相同。
双目立体视觉的实现原理是基于人眼的视网膜看物体的特性,从两个不同的方向来观看同一个物体的不同角度,从而实现清楚的了解到物体的图像的目的。双目立体视觉从不同的角度获得物体的投影信息,并根据匹配的结果,获取同一个物体不同偏差位置的信息。最后在依据三角测量技术,根据已经获得的这些偏差信息从而获得这些不同点对应的距离信息,并最终获得这些实际物体的具体坐标位置信息。
视差测距技术告诉我们,要清楚的观察到一个物体的全貌,需要两个观察物从不同的方向,或者固定一个观察物,移动另外一个观察物的方式,以达到拍摄同一个物体的目的。根据同一个物体在两个观察物当中的位置偏差,从而确定该物体的三维信息。一般来说,双目立体视觉的组成包括:图像获取设备、图像预处理设备、摄像机标定设备、立体匹配设备、根据二维信息实现三维重构设备等五个重要设备。
2 双目立体视觉技术的原理
立体画又可以称之为三维立体画,是一种人们可以从三维立体图中获取二维平面图信息的技术。三维立体图表面看似毫无规则,但是假如通过一些特殊的技术或者通过合理的观察手段和观察设备,就可以看到一组秩序井然的美妙图片。
三维立体图是一组重复的二维图片有序的堆积积累而成,因此可以呈现出立体效果。人体观察物体的原理大致如下:当人类通过左右眼观察所在的空间平面的时候,这些平面图都只是一些毫无秩序的图片。而当左右眼重新聚焦或者在观察画面的时候呈现一定的层次感,则人类的左右眼观察到的一组重复案在经过人体识别以后,这些画面之间将存在一定的距离差异,从而在脑中生成立体感。
双目立体视觉技术正是基于以上的原理,从两个不同的方向去观察物体,并获得目标图像的信息,并经过一定的处理获得三维重建的物体立体信息的技术。
双目立体视觉在计算机技术中实现三维重建的大致流程
如下。
1)摄像机定位,并通过单片机计算得到要获取图像信息需要的外部的参数的大概值,并根据这些参数值设定摄像机。
2)用设定参数的摄像机拍摄目标场景的画面,并采集这些画面的二维图的信息。
3)通过计算机技术实现双目匹配,并判定采集画面中的二维图像中的不同点之间的对应关系。
4)在第三步中若得到两组二维图像的关系是稠密的时候,则生成三维视差图。如果不是则进一步采集图片信息。
5)根据得到的视差图最终实现场景的三维图形的重建。
3 双目立体匹配技术的研究难点和未来的发展方向
尽管目前有很多学者都投身到双目立体匹配技术的研究和开发当中,直至目前为止也解决了很多关于视觉理论当中存在的很多缺陷问题。但是视觉问题是一个复杂且难以解决的问题,特别是在双目立体匹配问题方面更是困难重重。立体匹配技术的难点已经成为限制将双目技术应用到计算机技术当中的重要瓶颈。
立体匹配的主要手段就是找到计算机采集到两幅和多副图片的中像素的对应关系,然后根据这些像素关系判定并生成三维重建图。但是二维图像的匹配存在层层困难,主要体现在以下几个方面。
1)由于视角的问题或者观察物体存在遮挡问题,导致采集回来的图片信息存在盲点,这样子更难找到图片的匹配区域。
2)场景中的一些深度不连续的区域大都处在场景当中的边界位置,这些位置容易出现像素不高,边界不清晰等问题,这些问题也给图像匹配带了很多困扰。
3)场景当中的低纹理的图片匹配特征和匹配关系较少,而且该位置的每个像素点极为相似。假如只是通过简单的像素相似性检测的话,会检测到很多匹配结果,而这些匹配结果当中有一大部分是错误的。这样子的结果势必会导致最终的图像匹配正确率极为低下。
从以上的分析,我们可以看出立体匹配技术存在很多技术上的难点,这些都在很大程度上限制双目立体匹配技术在计算机当中的应用发展。如何才能设计出有效、准确、快速、通用性强的立体匹配算法将会是以后双目立体匹配计算发展的重要方向。也只有通过设计出一套行之有效的立体匹配算法才能使得双目立体匹配技术在计算机视觉当中得到广泛的应用。
4 结束语
人们通过眼睛可以感受到外界事物的存在,可以清楚的了解到事物的立体信息,分辨出观察物的广度和深度,以及物体的远近。因此人类视觉感知系统就是一个双目的立体感知系统。本文讲述的计算机中的双目立体匹配技术正是基于人眼视觉观察物体的原理,通过双目立体视觉原理,对计算机采集获得两幅二维图像的信息进行分析,并结合计算机的分析,最终获得同人类眼睛一样观察到物体三维表面信息的目的。双目立体匹配技术与计算机技术的完美结合帮助人们可以更加轻易的获得物体的信息。希望在不久的将来,可以将该项技术应用于人类的视网膜当中,以帮助一些视网膜存在问题的人们,让他们重新感受到光明,感受世间的温暖。
参考文献
[1]高文,陈熙霖.计算机视觉算法与系统原理[M].北京:清华大学出版社,2002.
[2]明祖衡.双目立体视觉测距算法研究[M].北京:北京理工大学,2008.
[3]刘昌,郭立,李敬文,刘俊,杨福荣,罗锋.一种优于SAD的匹配准则及其快速算法[J].电路与系统学报,2007,12(4):137-14.
我国水果产量居世界第一,果品出口成为我国外贸的重要组成部分。但是我国大多数农产品国际市场竞争力弱,出口价格低廉。其中品质因素是重要原因之一,这是由于检测技术、评判标准等限制,所以对果品进行合适的品质检测对提高经济效益和市场竞争力具有重要意义。对农产品品质的无损检测,已引起国内外广泛关注。
所谓无损检测,又称非破坏检测,是不破坏被检对象却能评价其品质的方法。它利用自身力学、光学、电学及声学等物理性质对评价对象品质进行非破坏检测,并按照一定标准进行分级分选的新兴技术,广泛应用于工业和农业。农业中的无损检测技术是利用农产品的物理性质如光学性质、声学性质、电磁学性质和热学性质等的变化而实现。目前,无损检测技术主要包括:近红外技术、声学检测技术、软X射线技术、计算机视觉技术、核磁共振检测技术、力学特性检测技术等。
1.果品无损检测技术
1.1新型可见、近红外光谱无损检测技术
可见、近红外光谱法是农产品内部成分无损检测的有效方法,是利用农产品吸收、散射、反射和透射光的特性,进而确定内部成分的方法。近红外分析技术作为一种高新分析技术,能改造我国传统农业,提高农产品质量,尤其是农产品加工的质量控制,将产生巨大作用。为改造我国的传统行业,企业迫切需要对原料进行质量监测、生产过程监控的设备和技术。国际经验来看,近红外技术是首选。
韩东海等[1]利用柑橘正常及损伤部位在紫外光源下的差异发射性,可有效确定柑橘损伤果。Slaugther DC[2]鉴于近红外和可见光的分光光度技术,建立完好的桃及油桃内部品质的无损关系式,能够预测完好无损的桃与油桃的山梨糖醇含量、蔗糖和可溶性固形物等。Lammertyn J[3]通过研究近红外光谱和可见光谱对红玉苹果质量的无损测量,进而得到双叉光纤记录的反射光谱与苹果参数之间的关系。Ali Moghimi[4]等用近红外光谱技术结合化学计量学建立猕猴桃SSC和pH的校正模型,比较多元散射校正、变量标准化、中值滤波和一阶导数光谱预处理对所建猕猴桃SSC和pH校正模型的影响,表明变量标准化结合中值滤波和一阶倒数预处理光谱后,用PCR-PLS法建立的SSC和pH的校正模型精度较高。
目前,分光检测技术在果蔬品质检测中的应用广泛,因为这种方法具有适应性强、高检测灵敏度、人体无害性、灵活使用性、成本低廉和自动化易实现性等优势。利用这种技术能自动分级果品,而合理的分级标准,便于果品深加工和远销售。近红外光谱的研究虽起步较晚,但是其应用广,特别是在农产品的品质检测和分级领域取得较大的进展,开发应用前景广阔。
1.2声学无损检测技术
声学无损检测技术是利用果品声学特性与内部组织变化的关系,例如结构、成分、物理状态等物化特性信息来检测果品品质。声学特性是指在声波作用下农产品的反射、散射和吸收特性、衰减系数和传播速度及其本身的声阻抗与固有频率等,它们均反映声波与农产品相互作用的规律,这些特性随农产品内部组织变化而变化。一般使用低能超声波来检测,因为低能超声波在被检测物中传播不会引起物理或化学特性变化。超声方法检测果品品质始于近年,国内外研究集中针对水果成熟度、硬度和内部质量缺陷等无损检测。
与光学、电学及其他无损检测技术相比,声学无损检测技术具有适应性强、投资较低、操作简便快捷等有死,特别适用于在线检测,在农产品检测领域应用前景良好[5]。
1.3软X射线技术
适用性极强的X射线成像能够与图像识别、人工智能、现代通信技术等相联系。若待检测物体的密度和厚度不同,则不同的透射X射线量产生。鉴于分析穿透量,进而判断果品内部品质。软X射线拥有巨大优势,特别是在农产品的内部品质检测上,因软X射线具有穿透物料的特性,所以检测那种易损坏的农产品,能无损检测内部的品质。所需X射线强度方面,农产品检测弱于工业,所以称为低能X射线或软X射线。这种X射线成像技术来检测农产品内部品质方法已经受到研究者关注,例如基于X射线成像技术的检测核桃果核与果肉厚度,基于X射线图像的评价牛肉嫩度,以及评价红毛丹内部品质等。韩东海[6]用X射线来检测柑橘皱皮果,结果表明射线与激光分析法在果实品质检测中的可行性。然而目前国内此方面的技术开发较落后,期待学者们进一步的研究和探索。
1.4计算机视觉技术
伴随专业化的图像处理技术以及下降的计算机硬件成本和高速度特性,计算机视觉技术对农产品品质自动识别和分级的应用日益广泛。计算机视觉技术即以各种成象系统代替视觉器官作为输入敏感手段,借助于计算机替代大脑完成处理和解释。计算机视觉的最终研究目标是使计算机可以像人一样,通过视觉观察来理解世界,具有自主适应环境的能力。
基于机器视觉的果品无损检测的技术,一般是借助于CCD摄像头获取果品图像,图像信息输入计算机,进而应用检测方法和算法得到果品在大小、缺陷、外部损伤、内部品质等方面的特质值,从而来分级果品[7]。这种方法通常是由CCD摄像头、配备图像采集卡的计算机、光照系统和专用图像处理软件组成。在一定光源照射情况下,利用CCD摄像头得到水果形状、颜色、缺陷等视觉方面的图像信息,凭借图像采集卡转换为数字信号传输到电脑,分隔图像、提取特征值,从而得到特征值参数和水果颜色、质量状况、破损程度等品质指标间模型关系,进而确定内外品质等级。这种方法快速、准确、无损,使用一次能同时检测多项品质指标,方便设计自动分级流水线,自动识别水果外在品质(外形、缺陷、颜色、大小等)和内在品质(成熟度、坚实度、含糖量、含水率等),因此具有广阔的应用前景[8]。
我国利用计算机视觉系统,检测农产品品质和分类农产品的研究方法开展较晚,始于20世纪90年代,但逐渐受到重视。与国际先进水平相比,在农业领域的应用我国计算机视觉技术研究具有一定程度的差距,我国目前处于实验研究以及理论探索阶段,实用化和商品化的程度还未达到。这项项目基于数码摄像技术,通过电脑直接处理图像信息,其研发促使使我国获得最快速、最便利的视觉技术。
1.5核磁共振检测技术
1946年,核磁共振现象由美国科学家F.Bloch和E.M.Purcell发现,这一技术广泛应用于研究物质结构。核磁共振可以便利地生成果实内部组织结构的高清图像。方便检测果品压伤、虫害以及成熟度,因此在检测苹果、香蕉糖度等方面潜在价值极高。而那些因采收成熟度而影响品质的品种,鉴于核磁共振技术,能提高收获和运输可靠性。现阶段,这种技术要想真正应用于果品检测和评价果品质量,还存在诸多问题,然而其优势明显,这种技术无疑是一种良好的果品无损检测方法[9]。
1.6力学特性检测技术
应用计算机实现的图形图像设计与视觉侦查,在实际生产与生活中出现的时间都相对比较早,其中计算机视觉侦查应用实现的时间更是早于计算机图像图像设计,与一般的平面设计技术相比,通过计算机实现的图形图像设计在实际设计应用中不仅内容更加丰富,并且图形图像中所包含的元素也相对较多,因此所能够传达和表示内容含义也就更为全面。此外,应用计算机实现的图形图像设计不仅能够更进一步的传递出现代图形设计的目的,在设计过程中还能够借助计算机相关技术实现数据信息的分析处理,从而使图形图像设计者的想法愿望能够更好的呈现出来,具有突出的作用优势和意义。
1 计算机图形图像设计与视觉侦查的相关概念概述
在图形与图形设计领域中,计算机图形图像设计的出现应用相对比较早,最早可以追溯到20世纪80年代,我国的计算机图形图像设计是在引进外国设计经验与理论基础上实现应用的。对于图形图像设计含义的理解,首先应从图形图像的含义理解开始,它是指通过图形图像或者是视觉形象实现设计者思想观点的表现和阐述,其本身具有较为突出的创造性特征,因此,图形图像设计是指设计者通过使用相关媒体实现特定信息的视觉形象的传递,它是一种特殊的语言形式,在设计领域比较受欢迎。视觉侦查则是在图形图像设计过程中借助视觉传达的相关技术手段实现图像图像视觉效果的分析判断,视觉侦查的概念比图形图像设计概念出现的时间要早,它是指人们通过信息符号的运用实现相互之间的交流和沟通,是一种实现人与人之间沟通交流的工具。计算机图形图像设计与视觉侦查之间有着密切的联系,其中计算机图形图像设计是通过计算机技术对于视觉信息中的图形图像相关信息进行再次创作实现的一个过程,借助视觉侦查能够实现计算机图形图像的更好设计。
2 计算机图形图像设计与视觉侦查的特征关系分析
(1)计算机图形图像设计的特征分析。在设计领域中,图形图像设计和艺术设计之间有着很大的联系,根据上述对于图形图像设计概念含义的概述,结合实际设计应用情况可以将图形图像设计的特征概括总结如下。首先,在实际设计应用图形图像设计所实现的任何设计都需要相应的经济基础作为支撑,以商业性广告的设计为例,其设计就是把实现最大利益作为目标而进行的,而那些不具有商业性质的公益设计类型,也具有相关的社会关怀、文化氛围营造等不同目的,因此,实际设计应用中为了更好的实现设计的目的,就需要在经济基础的支撑下结合设计受众的心理喜好,以达到更好的设计目的。其次,在实现图形图像设计过程中需要设计者对于设计内容的基本思路以及设计核心内容、目标等进行明确,以实现图形图像设计主题思想的确定,达到设计目的与要求。再次,进行图形图像设计中还需要认识到图形图像设计与一般的美术画画之间有着根本的区别,其中美术画画对于所画事物之间的一致性要求比较高,而图形图像设计则是选取容易被人们所接受、喜爱的事物作为载体的,与日常生活联系比较密切。此外,在设计领域中,计算机所实现的图形图像设计自身属于一种定量式的设计,每个设计之间是相互独立的,其设计目的也更为明确,设计速度比较快,设计过程中的定位与配色等都比较精准,所实现的设计带给人们的视觉冲击性也比较强,再加上计算机技术的应用,不仅促进了图形图像设计中的设计绘制软件工具的革新,而且很大程度上也拓宽了图形图像设计的视觉传达效果,能够促使设计者的设计创意与设计表现实现更高层次的突破提升。如图所示,即为应用计算机图像设计软件实现的设计效果示意图。
(2)计算机图形图像设计与视觉侦查之间的关系区别分析。结合计算机图形图像设计的实际情况及其设计的视觉传达效果,在实际设计中图形图像设计和视觉传达设计之间的设计相同点比较突出,其中,以设计内容和设计目的为例,其中就存在着很大的共通性,在实际设计中对于设计者都具有较高的专业知识和软件应用要求。此外,在对于计算机软件技术的应用上,图形图像设计和视觉侦查之间所需要的软件都是一样的,像比较常见的Photoshop等,并且完成设计都需要设计者具备相关的审美与对设计元素的灵活应用,在完成设计作品的再创造基础上,实现设计质量效果与水平的提升。其次,图形图像设计与视觉侦查之间也存在有较大的区别,其中图形图像设计更加重视对于图形和图像的设计处理,而且视觉侦查则是通过视觉的设计构造,体现出更特别、更新颖的观念思想,因此视觉侦查更加重视设计者的创意和创新,由于图形图像设计与视觉侦查之间的这种根本性的区别,就导致了视觉侦查与图形图像设计在设计手法与设计原则上也存在有一定的区别,这也是图形图像设计与视觉侦查之间的最大不同处。
3 计算机图形图像设计与视觉侦查的应用分析
根据上述对于计算机图形图像设计与视觉侦查特征与关系区别的分析,就可以看出在实际设计应用中,视觉侦查与图形图像设计之间具有很大的关联性,它们通过相互之间的作用影响,共同实现设计者思想与观念的展示表现。通常情况下,计算机图形图像设计与视觉侦查在文字设计以及广告设计、绘画设计、包装设计和功能界面设计中的应用体现比较多,以文字设计为例,其中有关的文字大小以及字体颜色、位置、效果等,都是借助计算机图形图像处理软件完成实现,并且借助这种设计手段,最终都是为了对受众产生相对突出的视觉冲击。
结语
总之,计算机图形图像设计与视觉侦查作为计算机设计领域重要内容,对于计算机技术的提升以及艺术设计的发展进步都有着积极的影响和意义,进行计算机图形图像与视觉侦查的分析,有利于促进计算机技术与艺术设计的发展提升。
中图分类号TP39 文献标识码A 文章编号 1674-6708(2011)54-0197-01
0 引言
本文提出了基于单目非标定视频的人体动作捕捉及三维重建方法,同时利用计算机视觉和基于真实物理运动学原理。本文基于图像的关键帧技术对视频进行处理:首先对关键帧进行交互式三维重建,然后进行基于图像的姿态插值,同时利用牛顿力学原理和生物约束集对重建结果进行修改和优化。
1 算法概述
首先基于用户交互式方法估计三维特征点集合和人体骨骼大小,同时用牛顿力学原理和生物约束集对重建的姿态进行评估和优化。
1.1 基于关键帧的交互式三维建模
此环节利用一种高效的算法来估计关键帧中的三维姿态,同时估计相机参数和人体骨架大小。
1.2 基于图像的三维关键帧插值
本文提出一种高效的算法自动跟踪二维图像中的特征点集,并利用图像测量技术对关键帧进行插值操作,同时可以修改并优化重建后的模型。
2基于关键帧的交互式三维建模
本文将人体分为17个刚体部分,主要包括头、颈、躯干、左右锁骨、肱骨、桡骨、胯骨、股骨、胫骨和跖骨。用关节坐标集q描述人体全部姿态,q ∈ R37 。向量l表示17段刚体部分的长度集合,l = [l1 , ..., l17]T , lb, b = 1, ..., 17 表示第b段关节的长度。
利用以上参数可以估计k幅关键帧的三维姿态(q1 , ..., qK )以及人体骨架大小(l)。
2.1摄像头参数估计
对于移动摄像头拍摄的视频利用MatchMover [2008]估计摄像头的内参数和外参数=(tx,ty,tz,θx,θy,θz, f),(tx,ty,tz), (θx, θy, θz)和f分别表示相机坐标、方向和相机焦距。对于固定摄像头拍摄的视频用3.2中提出的算法自动估计以上参数值。
2.2交互式三维关键帧建模
本文定义了能量方程和成本方程来估计和消除二义性问题。具体来说,通过计算以下能量方程的最小值来估计人体骨架大小l和三维姿态q1,...,qk
(1)
Ep代表骨骼投影约束,Es表示对称约束,保证重建后的三维骨架的对称部分是等长的。Er为对称约束,Ec则保证在某些视频中保证部分特征点的相对坐标保持不变,Ed可消除重建过程中出现的二义性。
本文用表示每段关节的内关节点和外关节点的深度信息,同时对方程式(1)进行初始化和优化操作。对于前者采用解析式的雅可比公式,对于后者则用Levmar library [Lourakis 2009]中的Levenberg-Marquardt 算法进行优化。
3 基于图像的三维关键帧插值技术
3.1 基于多关节的二维关键帧插值
下肢(包括股骨、胫骨和跖骨)的姿态可用表示,表示在2维图像中对应的关节点坐标,待估参数为, 。
第t帧某区域内特征向量(2)
h(et)和hm(et)分别表示在特征空间内的当前目标模型和第个密度空间。
假设任意中间帧的模板模型可参数化:
Hm(βt)= βt hm(e1)+(1-βt)hm(eT), m=1, ..., M(3)
将Hm (βt )和h(et)进行匹配估计骨骼姿态参数值,用巴特查利亚距离度量匹配距离:
用洛仑兹函数作为衡量的成本方程,通过计算以下目标函数的最小值来获得最优解:
(4)
3.2 三维姿态插值
分别表示关节点姿态、关节点运动速度和其加速度。分别为关节点的惯性矩阵、离心力、中立。向量u,fc分别为关节点力矩和触点压力。雅可比公式在触点处将关节速度转化为世界坐标内的速度。规定摩擦极限约束函数fg为fg(w1,...,wm),为环境摩擦极限函数,则通过求解以下目标函数可得出关节姿态向量q,关节力矩u,以及触点压力fg(w)和fe:
(5)
4 试验结果
我们通过对各种人体姿态进行建模来评估本系统的精度值和鲁棒性,包括行走、高低杠运动、跳跃、举重等行为。下面是实验数据:
序列 帧数 相机类型 关键帧数 每帧跟踪
多关节点数 Refinement A Refinement B
高低杠 150 pan-tilt-zoom 10 10 0 7
体操 585 static 9 10 2 0
举重 310 pan-tilt-zoom 13 11 3 4
从以上表格中我们可以看出,本系统可以用最少的用户交互来获得最佳的人体姿态三维重建结果。
5 结论
本文对通过论证对人体姿态的三维重建技术,提出了一种新的方法,该方法利用单目摄像头拍摄的视频序列,避免了双目视觉视场小、立体匹配困难、空间、光照等局限性,在计算机视觉领域有着重要的实际应用价值。
在农业中大力发展机械新技术具有十分重要的意义。首先,通过实施农业机械化建设,采取更多的机械新技术,可以促进农业生产力的提升,提高农业生产效率;其次,通过农业机械新技术,可以最大程度的解放农村劳动力。
1农业机械新技术的发展与应用
1.1计算机视觉技术
因为在当前的经济社会,农业经济效益高低在很大程度上取决于农产品质量好坏,优质等级的农产品价格会更高。但是如果以人工方式对农产品进行分类,不但费时费力,而且效率很低。而通过计算机视觉技术则可以很好的解决这一问题。其主要是依靠图像处理、视觉模拟等先进技术作为技术依据来对农产品品质进行分级检验。现如今,计算机视觉技术还在农业机械收割、播种等领域有所涉及,但目前还无法有效处理快速获取动态图形信息,为收割、播种这一领域的应用带来了一定的难题,还需要相关人员继续进行研发[1]。
1.2人工智能技术
人工智能是当前社会上讨论的热点话题,是最前沿的高科技之一。将人工智能技术应用在传统的农业中是时展的需求,也是未来的主要发展趋势。美国等发达国家已经初步将人工智能技术应用在实际的农业生产中。如美国农业已经开始使用激光拖拉机,实现了人工智能操控拖拉机的方向、所在位置和工作动态,极大的解放了劳动生产力,提高了生产效率和操作精准度,也使得农业生产更加舒适省力,尤其适宜大规模的农业生产。
1.3自动控制技术
在农业生产中,自动控制技术的应用较为广泛,但是还有很大的应用与提升空间,尤其是在一些特殊生产领域,依然还属于机械新技术。例如,在蔬菜大棚的农业生产中,通过自动控制技术就可以自动对大棚内部的温度与湿度进行合理的实时调节,不但使调节后的温度湿度更加科学精准,更适宜蔬菜的生长,也大大减少了人力劳动工作量。
1.4联合耕作机械技术
所谓联合耕作,就是指两个或两个以上的机械一起使用进行农业耕作。通过联合耕作,可以缩短农业生产时间,提高农业耕作效率。通过采取联合耕作机械技术,可以一边耕地一边播种,也可以一边采收农作物一边打碎秸秆。这样的耕作要比传统耕作更加高效省时,在农业生产中发挥了非常重要的作用。
1.5液压机械技术
采取液压机械技术,不但能够节省大量的能源,减少对自然环境的污染与破坏,还能够保证农业生产的稳定性,不会因为其他因素影响其工作效果。这是因为与其他的农业机械相比,液压机械采取静液压转动技术,根据实际需要调节转速,不但对机械本身的使用寿命有很大益处,也提高了农业机械生产的稳定性。另外,采取液压机械技术,最显著的优势除了节能环保以外,还在于其不会发生任何泄漏,所以不会对土壤造成污染,这也农业机械化生产中很关键的一点。
2农业机械新技术的发展前景及对策
农业实现机械化生产是必然的发展趋势,因此农业机械新技术的发展前景十分广阔。在此形势下,需要进一步采取有力措施,促进农业机械新技术实践运用水平的提升[2]。
2.1政府及有关部门应大力扶持农业机械新技术
农业现代化的进程为缩短城乡差距做出了很大贡献,但受生产力水平的限制,农村经济依然比较落后。在此情况下,政府应当大力扶持新型高效农业机械技术的研发和应用,并提供相应的优惠政策和补贴政策,为农民负担一部分的购置机械费用,促进农业机械新技术快速转化为生产力,提高农业生产效益,增加农民经济收入。
2.2大力推广农业机械新技术
我国是地大物博的农业大国,各个地区都有农业生产,但是农业机械新技术在研发应用时往往只是先在一部分发达地区实施。而在偏远地区,人依然是最主要的劳动力,新的农业机械无法普及到这些地区,极大的限制了我国农业经济的发展。为此,新时期下还需要大力推广农业机械新技术,使更多的地区实现高科技的现代化机械生产。
2.3注重机械化生产的节能性
在农业生产中,机械化生产与人工生产之间存在的区别之一就是人工生产时会更加注重对资源的利用,而机械化生产有时则会造成生产原材料的浪费。例如在玉米的采收中,人工采收基本可以实现颗粒归仓。但是机械收割则有可能无法将倒在地面的玉米采收起来。这与农业机械化建设的初衷是背道而驰的,因此在使用农业机械新技术时,应该要注意节约资源,避免浪费,实现工作效率和生产效益的双赢[3]。
3结束语
综上所述,在当前我国的农业发展过程中,农业机械化新技术具有很大的发展前景与发展潜力,并且在很多领域都还有很多的可发展空间。这就需要技术人员不断的积极研发更多更高效的农业机械技术,同时还需要国家给予一定的支持,做好农业机械新技术的推广工作,从而最大程度的将人工劳动力解放出来,促进农业现代化的发展。
参考文献:
[1]王丽芬.农业机械新技术的应用与发展[J].南方农机,2016(11):22+28.
1 概述
动作行为识别是计算机视觉领域中的一个研究热点,已经广泛应用于智能监控、人机交互、视频检索等领域中[1]。动作行为识别技术是通过对视频或者图像中人体动作行为做出有意义的判断。有效表达图像(视频)中的实际目标和场景内容是最基本,最核心的问题。因此,对于特征的构建和选择得到广泛关注,例如STIP、SIFT、MSER等。但是,能通过无监督方式让机器自动从样本中学习到表征样本的特征,会让人们更好地利用计算机来实现人的视觉功能。而深度学习作为神经网络的延伸和发展,是通过逐层构建一个多层网络来使得机器自动学习到隐含在数据内部的关系,从而让学习到的特征更加准确性。
文章旨在探讨深度学习与机器学习(神经网络)之间的关系,并且介绍深度学习的由来、概念和原理;同时介绍目前深度学习在计算机视觉中的应用。最后提出深度学习目前发展所面临的问题,以及对未来的展望。
2 深度学习
2.1 深度学习概述
深度学习源于人工神经网络的研究,是机器学习的拓展。深度学习是经过组合低层特征来形成更加抽象的属性类别和特征,从中发现原始数据的特征表征[2]。现在用于动作行为识别的技术是通过“动作表征”+“动作分类器”的框架来进行行为识别的。其中“动作表征”是人们手动设计特征获取到的,也就是在目前识别框架内存在一个对动作图像(视频)的预处理过程。
深度学习和浅层学习相对。目前许多学习算法是浅层网络学习方法,具有一定的局限性,例如在样本有限的状况下,表示复杂函数的能力有限制,且对复杂分类问题的泛化能力也会受到一定约束[3]。而深度学习通过学习深层非线性网络结构,达到复杂函数逼近,又能在样本少的情况下学习原始数据的特征。BP算法作为传统神经网络的典型算法,虽然训练多层网络,但仅含几层网络,训练方法很不理想[3]。因为其输入和输出间非线性映射让网络误差函数形成含多个极小点的非线性空间,因而经常收敛到局部最小,且随着网络层数的增加,容易过拟合。而深度学习可以获得分布式表示,通过逐层学习算法来得到原始输入数据的主要变量。通过深度学习的非监督训练完成,同时利用生成性训练避免因函数表达能力过强而出现过拟合情况。
2.2 深度学习原理
传统机器学习仅含单层非线性变换的浅层网络结构,而且浅层模型单一。这对于深度网络来说易造成陷入最优或产生梯度分散等问题。因此,Hinton等人在基于深度置信网(DBNs)的情况下提出非监督贪婪逐层训练算法,随后提出了多层次自动编码器深层结构,这给解决深层网络结构相关的优化难题带来了希望。此外Lecun等人提出的卷积神经网络是第一个多层次结构的学习算法。同时深度学习还出现了许多结构:多层感知机、去噪自动编码器、稀疏编码等。
卷积神经网络是第一个真正采用多层次网络结构,具有鲁棒性的深度学习算法,通过探究数据在空间上的相关性,减少训练参数的数量。而且卷积神经网络(CNN)适应性强,善于发现数据的局部特征。它的权重共享结构降低了网络模型的复杂度,减少了权值的数量,使得卷积神经网络在模式识别中取得了很好的结果。
自动编码器的核心关键是将原始图像(视频)输入信号进行编码,使用编码后的信号来重建原始信号,使得两者之间的重建误差最小。通过将原始信号编码成另一形式,能够有效地提取信号中的主要信息,能够简洁地表达原始图像(视频)的特征。
3 深度学习的应用
3.1 语音识别
从2009年开始,微软研究院语音识别专家通过与Hinton合作,首先将RBM和DBN引入到语音识别声学模型训练中,使得语音识别的错误率相对减低30%,这彻底改变了语音识别原有的技术框架。在国际上,IBM、google等公司都快速进行了DNN语音识别的研究,并且速度飞快。国内方面,阿里巴巴,科大讯飞、百度、中科院自动化所等公司或研究单位,也在进行深度学习在语音识别上的研究。
3.2 视频中的动作行为识别
准确迅速识别视频中人的动作行为对于视频搜索和视频监控具有划时代的意义。最近几年,深度学习技术被应用于视频动作行为识别中。如Ji等人[4]提出多层网络的3D卷积神经网络来学习视频中的时空特征,并通过卷积来实现对整个视频特征的学习,从而代替之前的时空兴趣点检测和特征描述提取。在TRECVID数据库上进行的实验取得了不错效果。
4 结束语
文章对深度学习的主要概念进行了全面阐述,包括其由来、原理、研究进展和相应的应用等。在很多领域中,深度学习都表现了潜在的巨大价值,但深度学习作为浅层学习的延伸,仍处于发展阶段,还有很多问题值得我们深入探讨:
(1)我们需要了解深度学习的样本复杂度,需要多少训练样本才能学习到足够的深度模型。
(2)在推进深度学习的学习理论和计算理论的同时,我们是否可以建立一个通用的深度学习网络模型,作为统一的框架来处理语音、图像和语言。
(3)神经网络具有前馈性连接和反馈性连接,可是我们研究的深度网络中还没有加入反馈连接,这些都给深度学习的研究带来了严峻的挑战。
参考文献
[1]王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报,2002,25(3):225-237.
中图分类号:TM76 文献标识码:A 文章编号:1009-914X(2016)19-0387-01
背景
如今,计算机技术已经广泛地应用在电力系统,其内容主要包括下列几点:第一,计算机技术在数据处理工作中。数据处理是电力系统中一个非常重要的操作环节,而计算机最大的特点在于对数据的处理,使电力系统中复杂的数据实现了及时地收集和规范地处理,从而大大提高电力数据处理速度,使工作效率大大提升;第二,中间件在电力系统中的应用。计算机资源和通讯状况的监控上,通过中间件可以实现电力系统实时数据的高效管理。
1.电力系统自动化技术概述
电力系统由发电、输电、变电、配电及用电等环节组成。通常将发电机、变压器、开关、及输电线路等设备称作电力系统的一次设备,为了保证电力一次设备安全、稳定、可靠运行和电力生产以比较经济的方式运行,就需要对一次设备进行在线测控、保护、调度控制等。电力系统中将这些测控装置,保护装置,有关通信设备,各级电网调度控制中心的计算机系统,电厂、电站及变电站的计算机监控系统等统称为电力系统的二次设备,其涵盖了电力系统自动化的主要技术内容。
1.1 电网调度自动化
电网调度自动化是电力系统自动化的主要组成部分,我国目前电网调度自动化分为五级,即国家电网调度、大区电网调度、省级电网调度、地区电网调度和县级电网调度。电网调度自动化主要组成部分由电网调度控制中心的计算机网络系统、工作站、服务器、大屏蔽显示器、打印设备、通过电力系统专用广域网连结的下级电网调度控制中心、调度范围内的发电厂、变电站终端设备等构成。电网调度自动化的主要功能是电力生产过程实时数据采集与监控电网运行安全分析、电力系统状态估计、电力负荷预测、自动发电控制、自动经济调度并适应电力市场运营的需求等。
国家电网调度和大区电网调度控制中心的计算机设备配备比省级电网调度控制中心的规模大,服务器及网络设备容量大,功能性应用软件也有差别。地区电网调度是指城市供电网的调度,调度功能和调度范围要比大区电网和省级电网小得多,地区电网调度不对发电厂进行控制,主要对供电网内的各级变电站和配电网进行实时监控,保证安全可靠供电。县级电网调度控制中心设备规模一般要比地区电网调度小,并且工作站、服务器一般选用工业或普通商用PC机。
1.2 变电站自动化
电力系统中变电站与输配电线路是联系发电厂与电力用户的主要环节。变电站自动化的目的是取代人工监视和电话人工操作,提高工作效率,扩大对变电站的监控功能,提高变电站的安全运行水平。变电站自动化的内容就是对站内运行的电气设备进行全方位的监视和有效控制,其特点是全微机化的装置替代各种常规电磁式设备;二次设备数字化、网络化、集成化,尽量采用计算机电缆或光纤代替电力信号电缆;操作监视实现计算机屏幕化;运行管理、记录统计实现自动化。变电站自动化除了满足变电站运行操作任务外还作为电网调度自动化不可分割的重要组成部分,是电力生产现代化的一个重要环节。我国变电站自动化系统从初始研发最终到超高压变电站普及应用总共化了7~8年时间。我国变电站自动化系统20世纪90年代初先在35kV变电站投运试点,继而在110kV变电站投运;1998年前后在220kV变电站推广应用;2000年以后国500kV超高压变电站建设全部采用了变电站自动化系统方案。变电站自动化系统与上一代常规二次设备相比明显具有占地面积小、功能强、可靠性高等优点,很快在电网建设中得到普及。
3.计算机技术在电力系统自动化中的具体应用
计算机技术在配电网系统自动化中的应用随着科学技术的发展,电网的整体改造进入智能化阶段,也就是通过计算机技术的应用来实现配电的进一步智能化。当前,配电系统主要是由主站、子站以及终端这三部分构成,通过计算机技术的融入能够实现三部分之间的有效沟通,进而实现了信息资源的高度共享。而信息资源的共享能够为配电系统实现高效运行奠定基础。
2.1 计算机与电力系统融合的优势作用
要想确保电力系统的稳定、安全运行,就需要实现对系统各个部分运行情况的有效监管,而在传统的电力系统管理工作中,以上各环节工作的开展都是依赖人工来完成的,进而难免因各种误差等因素的存在而影响到电力系统的正常运转。而随着计算机技术的不断发展,计算机技术被广泛的应用于各行业之中,其在电力系统中的应用充分的体现出了自动化对于电力系统的重要性。将计算机技术应用到电网系统中,能够实现各环节的自动化处理,进而以计算机的智能化来取代人工,有效的提高了电力系统的工作效率,这对于电力系统整体服务质量的提升来讲有着极大的影响作用。以计算机技术为媒介来实现电力系统的自动化,能够在提高各项检测数据准确度的基础上,实现对部分数据信息的自动化处理,进而在降低工作人员压力与负担的基础上,确保了电力系统的稳定运行。
2.2 计算机技术在电力系统自动化中的研究热点和发展趋势
基于计算机技术的电力自动化设备的电磁兼容问题电力系统中微机型产品的应用愈来愈广泛,并已成为电力系统自动化控制类产品的发展方向。但是电力系统是一个非常复杂的系统,其电磁环境亦非常恶劣,以微处理器为核心的微机型产品很容易受到这些电磁干扰而导致误动、拒动、数据丢失或死机等故障,给电力系统的安全经济运行带来了非常严重的事故隐患。电磁兼容问题成为当前的一个研究热点。
2.3 计算机视觉技术在电力系统自动化中的应用
随着视频技术和红外成像技术在电力系统中的广泛应用,图像信息在电力系统自动化中所起的作用越来越重要,而且对图像信息分析与理解的要求也越来越高,使得在一些应用场合必须利用计算机视觉技术由计算机替代监控人员进行图像理解。电力系统是一个信息、能量变化非常迅速的系统,过渡过程往往在一瞬间完成,一旦发生故障,要尽量在短时间内消除,否则很容易造成事故的扩大化。如果能在保证电力系统安全的前提下,将基于图像识别的计算机视觉技术运用到图像信息分析与理解中,就可实现电力系统图像信息的智能处理。
2.4 计算机智能控制技术在电力系统自动化中的应用
电力系统随着电气化和自动化水平的提高而日益快速地从量和质两个方面在发展变化,现代高新技术也日益向其渗透交叉。控制理论于电力系统的安全稳定控制的巨大效益以及现实可用性和广阔前景。近年来,模糊技术、神经网络、专家系统等技术的发展又开拓了智能控制技术的新道路。
4.结语
电力系统自动化是现代计算机技术应用的一个重要领域,计算机发展过程中的每一项新技术、新成果都会以最快的速度被电力系统自动化应用,计算机技术的发展推动了电力系统自动化的进程。本文通过对电力系统自动化系统进行了简要的概述,然后阐述了计算机技术在电力系统自动化中的应用,以及推动电力系统自动化技术的发展历程,并着重探讨了计算机技术在电力系统自动化领域的研究热点和未来发展趋势。
参考文献
中图分类号TP39 文献标识码A 文章编号 1674-6708(2013)90-0224-02
1 概述
计算机识别系统一直计算机电子类研究的热点,随着各项技术的进步,这一工作的实现越来越容易,利用一些成熟的识别函数,实现图像的精确识别是本文的主要工作,在设计和实现过程中制作了一种小型的低功耗嵌入式设备来实现这一功能。本文通过开发一个图像识别的嵌入式系统,开发CMOS摄像头的驱动程序,实现数据的高速采集,并利用ARM9处理作为中央处理器将采集的图像信息分析加工成与人眼识别效果相当的参数。
2 系统设计与实现
2.1系统设计
本文应用的OpenCV全称是Open Source Computer Vision Library,是Intel公司支持的开源计算机视觉库。它使用类c语言和cplus语言实现的,程序模块化程度高,可以打包成函数或者函数库,对图像处理的函数接口都进行了简单通用的封装,能够实现基本的视觉识别并且算法通用。它的应用领域有人机互动、物体识别、图象分割、人脸识别、动作识别、运动跟踪、机器人视觉[1]。
2.2硬件系统设计
计算机庞大的种类中,有一个系列被命名为“嵌入式”计算机,嵌入式与普通计算机最大的区别就是其专用性比较强,可以根据需求,自由的增减接口、设备等。通过对当前嵌入式系统“生态环境”的对比,技术应用比较广泛,而且在工业和消费电子产品中具有大量的开发团队和开源软件系统支持的是ARM系列嵌入式系统。目前ARM系统的主要芯片从ARM7到最新的CORTEXA9都有相当数量的产品,但从性价比和驱动数量来说,ARM9具有强大的优势,本系统就采用ARM9系列处理器中一款自带CMOS摄像头采集接口的芯片作为核心处理器。
在实际研发过程中,由于2.0双排插针在试验中不方便外界信号线和测试调试,通过进一步宽展其接口,我们设计与制作了一个接口扩展板。
2.3软件实现
软件部分采用linux2.6内核,精简化linux操作系统,通过对不需要的内部插件进行精简,整个操作系统,包括驱动程序在内不超过60M字节,而且运行速度可以保证,由于系统功能集中,文件系统和应用程序运行资源需求固定,所以能够长期稳定运行,功耗也比较低,具有小型化,便携性,低功耗的特点。为保证系统的稳定和速度,采用了嵌入式驱动模式,将CMOS接口的驱动程序和内核统一编译,体积更小,运行更稳定。
确定操作系统和平台之后,在应用程序开发过程中重点采用了opencv中一些库函数。OpenCV具有众多函数库,OpenCV 拥有包括 500 多个C函数的跨平台的中、高层 API。它不依赖于其它的外部库――尽管也可以使用某些外部库。
利用piggingny 算法做边缘检测,其函数为:
void cvpiggingny( const CvArr* catchimage, CvArr* edges, double threshold1,
double threshold2, int aperture_size=3 );
函数中catchimage为输入图像;edges为输出的边缘图像;threshold1为第一个阈值 ;threshold2 为第二个阈值;aperture_size 为Sobel 算子内核大小。
函数 cvpiggingny 采用 PIGGINGNY 算法发现输入图像的边缘而且在输出图像中标识这些边缘。threshold1和threshold2 分别为大阈值和小阈值,在图像边界确定过程中,边缘是否连接由最小的阈值来限定,而那些属于图像边界则由大的阈值来控制[2]。
在进行边界确定和绘制之前,有些涉及二值化的问题,可以用不同的颜色转换方法实现,比如用色彩空间转换法。有一种转换方法用到了Bayer 模式,这是一种广泛应用于 CCD 和 CMOS 摄像头图像数据处理的模式。它允许从一个单独平面中得到彩色图像,然后对初步处理的图像进行结构分析,利用二值化后对阈值的选择进行测试并进行形状的模糊识别。
得到训练成熟的分类器,就可以实际应用与图像识别。但输入图像识别区域必须与训练样本具有相同的尺寸才能保证识别效果。分类器的值可以有两个,一个为0,一个为1,0表示图片的数据特征经检测不符合现在分类器的目标,1就是符合的意思。如果图像采集的尺寸大小不同则可以分区域进行单独处理。大图片分多个区域,小图片则置于正中心用白色背景补充整副图像。为了提高适应性,可以设计类别分支模块有多个尺寸,根据目标物体大小进行自动选择,试验中发现类别分支模块被设计为可以进行尺寸调节的类型后效果非常好,这比只改变待检图像的尺寸更好[4]。工作流程变成了多次扫描,第一次进行整体区域划分,接下来进行单个区域分析并分级,然后对不同数据集进行分析,效果自然是好了,但这样会增加识别时间[5]。
在不同的分类器中,算法和实现过程都有区别,形成了各式各样特点的分类器。有的以检测目标区域的大小和探测物体的形状面积进行对比,只有当面积达到一定的数据量才能进行相应比例的检测。比如可以设定这个比例是1:3的关系。就是当检测目标的区域内有效的黑色边框包含的面积和检测数据采集区域的面积之比为1:3时,就属于该比例系数规定的检测算法,才可以用这一级别的分类器进行识别,这主要是为保证识别的准确性。
3 测试结果
3.1针对彩色笑脸的多脸谱识别
3.2真实头像识别
4结论
OpenCV包含的程序和函数非常多,汇集了全球精英的智慧和劳动成果,同时又是开源代码,可以让更优秀的人去更改和提高,如果能够很好的加以利用,可大大提高工作效率。有些识别程序甚至不需要添加外部支持也可以直接编译连接形成可执行应用程序。
对于这种开源系统的移植非常便捷,无论做专用的DSP还是嵌入式系统都有其开源的强大优势和通用的接口标准。而标准的API将简化计算机视觉程序和解决方案的开发,OpenCV致力于成为这样的标准API[6]。OpenCV的程序开发中,对于自由使用也有一定的限制,但它只是限制性的表明你的应用也要开源,如果要进行相应的商业开发则需要进行版权说明,无论哪种情况都是免费的,不需要担心专利等问题。它为Intel Integrated Performance Primitives (IPP) 提供了透明接口。在某些嵌入式系统上运行时,系统不会提示你加载某些程序,而是会利用其透明接口自动实现。
本文中图像识别的复杂程度并不高,但是能够完整实现小型嵌入式系统的图像轮廓识别。对于目前无人驾驶汽车等领域有积极的应用价值。随着嵌入式系统的普及应用,通过对开源视觉库的进一步研究,将其移植到小型计算机系统中是可行的,为此本文首先确定硬件系统平台,在此基础上进行应用软件库的开发,使得运行精简指令集的嵌入式系统也能够具有与通用计算机一样的图像识别能力。
参考文献
[1]聂伟乐,瞿建荣.基于OpenCV的运动目标光流算法仿真[J].应用光学,2008,29(6):8-67.
[2]吕学刚,于明,刘翠响.IPL和OpenCV在VC++环境下的应用[J].微型电脑应用,2003,19(1):33-35.
[3]何臻祥,陈波.基于三星S3c2440bootloader的研究[J].软件开发与应用,2008,27(6):92-94.
中图分类号:TP391.41 文献标识码:A文章编号:1007-9599 (2011) 15-0000-01
The Image Recognition and Analysis of Intelligent Monitoring System
Yi Junxiao
(Beijing University of Technology,Beijing100022,China)
Abstract:At present,along with the computer communication technology and network technology fast development,the image processing technology in the field of science and technology is getting more and more important position.Image recognition belong to intelligent monitoring equipment the most important technology,this paper in this part of the intelligent monitoring system based on intelligent monitoring system image recognition.The key:technology of intelligent image monitoring system image recognition and classification for analysis.
Keywords:Intelligent monitoring system;Image segmentation;Image recognition
一、智能监控系统概述
智能监控系统采用先进的数字图像压缩编解码技术、数字图像传输技术等图像处理技术,以及模式识别、计算机视觉技术,通过将智能视频分析模块增加至监控系统中,借助计算机强大的数据处理能力自动识别不同物体,在分析抽取视频源中关键有用信息的同时,过滤视频画面无用的或干扰信息。整个系统组网灵活,可以突破地域的限制,并以最快和最佳的方式发出警报或触发其它动作,进行遥远范围大规模的实时图像监控和报警处理。
二、智能监控系统图像识别的关键技术
(一)图像分割技术。图像分割是由图像处理迈向图像分析的关键步骤,其实质是正确地划分属性区域,在分离日标和背景的基础上,为计算机视觉的后续处理提供依据。分割技术依据区域的一致性和几何邻近度,可以分为三种类型,即基于像素和其邻域局部特性进行分割的局部技术;以全局信息作为图像分割依据的全局技术;以及分裂、合并和区域增长技术。图像分割方法主要包括阈值法、边缘检测法以及区域跟踪法。阈值分割法较为常用,常用的算法有最小误差阈值法、最大类别方差法及最佳直方图熵法等。由于传统的图像分割算法有着对噪声敏感、计算量大等方面的缺陷。基于尤其是基于模糊技术的人工智能原理图像分割算法开始引起人们的关注。在图像分割过程中所涉及到的模糊技术主要包括模糊阐值技术、模糊聚类技术以及模糊边缘检测技术等。
(二)图像颜色分割原理。图像颜色分割是将分割具相同或相近颜色特征色块的图像处理方法,主要包括:(1)像素分类:像素通过颜色的阈值进行分类,像素采用RGB、YUV、HIS等描述方式。(2)像素连接:将图像进行游程编码处理,即将图像编码成以run格式为单元的编码处理。游程编码处理是run格式指的是一行像素之内相邻且具有相同逻辑值的像素集合。作为色块合并的基础,像素连接通过分类后的像素信息实现。(3)色块合并:按一定规律合并所得到的游程,即将游程按照parent归类至一个树结构下的过程。每一个游程在带有效信息的基础上配有指向游程parent的指针。(4)区域融合:为了避免处理过程被判断为两个分离开来的区域,需要引入区域融合方法,使相邻近的部分合并成为一个整体。由于面积和边框同为区域统计量,因此可以进行同一种密度测量方法的使用。倘若某几个部分的区域像素密度大于某个阐值,即可将这些区域合并成成为一个区域整体。在色块合并中,即使区域存在被一根线分割的情况,但这部分的密度倘若仍旧大于阐值,应当将它们看作一个整体区域进行区域融合。
三、智能图像监控系统的图像识别与分类
(一)图象识别技术。图像识别以研究图像的分类与描述为主要内容,对图像用预先存储的对象物的参照图案进行匹配,并输出文字识别和脸部图像识别等符号信息,或者输出物置或姿态等数值信息。图像识别涉及的领域较为广泛,包括机械加工中零部件的识别、分类;农作物、森林、湖泊和军事设施的遥感辨别;气象数据、气象卫星照片的准确观测;身份证识别等方面。
图像识别方法可归纳为统计方法和结构识别方法两大类。一个图像识别系统可分为四个主要部分:(1)图像信息的获取:将图片等信息经系统输入设备进行数字化处理,再输入计算机以备后续处理。(2)图像加工和预处理:将原始图像转化为适合计算机进行特征提取的形式,包括图像变换、增强、恢复等,目的是去除干扰、噪声及差异。(3)图像特征提取:将调查而得的数据材料进行加工、整理、分析、归纳等处理,以提取出可以反映事物本质的特征。(4)判断或分类:根据所提取的特征参数,通过采用某种分类判别函数和判别规则分类和辨识图像信息,最终得到图像识别结果。(二)图像识别的几何特征描述。图像识别特征具有多种形式的描述,效果取决于图像识别的具体状况。在多数情况下,只需图像的局部特征即可识别图像,这些特征诸如图像的灰度级空间分布特征,图像颜色和波段,图像随时间变化的形态,图像形状、轮廓、面积和空间点位置等。而图像识别的几何特征描述包括周长、面积定义和算法(面积和周长较为容易计算),占空比、圆形度,形状的投影描述以及特殊的形状描述子(多数情况下,可以用来简洁地描述物体图像形状)等方面的内容。(三)图像识别分类器设计。在图像识别中,分类器的基本任务是通过图像分类特征、分类运算法则的应用,对图像进行分类。图像识别分类器必须提取和选择特征,以便对被识别的图像数据进行大规模的压缩,有利于最终的图像识别。分类器设计的主要步骤为分类识别特征的确立。此为关键步骤,特征若提取得不恰当,就无法精确分类,甚至无法进行分类,良好的特征应具有可区别性、可靠性、独立性以及数量少四个方面的特征。
特征提取和选择应当坚持尽可能减少整个识别系统的处理时间和错误识别概率的原则。当这两个原则无法兼得时,则应做出相应平衡的选择,或者提高整个系统速度,以适应实时需要;或者缩小错误识别的概率,以提高识别精度。图像识别系统的复杂度将随着特征个数的增加而迅速增长,特别是用来训练分类器和测试结果的样本数量,将随着特征数量的增加呈现指数关系增长。特征选取的方式将因不同的模式而异,并与识别的目的和方法等有着直接的联系。
参考文献: