计算机视觉的应用前景如何?可能有哪些不错的应用?

举例说说看
关注者
185
被浏览
35,066
收录于知乎圆桌 ·

造数 - 新一代智能云爬虫

【计算机视觉概念】

计算机视觉是人工智能的一个分支科学,是使用计算机及相关设备对生物视觉的一种模拟,

主要是研究如何使机器“看”,通常是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理。通过计算机视觉,电脑将处理更适合人眼观察或传送给仪器检测的图像。计算机视觉的主要任务是通过对采集的图片或者视频进行处理以获得相应场景的三维信息。

【计算机视觉细分领域】

机器视觉系统的工作原理是:通过机器视觉产品(即图像摄取装置)将被摄取目标转换成图像信号,传送给专用的图像处理系统,得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。

计算机视觉主要分为视频处理和图片处理两个大部分。

目前人计算机视觉的图片处理方向大致有:

计算机视觉视频处理的核心是视觉关键信息识别,

【计算机视觉发展大事记】

1、计算机视觉始于20世纪50年代的统计模式识别,当时主要集中于分析与识别二维图像,

如光学字符识别、工件表面、显微图片和航空图片的分析和解释等。

2、20世纪60年代,人工智能学者Marvin令学生写出程序,让计算机自动“了解”所连接摄像头的内容,计算机视觉被拉开。1965年,Roberts通过计算机程序从数字图像中提取出诸如立方体、楔形体、棱柱体等多面体的三维结构,并对物体形状及物体的空间关系进行描述,开创了以理解三维场景为目的的三维计算机视觉的研究。Roberts对积木世界的创造性研究给人们以极大的启发,于是人们对积木世界进行了深入的研究,研究的范围从边缘的检测、角点特征的提取,到线条、平面、曲线等几何要素分析,一直到图像明暗、纹理、运动以及成像几何等,并建立了各种数据结构和推理规则。

3、20世纪70年代中期,麻省理工学院人工智能实验室——CSAIL(CSAIL是麻省理工学院最大的实验室,也是世界著名的计算科学和人工智能实验室),正式开设“计算机视觉”(Machine Vision)课程,同时麻省理工学院的实验室也吸引了国际上许多知名学者参与计算机视觉的理论、算法、系统设计的研究。1973年,David Marr教授在MIT AI实验室领导一个以博士生为主体的研究小组,1977年提出了不同于“积木世界”分析方法的计算视觉(computational vision)理论,该理论在80年代成为计算机视觉研究领域中的一个十分重要的理论框架。

4、20世纪80年代中期,计算机视觉获得了迅速发展,主动视觉理论框架、基于感知特征群的物体识别理论框架等新概念、新方法、新理论不断涌现。1999年,Nvidia公司在推销自己的Geforce 256芯片时,率先提出了GPU概念。GPU是专门为了执行复杂的数学和集合计算而设计的数据处理芯片。它的出现为并列计算奠定了基础,同时也增长了数据运算处理速度、扩大了数据处理规模。

5、进入21世纪,计算机视觉与计算机图形学的相互影响日益加深,基于图像的绘制成为研究热点。高效求解复杂全局优化问题的算法得到发展。

【未来计算视觉的发展】

计算机视觉作为人工智能的基础技术,在未来的发展趋势将是与其他技术融合推到创新型行业发展。

1、汽车驾驶方面。

20世纪70年代开始,美国、英国、德国等发达国家开始进行无人驾驶汽车的研究,在可行性和实用化方面都取得了突破性的进展。中国从20世纪80年代开始进行无人驾驶汽车的研究,国防科技大学在1992年成功研制出中国第一辆真正意义上的无人驾驶汽车。2005年,首辆城市无人驾驶汽车在上海交通大学研制成功。世界上最先进的无人驾驶汽车已经测试行驶近五十万公里,其中最后八万公里是在没有任何人为安全干预措施下完成的。据汤森路透知识产权与科技最新报告显示,2010年到 2015年间,与汽车无人驾驶技术相关的发明专利超过22,000件,并且在此过程中,部分企业已崭露头角,成为该领域的行业领导者。无人驾驶汽车是智能汽车的一种,也称为轮式移动机器人,而无人驾驶主要依靠车内的以计算机系统为主的智能驾驶仪来实现无人驾驶的目标,这与计算机视觉是密不可分的。

除了互联网公司研究的无人驾驶,各大传统汽车公司如宝马、奥迪等也在紧罗密布地研究自动驾驶技术,自动驾驶最核心的技术就是汽车里的电脑通过摄像头实时产生的图片和视频从而学习驾驶,此外行人探测、道路识别、模式识别也都离不开计算机视觉。

2、AR、VR的技术增强。

AR——增强现实技术(Augmented Reality,简称 AR),是一种实时地计算摄影机影像的位置及角度并加上相应图像、视频、3D模型的技术,这种技术的目标是在屏幕上把虚拟世界套在现实世界并进行互动。

VR是虚拟现实技术的简称,是一种可以创建和体验虚拟世界的计算机仿真系统,它利用计算机生成一种模拟环境,是一种多源信息融合的、交互式的三维动态视景和实体行为的系统仿真使用户沉浸到该环境中。

计算机视觉是AR VR搭建视觉呈现模型的基础,提供交互情景交流的核心基础。VR和AR通常应用在游戏上,比如前阵大火的Pockman GO等游戏,但是PS4 的研发团队说,VR 之所以一开始主要应用在游戏上,是希望大家通过游戏来学习 VR 的“互动规律”,让我们的双眼、大脑适应适应,之后逐渐应用在了医疗卫生领域。有了VR、AR,医护人员在学习新技能、练习手术操作时,就能历史上第一次在一个 “犯了错误也不要紧” 的环境下练习,万一失误,也不会对患者造成危险。

在这个前提下,VR/AR与医疗的结合将分成三类:

第一类是“做手术” 类;

第二类是“医师技能训练” 类;

第三类是“患者康复训练” 类。

3、更优秀的图片与视频处理。无论是各种黑科技的美图软件还是各种奇幻的视频处理,其核心技术都是利用计算机视觉进行的降噪、图像分割、图像处理、视频压缩。此外,相机中的人脸追踪,快速对焦,人脸识别无疑不与计算机视觉有关。可以预想得到在未来计算机视觉的帮助下将产生越来越多的“照骗”。