发布日期:2022-04-26 点击率:48
一 基础篇
1.1 图形、图像和视频
图形(graphic):和图像与视频不同,有一种说法是图形就是自然界的客观世界不存在的图案。对于计算机中的图形研究,有专门的计算机图形学,主要的研究对象是点、线、面等抽象事物。目前所谓的计算机显卡3D技术支持,主要就是图形技术相关的范畴。关于图形方面的开发,好象OpenGL是其中比较有名的3D图形库。
图像(image):和图形相反,图像可以定位为自然界中客观存在的图案。图像处理和我们有关系的大致是图像滤波处理和图像压缩。目前用得最多的静止图像压缩算法就是jpeg了,大家应该都很熟悉。而对图像的其他处理,一般称之为对图像进行滤波,图像处理方面,photoshop软件很多人应该都很熟悉,它图像处理的功能十分强大。在视频行业,主要是关注消隔行滤波器、去除摄像头白噪声滤波器、去除块效应(deblock)滤波器等。
视频(video):视频我的理解就是连续的图像,被称为视频。对视频图像的处理,核心是压缩,其他的就是采集、传输、显示和录像了。视频图像如果不压缩的话,传输和录像的成本都太高了。
1.2 视频的采集、压缩、传输、解码显示和存储
视频采集最重要的设备就是摄像头了,它将自然界中的客观场景转化为模拟的电信号输出。如果是数字视频应用系统,还需要专门的设备或者器件完成图像信号的模拟到数字转换,这也是摄像头很难直接接入PC机的原因。早期的接入方式是通过PC上用户自己配的采集卡来完成,这种方式现在也有,现在有专门通过USB接口接入PC机的USB摄像头,它是在摄像头内完成了模拟到数字的转换,输出数字信号到USB接口。
视频的压缩是视频处理的核心,按照是否实时性可以分为非实时压缩和实时压缩。实时性与否,区别其实很大,一般来说,制作DVD等影片可以算作非实时性压缩,此时,算法的选择应该是要提高压缩算法效率,而不是性能,因为,即使一天完成一部影片的压缩的话,大多数时候,问题可能也不大。而对于类似网上直播这样的应用,则属于实时性压缩应用了,此时在算法选择上,算法的性能可能是第一位的。目前看,实时性压缩的应用更广泛些。关于视频压缩部分,详细的介绍我们放在后面的章节进行介绍。
视频的传输分为两种,一种是模拟视频的传输,也就是摄像头电信号进行远距离传输,这种主要是在传统的视频监控系统中应用,它的成本比较高,传输距离也有限制,而且随着距离的增大,会出现信号衰减和信道噪声等问题;另一种传输是和互联网技术结合起来,先把数字视频信号压缩后得到码流数据,然后通过网络传输到远端。随着互联网的高速发展,后一种应用方式越来越普遍,最早期应该算是视频会议系统,现在的应用就更多了,最新的比如手机上网观看视频等。其实,抽象看,互联网它其实就是一个信息平台,而在这个信息平台上,传输的信息相当大比例就是多媒体数据。可以想象,今后随着互联网带宽的不断提高,视频的应用将越来越广。
对于互联网传输过来的视频信息,首先是要进行解码,然后才是显示。解码的芯片有一定的性能要求,比编码器低些,但是毕竟是视频数据处理,通用的芯片(不支持MMX等多媒体指令)可能会比较吃力。显示设备主要有电视、监视器和显示器,他们的信号接口是不一样的,电视监视器是模拟的电信号,显示器的输入应该是数字信号。另外多说一句,现在的显卡似乎普遍支持电视输出。
1.3 视频相关行业介绍
以视频技术为基础,结合其他领域的技术突破,满足了人们各种各样的需求,形成了很多视频相关的行业。这些行业之中,我们来了解一下如下四个方向。
1.3.1 多媒体消费类应用
多媒体消费类应用在技术上主要是视频压缩技术和媒体存储技术的结合,主要的产品形式是VCD(早期)和DVD,偏向消费类的家庭应用。这几年随着DVD光驱的普及,在PC上观看DVD也逐步流行起来。该行业的视频压缩属于非实时压缩,追求的是高清晰度,一般的分辨率都是D1(720*576),而且,它的音频品质也要求很高,采样频率和采样精度都非常高。DVD的视频压缩算法是mpeg-2,而它的音频是LPCM、DOLBYAC3、mp3或者aac。
DVD的存储技术表现形态就是DVD光盘,目前市面上常用的DVD光盘最大容量可达4.7GB。目前DVD技术最发达的是日本,他们的专利最多,技术也最领先,基本上处于垄断地位了。
中国也有自己的DVD标准,叫做EVD,这个公司很久前就在努力的推广他们的标准了,不过客观的评价,进展不能算很乐观,还需要努力。
多媒体技术在家庭中的应用,这几年也出现了一些很好的亮点,比如家用电视支持网络和媒体功能、电视支持录像功能等,不过总体评价,这些都还远远没有普及,还需要进一步发展。个人更看好以机顶盒这样的方式来满足多媒体需求。
1.3.2 视频会议
视频会议可以说是视频技术应用最古老的行业了,之所以这么说,是因为第一个视频压缩标准H.261就是为了视频会议而制定的。
视频会议行业是实时音视频压缩技术和网络通信技术结合的产物。目前视频会议系统的发展,除了满足人们基本的语音和图像信息交流外,还包括了强大的数据信息共享、开展协同工作等功能。
视频会议系统主要包括的产品有:语音输入输出设备(mic、音箱等)、摄像头、电视、视频会议终端、MCU等。视频会议专用的摄像头日本索尼公司市场占有率无可争议的是第一。而视频会议终端和MCU市场目前排第一的是美国的polycom公司,polycom的音频技术非常强大,它在中低端市场优势很明显,而挪威的泰德(tandberg)在高端市场则做得更好一些。视频会议系统对音视频技术和网络技术要求都比较高。从实际应用来说,相对视频,视频会议系统对音频要求更高一些。随着现在视频技术的发展和网络带宽的不断改善,人们对视频的要求也越来越高,不过,音频方面的处理始终是关键,比如回声消除技术等。
1.3.3 视频监控
根据目前比较流行的划分方法,视频监控行业已历经三代。第一代被称为CCTV监控,也就是一个摄像头加一个监视器组成一个最简单的视频监控系统,很多时候还只是黑白的监控画面,目前采用第一代监控系统的客户已经很少了,不过在一些很小的便利店、超市,我们还是可以看到这样的监控系统。第二代视频监控系统典型的产品形态是板卡和DVR,即使到现在,这种监控系统也还很流行,在第二代监控系统中表现最好的企业是杭州海康,他们几乎垄断了板卡市场,DVR市场占有率也连续几年排名第一了,第二代监控系统核心是实时视频压缩技术,把摄像头拍摄下来的画面进行压缩和存储到本地硬盘。目前,视频监控行业已经发展到了第三代,也就是远程视频监控,它把网络技术和视频压缩技术结合起来,不过和视频会议系统不同的是,监控行业对音频的要求不高,但是,对图像的要求却高很多,从传统的要求来说,视频监控不仅要求图像能够更清晰,对帧率的要求也很高,这也是从监控的安全考虑的需求。
远程监控系统的主要产品是视频服务器(IPVS,也有产商叫DVS)和网络摄像机(ip camera),这两种产品都具备实时压缩和网络传输的功能,功能上的区别是IP camera自带摄像头,而IPVS需要用户自己配摄像头,当然,IPVS在满足监控市场的需求上,比IP camera更强大一些,一般来说,图像的压缩效果也更好些,而且,它一般还支持所谓的报警输入输出接口,当然,在价格上,网络摄像机有比较大的优势。
1.3.4 流媒体行业
流媒体也是网络技术和视频压缩技术结合的产物,它的具体应用形式很多,比如网上直播、手机流媒体、IPTV(网络电视)等等,都是比较新的东西,再比如现在网络上流行的所谓播客,我也把它归类为流媒体行业。
流媒体应用,对编码器的要求可能是最高的了,这是因为每台流媒体服务器都会有很多用户来连接访问媒体数据,压缩率如果提高的话,同等图像质量下,同等图像带宽可以支持更多的用户,这点很重要,流媒体行业应用的最大瓶颈就是服务器支持的用户数了。
为了解决服务器的这一瓶颈,最近几年出现了一种叫做P2P的网络传输技术,它号称是用户越多,用户欣赏视频会越流畅,而需要的服务器仍然只是一台。这个技术最成功的产品案例就是skype软件了,好像是2005年它被ebay以26亿美元成功收购,这即使到现在,也被称为一个互联网历史上不可复制的奇迹。除了skype,其他应用P2P技术的直播软件还有pplive等,现在也都比较流行。
IPTV算是流媒体在家庭的一个应用形式,前两年在国内也很火过一阵子。我的感觉,单纯从技术上评价,IPTV也还有点早了,现在可能还不太成熟,我的理由有如下几点:目前家庭用户上网主要的带宽还是2兆或者以下,在这个带宽下,目前主流的压缩技术,压缩出来的效果可能和有线电视比还相差很明显,要想进一步提高,可能还需要H.264的普及应用。如果要升级到H.264的话,也就是说目前的IPTV机顶盒在技术上还不够成熟,并不能一步到位解决问题。所以,感觉IPTV在技术上要可行,可能还需要再等3-5年吧。
1.3.5 视讯行业
所谓的视讯行业,就是视频和通讯技术结合的行业,上面所说的视频会议、远程视频监控和流媒体行业都属于视讯行业的范畴。
还有一个很有影响的产品,就是IP电话,这个产品大家应该都很熟悉了,几年前也有过一段时间的炒作,现在看好像也还没普及,和IPTV类似,个人也是感觉还是有点早了,可能再过几年会有机会起来。它应该算是视频会议的家庭应用产品形态吧。
下一篇: PLC、DCS、FCS三大控
上一篇: 索尔维全系列Solef?PV