首页>论文>正文
日期
09/13
2010
咨询
  • QQ扫一扫

  • Vision小助手
    (CMVU)

基于MPEG-4技术的流媒体创作系统的设计改进
收藏
2010-09-13 14:20:50来源: 周皓  宋建新

摘要:在研究流媒体和MPEG-4技术的基础上,本文提出了一种基于MPEG-4技术的流媒体创作系统的改进方案。文中在原有的模块化、多线程的设计方法中加入打包策略改进该系统,从而提供一个创作流媒体的可视平台,有效地提高流媒体系统的整体性能。
关键词:流媒体;MPEG-4;MP4;打包

1  引  言
  随着网络的带宽越来越宽,用户对于多媒体业务的需求日益增大,尤其是近年来兴起的流媒体业务受到广大用户的欢迎。然而这个世界的发展是不平衡的,有些用户使用的带宽只有10kbps的数量级,有些用户通过无线信道来获得服务。为了保证不同的用户能够同样地享受到适合自身信道容量的流媒体业务,如何创作出适合于信道特性的流媒体成为一个重要的课题。
  本文提出了一种基于MPEG-4技术的流媒体创作系统(Streaming Media Creating System,SMCS),该系统能实时地根据设定的打包策略对各种音/视频源进行高压缩的编码,生成符合MPEG-4标准音/视频的不同质量的文件,通过流化最终生成适合于本地/远程点播和网络实时播放的MP4格式的流媒体文件,从而为用户提供高质量的服务。
2 系统的结构与模块作用

2.1 改进系统的结构
  目前流媒体内容通常来自两种渠道:实时采集后编码制作,由其他多媒体格式解码后再编码制作。
   第一种采集系统利用媒体采集设备进行流媒体的制作与生成。它包括了一系列的工具,从独立的视频、声音、图片、文字组合制作丰富的流媒体,这些工具产生的流文件可以存储为固定的格式,供发布服务器使用。流媒体内容采集创作系统可以实时向发布服务器提供各种媒体流,用于网络直播等业务。
   第二种创作系统利用软/硬件设备解码原始多 媒体格式文件并将多媒体数据编码为流媒体格式,供发布服务器使用。用于视频点播等业务。
   本文讨论的流媒体创作系统的解决方案是相关软/硬件的完美集成(见图1)。它兼顾了上述两种的优点,并加入了打包策略,主要包括下面几个方面的内容:
内容采集,音/视频捕获,打包策略,内容编辑预览,压缩编码,内容存储,媒体管理、发布。

2.2  改进系统的工作原理
   根据流媒体创作系统结构的特点,本文在程序设计上,采用模块化、多线程、打包策略的设计方法(见图2)。主要模块如下:
 (1)内容采集模块:对于不同的节目源,采集相应的数据,把诸如类型、大小、路径等参数传送给下面的模块。
 (2)音/视频捕获模块:该模块设计了三个滤波器即音频滤波器、视频滤波器、字幕滤波器。分别负责将音频流、视频流、字幕流从节目源中分离,并相应转换成WAV格式、YUV格式、待压缩格式,用于后面的编码。
 (3)打包策略模块:记录管理员输入的打包设置参数,并将参数传给压缩编码模块。目前只考虑几种固定信道容量的传输,在后面将详细论述。以后要做的工作是根据网络信道带宽的变化及时调整打包策略,以保证客户端用户流畅的观看流媒体内容。
 (4)编辑预览模块:该模块有两个作用,它记录了用户对音/视频及字幕进行调整的参数变化,并生成压缩编码配置文件;同时它根据用户对音/视频及字幕参数的调整,实时播放音/视频流及字幕流,使用户获得流媒体播放的最佳效果。
 (5)压缩编码模块:按照MPEG-4标准对音视频流压缩编码成AAC格式和mp4v格式。
 (6)内容存储模块:负责将音视频流、字幕流封装成MP4格式的文件,并流化。
 (7)管理发布模块:采用数据库的形式,记录流媒体文件的相关信息。
 (8)其他重要模块:比如系统缓冲区管理模块、线程调度模块等。

整个系统的设计采用了动态链接库[6](DLL)封装各个模块的功能类,这样便于系统功能的调试和升级。音视频采用MPEG-4标准压缩,充分发挥了MPEG-4的低码率、高压缩比的优点,同时,还采用了多线程的设计方法,能充分提高系统工作效率。
3 改进系统实现的关键技术
在流媒体创作系统的实现中使用多种技术,主要有:
1)线程间的同步
  采用多线程的方法[6]有助于提高系统编码效率,音频流、视频流及字幕流各自采用一个线程。线程间的操作是并行进行的,这样在媒体流合成时就要考虑同步的问题。在程序设计上我们采用了“事件”来同步各个媒体流数据的合成,最终生成可靠的MP4格式的流文件。在每个线程中还涉及对缓冲区数据读写的线程,我们采用“临界区”来同步这两个读写线程。
2)不同媒体流的同步
  在对媒体流进行编辑预览时,各个媒体流的相应参数会有所变化,这就要考虑到音频流、视频流及字幕流在播放时间上的同步。采用常见的时间戳(timestamp)来同步编辑过程中数据变化的位置,然后将这些参数的变化记录在压缩编码配置文件,以便于在媒体流压缩合成时,保持媒体流在播放时间上的同步。
3)打包策略
  目前采用四种设定的网络带宽,分别为:500kbps,350kbps,250kbps,100kbps。在用户需要判断自己的信道最接近上述的哪一种信道,然后做出选择。通过网页提交给流媒体服务器,服务器从存储系统中选择相应的流文件。在创作流媒体的时候,无论用于实时业务和点播业务,均生成四种类型的符合MPEG-4格式的文件。
在后续的研究中我们需要自动获取用户网络信道的带宽变化。信道发生变化的时候,对打包策略进行调整,确保用户始终收看到最适合信道状况的流媒体,防止发生丢包的情况。主要用于无线信道下的流媒体传输。
4 实验结果
我们对本文所改进的流媒体创作系统进行了测试,数据源采用cifsource200sec.cif大小为725MB,图像制式:PAL(352×288,25fps),生成cifsource200sec.mp4v格式的流化文件大小分别为(1)传输比特率采用500kbps时大小:12MB,(2)传输比特率采用350kbps时大小:8.47MB,(3)传输比特率采用250kbps时大小:6.06MB,(4)传输比特率采用100kbps时大小:2.47MB。
若采用数据源大小为50.0MB的DVD文件(.vob),生成MP4格式的流化文件大小为6.15MB,与常见流媒体制作工具微软的Producer2003的测试结果比较如图3所示:

  上列实验数据表明,本文提出的SMCS系统能高效、实时处理节目。具有以下特点:处理时间短;便于操作;媒体的音/视频质量明显优于VCD;高压缩比;具有流化作用;可以提供实时业务;并考虑到信道状态对打包策略的影响。
5 结 论
  通过理论研究、程序开发和系统在局域网实验表明本文改进的基于MPEG-4技术的流媒体创作系统能够进行多路媒体流实时的编码压缩、在线编辑预览、多路合成、实时流化、等功能,同时该系统还具有编码压缩率高、实时性好、容错性强、代码重用率高、兼顾信道状态的优点。
从而该系统充分利用网络资源,高效、方便地创作出适合于网络传输的流媒体,在实时网络多媒体研究中具有较重要的理论意义和实用价值。

参 考 文 献
[1] ISO/IEC 14496-1:1999(E) Information technology – Coding of audio-visual objects Part 1/2/3: Systems/Visual/Audio
[2] ISO/IEC JTC1/SC29/WG11 N4668 March 2002  Overview of the MPEG-4 Standard
[3] ISO/IEC JTC1/SC29/WG11 MPEG01/N4270-2 03 September 2006  MP4 version 2 (systems amendment 3) MPEG-4 Specific Format
[4] Network Working Group Request for Comments: 3016 Category: Standards Track  RTP Payload Format for MPEG-4 Audio/Visual Streams  November 2000
[5] Network Working Group Request for Comments: 1889 Category: Standards Track  RTP: A Transport Protocol for Real-Time Applications  January 1996
[6] 基于MPEG-4技术的流媒体创作系统的设计与实现 戴中华 宋建新 电视技术 2004 12期