基于webrtc多人音视频的研究（一）

基于webrtc多人音视频的研究众所周知，WebRTC非常适合点对点（即一对一）的音视频会话。然而，当我们的客户要求超越一对一，即一对多、多对一设置多对多的解决方案或者服务，那么问题就来了：“我们应该采用什么样的架构？” 。简单的呢有人会考虑copy多个p2p就完成了多人之间的会话，可并没有考虑到到来的问题：cpu、内存、尤其是流量问题；传统的解决方案是MCU服务器，利用服务器硬件...

敬我岁月无波澜

15989人浏览 · 2016-11-09 17:26:46

敬我岁月无波澜 · 2016-11-09 17:26:46 发布

基于webrtc多人音视频的研究

众所周知，WebRTC非常适合点对点（即一对一）的音视频会话。然而，当我们的客户要求超越一对一，即一对多、多对一设置多对多的解决方案或者服务，那么问题就来了：“我们应该采用什么样的架构？” 。简单的呢有人会考虑copy多个p2p就完成了多人之间的会话，可并没有考虑到到来的问题：cpu、内存、尤其是流量问题；传统的解决方案是MCU服务器，利用服务器硬件的能力去mix音视频，然后传给各个参与者，这能到达预想的，这个亦能到达我们的需求；使用基于网状拓扑结构的结构可能是前两者的折中之选。

尽管能实现WebRTC多人音视频的方案，该技术的最流行的用途不局限于多方视频会议场景。不要以为只是传统的音视频会议室，更多的情况包括：智能硬件、ipcamera、在线课堂，实时直播等。在每一种情况下，服务器的能力是能够从多个源的媒体流分发到多个客户端。所以...如果你是一个服务供应商如何才能在实现支持WebRTC的多方拓扑结构？

有几种不同的架构根据您的要求，可能是合适的。这些架构基本上他们围绕二点：

§ 集中VS对等网络（P2P）

§ 混合VS路由。

我将在这里介绍最流行的解决方案。如果你需要去深入到协议的影响和实施细则的架构，你可以找到所有的相关信息，RTP拓扑IETF文档。

Mesh解决方案

Mesh方法是最简单的解决方案。因为它不需要假设任何服务器，而且直接使用成熟的WebRTC传输方案。该体系结构基于从每一个发送者创建多个一对一的数据流到每一个接收端。

Mesh解决方案

即使它看起来像一个低效的解决方案，在实践中是非常有效的，并且延迟最低，每个接收端都会根据实际情况产生不同的比特率。

唯一的问题是，这种解决方案需要大量的上行带宽将媒体流同时发送至所有目的地，现有的设备实现所需的CPU功率会显著上升。

Mixer解决方案

Mixer的做法是多人视频会议的传统解决方案，并且使用多年取得了巨大成功。这一成功可以归功于它需要客户端更少消耗这一事实。该架构基于具有中心点保持与每个参与者一对一的流的特性。中心元件接收并混合每个传入的音频流和视频流，以合成一个单一的流出到每一个参加者。在视频会议行业对于这些集中元件的一个常见术语是多点控制单元（MCU）。在实践中，使用一个MCU的通常是指一个混合器容器。