直播业务概述

大家所熟知的直播平台虎牙、斗鱼、快手、抖音、B站,直播功能看似普遍,但从零到一开发却不简单。直播中运用到的技术难点非常之多,音频视频处理/编解码,前后处理,直播分发,即时通讯等技术,学好任何一项都需要比较高的成本,将它们融合到直播功能上更是难上加难。

由于公司新项目计划做直播产品,开发周期比较紧。经过调研:最快搭建一个直播功能的方案就是运用第三方直播SDK,低成本、效率高、风险低。本文将整理介绍几款主流的直播SDK,便于音视频直播的开发者清晰快速选择适合项目的SDK,开发者最重要的是:学会站在巨人的肩膀上编程,效率更高。

以下所有信息都是从官网文档收集人工整理汇总而成,有部分信息不确定或未提及若存在偏差,欢迎大家随时指正便于修改,希望能帮助到大家选择产品和服务快速搭建线上直播间。

直播产品介绍

2.1直播产品

直播产品定义:一个通用的直播模型一般包括三个模块:主播方、服务器端和播放端。

2.2直播类型

业务视角分类:一般分为单主播直播、多主播直播。主要区别在推流端的数量。单主播直播的特点是只有一个推流端(主播),多个拉流端(观众)。多主播直播的特点是有多个主播(推流端),和多个观众(拉流端)。

  • 单主播直播:最早的直播场景,只有一个主播推流,观众不能与主播连麦互动,只能看主播直播,比如单主播的秀场直播、职业培训这类场景。
  • 多主播直播:指主播之间进行互动连麦(多人连麦直播场景),主播与主播之间进行互动PK(PK直播场景)的一种直播类型。技术实现是在实时音视频的基础上,将实时音视频某个房间中的画面经云端混流后(多主播直播模式为了保证画面同步性一般采用混流服务),通过旁路直播的方式直播出来。
  • 连麦的主播使用的都是RTC服务所以延迟较低300ms左右,因观众不要求完全的实时同步,一般使用的是CDN的分发网络,延迟在3s左右。

直播根据延迟角度分类:分为CDN直播和超低延迟直播,CDN直播延迟通常延迟3s以上,超低延迟直播通常延迟小于1s。

  • CDN直播:传统的CDN直播方式,满足高并发的基础直播、对直播内容同步性无强要求的场景。可实现观众文字互动体验。通常适合单主播多个观众的直播间。
  • 超低延迟直播:与单向直播相比,强调多人连麦、画面特效等直播能力,给予观众“露脸发声”与主播互动的能力,因为对实时性要求更高。

2.3 实时音视频、旁路转推、直播分发、低延迟直播、CDN直播的区别和关系?

在这里插入图片描述

  • 实时音视频(Real-Time Communication, RTC):(关键词:双人/多人通话,UDP私有协议,低延时)主要应用场景是音视频通话和连麦直播。使用基于UDP的私有协议,其延迟可低于100ms,典型的场景:QQ电话、微信电话。即构实时音视频RTC覆盖各平台,除了iOS/Android/Windows之后,还支持小程序以及 WebRTC 互通,并且支持通过云端混流的方式将画面旁路直播出去。当业务对延迟敏感,通话场景要求比较高,或是需要小程序或者 H5 场景下的双人或多人音视频通话可以选择ZEGO实时音视频。
  • 旁路转推:旁路直播是一种技术,指的是将低延时连麦房间里的多路推流画面复制出来,在云端将画面混合成一路,并将混流后的画面推流给直播 CDN 进行分发播放。因为混流后的视频数据流和主/副播通话房间实际上并不是同一路流,而是在另外平行的一路,因而称为旁路,即不在主路。云端录制时,录制的流也是通过旁路的方式从流媒体中心引出,存到COS中。
  • 直播分发:(关键词:一对多,RTMP/HLS/HTTP-FLV,CDN)是一种非常典型的流媒体系统,通常会分为推流端、拉流端(或叫播放端)以及直播流媒体中心(直播源站),直播源站通常会使用CDN进行直播的分发,因此大部分情况下使用的是通用标准的协议RTMP,经CDN分发后,播放时一般可以选择RTMP、HTTP-FLV或HLS(H5支持)等方式。
    • 超低延迟直播:延时低至600ms,提供千万级并发的高质量直播服务,同步性更强,弱网抗性更优。
    • CDN直播:延时为 3s 左右,提供低成本、大规模稳定、端上能力丰富的直播服务。

2.3.1 直播产品和直播技术

直播所需产品实时音视频产品直播分发产品
产品定义低至200ms的端到端平均时延,提供便捷接入、高可靠、多平台互通的音视频服务。可完美的支持一对多、多对多的实时音视频通话、直播、会议等场景。直播分发,按照延迟时间的长短对应有不同的产品。
由于不同场景对互动和延迟的要求不同,按照延时程度,厂商一般会提供对应的直播分发产品,这里以ZEGO为例,分为超低延迟直播、CDN直播两大类来说明。
直播技术实时音视频旁路转推超低延迟直播CDN直播
典型场景观众与主播之间需要频繁音视频互动,比如小班课,在线会议等场景。观众之间需要强同步,主播需要即时响应观众的文字、弹幕或者打赏信息,比如直播大班课,一起看电影等场景。观众不需要与主播音频互动,观众之间的直播内容同步性无强要求,比如游戏直播,直播秀场。
延时情况观众与主播连麦的内容延迟小于 400 ms。观众和主播之间的内容延迟范围在 600 ms ~ 1000 ms。观众和主播之间的内容延迟大于 3000 ms。
同步性观众之间的同步性强。观众之间的同步性良好。观众之间的同步性差。
互动体验优。良。差。
价格较高。适中。较低。

第三方直播产品核心功能对比

为了便于大家更好的进行直播产品的选型,笔者将各大厂商官网的核心功能进行整理汇总,并表格形式横向对比呈现。因各家文档较多笔者人工查询整理,难免有有出入欢迎大家不吝赐教指正,有出入处以各家官网文档为准。

腾讯云-云直播**即构 -**畅直播阿里云-视频直播网宿-云直播声网-融合CDN直播
客户案例bilibili,快手、now直播、斗鱼映客直播、花椒直播、咪咕直播淘宝、钉钉、Lazada、阿里巴巴虎牙直播、河南广播电视台、希沃bilibili、斗鱼、陌陌、花椒直播
产品形态CDN根据不同时延要求,分为CDN、CDN Plus、超低延迟直播CDNCDN融合CDN,可以认为是CDN

主要场景•CDN直播•CDN直播质量无法保证的场景
•质量优先的直播用户
•CDN直播•CDN直播•单个CDN直播无法保证质量的场景
核心优势•节点丰富
•价格较低
•可以基于CDN提供转码、录制等增值服务
1、提供基于不同场景需求的多档位方案
2、节点丰富,基于全球网络调度MSDN策略、流控策略等,抗弱网能力更强,保证直播流畅率和稳定性
3、有播放器的实时播放数据,云上的调度策略更加准确
4、可以进行端上的调度策略
5、提供端上处理能力,包括3A,前处理等
6、可以基于CDN提供转码、录制等增值服务
7、质量监控更加全面
•节点丰富
•价格较低
•可以基于CDN提供转码、录制等增值服务
•节点丰富
•价格较低
•可以基于CDN提供转码、录制等增值服务
•基本等同于CDN的价格
•有播放器的实时播放数据,云上的调度策略更加准确
•可以进行端上的调度策略
•SDK端上的各种能力
•质量监控更加全面
支持的连麦人数最多支持50人同时连麦业内首创连麦技术,最多支持10000人同时连麦最多支持16人直播连麦支持60人同时语音、视频连麦互动最多支持128人同时互动
劣势受限于CDN本身的能力,在流畅率、稳定性、实时性上表现不佳要做CDN、L3的目前有一些限制(播放器等),不如CDN有通用型受限于CDN本身的能力,在流畅率、稳定性、实时性上表现不佳受限于CDN本身的能力,在流畅率、稳定性、实时性上表现不佳受限于CDN厂商本身的限制,很难进行进一步质量提升

推流协议支持•RTMP
•TCP/QUIC/SRT

•私有协议/RTMP
•TCP/QUIC
•RTMP
•TCP/QUIC/SRT
•RTMP
•TCP/QUIC/SRT
•私有协议/RTMP
•TCP/QUIC/SRT
拉流协议支持•RTMP/HTTP-FLV/HTTP-HLS
•TCP/QUIC
•私有协议/RTMP/HTTP-FLV/HTTP-HLS
•TCP/QUIC
•RTMP/HTTP-FLV/HTTP-HLS
•TCP/QUIC
•RTMP/HTTP-FLV/HTTP-HLS
•TCP/QUIC
•RTMP/HTTP-FLV/HTTP-HLS
•TCP/QUIC
调度模式云上的调度策略•云上调度策略
•端上的调度策略
跨CDN厂商切换
•跨IP切换
•Quic→TCP切换
•提供基于不同场景需求的多档位方案,支持无缝切换
云上的调度策略云上的调度策略•云上调度策略
•端上的调度策略
•跨CDN厂商切换
•跨IP切换
•httpDNS→DNS
•Quic→TCP

在这里插入图片描述

腾讯、阿里的视频直播 是最常见的CDN直播,基于 RTMP等TCP协议实现,延迟一般在3-10S左右,抗弱网能力较差,卡顿率较高。
声网的融合CDN直播融合了多家CDN,与声网媒体服务进行了协同,针对CDN的卡顿率问题进行了优化,但仍受限于CDN本身的能力。
即构的畅直播提供了多种直播档位,其中的超低延迟直播基于即构自研UDP传输协议实现,使用了海量数据分发网络(MSDN 网络),可以认为复用了RTC的部分优势,因此延迟低至600ms、弱网抗性超强、卡顿率极低。

其他标配功能对比

除直播的核心推拉流功能之外,直播产品快速迭代了许多功能满足多场景需求,基本厂商们都支持,详见以下表格。

产品功能腾讯云阿里云即构网易云信声网七牛云金山云
推流地址自定义支持N/A支持支持支持支持支持
视频软编码支持支持支持支持支持支持支持
视频硬编码支持支持支持支持支持支持支持
美颜支持支持支持支持支持支持支持
第三方美颜接口支持支持支持支持支持支持支持
水印支持支持支持支持支持支持支持
截图支持支持支持支持支持支持支持
多视频分辨率支持支持支持支持支持支持支持支持
横竖屏推流支持支持支持支持支持支持支持
动态横竖屏切换支持N/A支持支持支持支持支持
连麦支持支持支持支持支持支持支持
画中画支持N/A支持支持支持支持支持
对焦/变焦支持支持支持支持支持支持支持
镜像支持支持支持支持支持支持支持
闪光灯支持支持支持支持支持支持支持
耳返支持支持支持支持支持支持支持
蓝牙耳机支持N/A支持支持支持支持支持
混音支持支持支持支持支持支持支持
混响支持N/A支持支持支持支持支持
纯音频推流支持支持支持支持支持支持支持
后台音频推流支持支持支持支持支持支持支持
录屏支持支持支持支持支持支持支持
短视频录制支持支持支持支持支持支持支持
动态帧率支持支持支持支持支持支持支持
变声支持支持支持支持支持支持支持
升降调支持N/A支持支持支持支持支持
立体声推流支持支持支持支持支持支持支持
悬浮窗支持支持支持支持支持支持支持
降噪支持支持支持支持支持支持支持
手机摄像头/麦克风采集支持支持支持支持支持支持支持
手机屏幕采集支持支持支持支持N/A支持支持
自定义采集(外部采集)支持N/A支持支持支持支持支持
推流码率自适应支持支持支持支持支持支持N/A
填充/旋转模式支持N/A支持支持N/A支持支持
SEI消息接收支持支持支持支持支持支持N/A
推流录制支持支持支持N/A支持支持支持
背景音乐播放支持支持支持支持支持支持支持
音乐与人声混音支持支持支持N/AN/AN/AN/A
H.265硬解支持支持支持N/AN/A支持支持
超分N/AN/A支持N/A支持N/A支持
音量均衡N/A支持支持N/AN/A支持支持
秒开优化支持支持支持支持支持支持N/A
自动增益补充(AGC)N/AN/A支持N/A支持支持N/A
回声消除(AEC)N/AN/A支持N/AN/A支持N/A
自定义视频渲染N/A支持支持N/A支持支持支持
音视频流加密N/A支持支持支持支持支持N/A

网络直播作为新兴的传播形式能量巨大,技术进步也改变了视频直播平台、主播和观众之间的互动方式。近些年,随着网络直播的市场规模不断增长,同时也衍生了许多新的业务场景和互动玩法,直播产品的激烈竞争倒逼厂商开启了自研技术之路,提升直播平台用户体验。笔者关注到一些新兴功能,进一步提升了对直播产品形态的演进和用户体验,以下为相关功能的横向对比。

产品功能即构声网火山引擎
场景化AI降噪非音乐场景:人声保真效果较好,降噪效果较好
音乐场景:支持99%以上的音乐场景识别并应用对应的降噪策略
非音乐场景:降噪效果最好,但是人声保真效果差
音乐场景:没有
非音乐场景:人声保真效果较好,降噪效果最差
音乐场景:没有
万人连麦最多支持10000人同时上麦最多支持128人上麦最多支持1000人同时上麦
状态同步最多支持10000人的状态同步;不支持不支持
分割和传输视频中的主体将主体外的区域设置为透明,实现只传输主体的效果。
多人异地同台:将身处不同城市的嘉宾渲染到同一个虚拟舞台上,实现发布会、企业年会、演唱会等场景的多人异地同台
同场互动:只需一张虚拟背景图,即可让所有麦上用户同处一个空间。在同一个“健身房”一起健身、在同一片“广场”一起跳广场舞,尽享沉浸式的趣味视频连麦体验
分割:有
传输:无
传输:无
视频超分辨率最大支持540P超分至1080P最大支持360P超分至720P
暗光增强所有机型全覆盖;部分覆盖,存在性能问题

价格对比

因各大厂商直播SDK计费模式较多且差异不大,价格对比环节只列举部分厂商的报价供参考,大家可根据实际业务需求进行选择,同时笔者也附上厂商官方地址有任何价格相关的疑问可直接咨询官方。

阿里云

官网地址:https://helpcdn.aliyun.com

1、按量后付费模式

1.1 按使用流量计费

按不同区域使用的流量阶梯价格计费,当月分别超额累进(以自然月为一个累计周期,下个月自动清零重新累积)。定价受区域和带宽阶梯影响。

流量阶梯(计费单位:元/GB)中国内地-CN北美-NA欧洲-EU亚太1区-AP1亚太2区-AP2亚太3区-AP3中东非洲-MEAA南美-SA
0~10 TB(含)0.5280.9200.9201.5801.7001.7002.6202.620
10 TB~50 TB(含)0.5060.9200.9201.5801.7001.7002.6202.620
50 TB~100 TB(含)0.4620.7800.7801.3201.4401.4402.3602.360
100 TB~1 PB(含)0.3960.4000.4001.0401.3201.2401.9601.840
大于1 PB0.3300.3200.3200.9201.1801.1801.8401.700

1.2 按峰值带宽计费

以当日您直播观看区域所在节点,直播加速服务分别产生的带宽最高值(单位Mbps)为结算标准。定价受区域和带宽阶梯影响。

带宽阶梯(计费单位:元/Mbps/天)中国内地-CN北美-NA欧洲-EU亚太1区-AP1亚太2区-AP2亚太3区-AP3中东非洲-MEAA南美-SA
0~500 Mbps(含)1.3203.2803.2806.5607.8807.88011.82010.640
500 Mbps~5 Gbps(含)1.2763.0203.0206.3007.6207.62011.54010.360
5 Gbps~20 Gbps(含)1.2322.7602.7606.0407.3407.34011.28010.100
大于20Gbps1.1882.6202.6205.9007.2207.22011.1609.980

即构科技

官网网址:https://www.zego.im/

每月免费使用10000分钟,不超过完全免费,超过部分单独计算:

他家官网报价常规可以拿到5%-15%的优惠折扣,如果有活动赶上大促,比如今年是他们7周年,部分产品折扣力度非常大。

1.CDN直播

用量统计方式:CDN 目前默认为后付费按量计费,并提供两种计费类型:带宽计费和流量计费,您可根据自身业务形态,选择适合的计费模式。

服务定价

计费档位计费类型档位说明价格
(0Mbps,500Mbps]带宽月峰值带宽26元/Mbps/月
(500Mbps,2Gbps]带宽月峰值带宽24元/Mbps/月
(2Gbps,∞]带宽月峰值带宽22元/Mbps/月
不区分阶梯用量流量拉流累计0.5元/GB

2.超低延迟直播

用量统计方式:目前默认为后付费按量计费,按照用户实际拉取音视频流的时长来统计超低延迟直播服务的用量。

服务定价

计费档位计费类型档位说明价格(元/千分钟)
高音质纯音频时长纯音频4.00
标清视频(SD)时长分辨率 ≤ 360P( 480 x 360 )7.00
高清视频(HD)时长360P < 分辨率 ≤ 720P( 1280 × 720 )14.50
超清视频(HD+)时长720P < 分辨率 ≤ 1080P( 1920 × 1080 )57.00

声网

官网网址:

https://www.agora.io/

融合CDN直播

流量阶梯单价:下表列出各个流量阶梯下每个地区的流量单价,价格单位:元/GB。

月度总流量 (GB)中国内地北美欧洲亚太 1 区亚太 2 区大洋洲中东非洲南美
0 - 10,0000.250.480.480.480.730.960.730.73
10,000 (含)- 50,0000.230.460.460.460.690.920.690.69
50,000 (含)- 100,0000.210.420.420.420.630.840.630.63
100,000 (含)- 1,000,0000.190.380.380.380.570.760.570.57
大于 1,000,0000.160.320.320.320.480.640.480.48

网易云信

官网地址:https://netease.im

直播服务计费项由两部分组成:日峰值带宽费+增值服务费(可选)

1.普通直播

在这里插入图片描述

总结

近几年直播行业飞速发展,从早期的秀场直播到电商直播,以及如今火爆的互动直播。直播技术不仅对延时的要求越来越高,还加入了各类美颜特效和互动玩法,全方位提升APP的活跃留存。

同时也加速了直播技术的发展,线上直播间的搭建涉及到的技术难点非常多,直播SDK加快了直播程序开发的效率,技术成熟的直播SDK也更加稳定可靠。大家可以根据项目需求选择合适的服务搭建直播间,也可下载演示demo具体体验后再选择。

Logo

致力于链接即构和开发者,提供实时互动和元宇宙领域的前沿洞察、技术分享和丰富的开发者活动,共建实时互动世界。

更多推荐