2019 年伊始,多闪、马桶MT和聊天宝三款社交产品同时发布,沉寂已久的互联网社交产品圈再掀波澜。在此之前,很多产品已在社交领域做了尝试。比如职场社交脉脉、语音社交鱼耳、娱乐社交唱吧等等,专注于某个特定场景,成为吸引特定群体的深度社交工具。

语音聊天和视频聊天,基本是社交软件必备的功能。除了单纯的 1 对 1 语音或视频聊天,在实时音视频技术支持下,很多APP已经延伸出非常多的玩法。在语聊方面,大家熟知的荔枝、喜马拉雅、酷狗、比心、Blued等多家社交APP,对接了即构实时语音SDK后,打造了语音聊天、语聊房、语音电台、语音游戏等多种玩法。

为大量的社交APP提供技术服务后,即构看到了现今和未来,语音社交呈现出的多种不同的形态,在此与大家分享。

语音聊天玩法分类

目前的社交语聊形态大致分为四大类,其中,又数多人语聊房延伸出的玩法最多。

1、1V1 私人聊天房

2、多人语聊房

多人语聊互动、多人语聊+游戏互动、多人语聊+赛事直播、多人语聊+私密影院和多人语聊+pia戏等。

3、语音电台(有单主播、有多人)

4、KTV语聊房(有单人、有多人)

各类语聊玩法详解

1、 1 对 1 私人聊天房

1 对 1 语聊常见的应用场景有亲密聊、陪聊、语音交友等,大部分社交APP都上线了 1 对 1 语聊功能,分为免费和付费陪聊两种玩法。在客户功能需求方面,即构将之分为几大类:私聊+背景音、私聊+无背景音,转推CDN和不转推CDN,录制上可选单流录制、混流录制、私有化录制或不录制。

2、多人语聊房

多人语聊房延伸出的玩法就非常多,其中每种玩法都有所差别。除了多人纯语聊,还有跟其他娱乐形式结合的玩法,比如多人聊天+游戏互动、多人聊天+赛事直播、多人聊天+pia戏等等。

1)多人纯语聊

多人纯语聊分为无观众和有观众两种模式,纯聊天的语聊房一般会定主题来聊,比如相亲、情感、陪练等等,多人连麦聊天,观众文字互动或打赏。

2)多人语聊+游戏互动

多人语聊用在游戏当中,就是游戏语音,除了用在大型的吃鸡类游戏,还普遍应用在线上的小游戏,比如狼人杀、剧本杀、真心话大冒险、你画我猜等,用户通过语音轮麦的方式进行游戏接力,一起玩耍。

3)多人语聊+赛事直播

直播间内主播将比赛的实时视频流拉进来,和房间内观众连麦,边看赛事直播边语音聊天,没连麦的观众可以边看直播边文字互动。
咪咕直播平台的“主播+赛事直播”
语聊赛事直播还有“主播+赛事直播”的方式,去年雅加达亚运会期间,咪咕直播平台上多个主播,通过在家登录即构的云导播台,将CCTV5 的直播视频流拉过来,加上主播解说视频,合成一路视频流,以“主播+赛事直播”的方式,和网友一起看比赛。

4)多人语聊+私密影院

这个场景和赛事直播的玩法类似,不同是赛事直播拉取的是直播视频流,私密影院拉取的是录制好的视频流,在一个房间内大家边看边吐槽。

5)多人语聊+pia戏

在pia戏直播间,主播邀请其他听众连麦,进行影视剧、小说的配音、pia戏再创作,实时在线飙戏,听众可以自由申请连麦,也能文字互动。
荔枝APP的pia戏语聊房
3、语音电台(有单主播、有多人)

语音电台是目前很多社交APP的玩法,在语音电台中,主播进行语音直播,用户进入直播间收听,主播也可邀请用户语音连麦互动(一般需要打赏或者付费后)。

语音电台主要有两种方式,一是背景音+单人直播,二是背景音+多人连麦。区别于纯音频聊天,语音电台是在聊的基础上,加上了背景伴奏音。

4、KTV语聊房(有单人、有多人)

在KTV语聊房中,大家可以点歌、评论、猜歌、接唱等,主要分为多人连麦和多人轮麦两个模式,两种模式又分有观众和没观众的场景。
酷狗KTV的K歌语聊房
多人连麦的情况下,一个人主唱,其他连麦用户可以边听边说话,主唱听不到其他连麦着说话声,房间的听众则能听到全部的声音。多人轮麦模式是点歌后,一人唱一段,唱完自动轮到下一个人唱,其他用户在等待的时间只能听,只能评论交流,不能语聊。

语聊场景技术难点

视频聊天时候,因为可以看到彼此,对声音也不那么在意。而纯语音聊天时,人注意力都放在声音上,对音质的要求更高。

1)整体稳定的技术

1 对 1 语聊的技术门槛相对较低,多人语聊和特定场景相对复杂,技术实现难度比较大。以pia戏为例,如果经常出现卡顿、延迟和听不清的情况,会将营造的剧情气氛破坏殆尽,主播时不时要退出重新登录,无法全身心投入,用户听到的是断断续续的声音,不能沉浸到剧情中。

即构自研的音视频引擎,通过抖动缓冲技术、前向纠错技术、丢帧补偿技术减少网络抖动和弱网环境下的延迟,保障语音通话低延时且清晰。让用户在复杂网络环境和多类型手机的情况下,也能实现畅通优质的语音通话。

2)多人聊天的语音前处理

以KTV语聊房为例,在房间当中,有人说话声音、歌声、伴奏都在房间呈现,每个人所处的地方,所用的设备也不一样,这就有很大可能出现回声、噪音,或是某个人设备不是很好,发出的声音很小。

即构成熟的语音前处理3A技术:回声消除(AEC)、噪音抑制(ANS)、音量增益(AGC),杜绝回声和啸叫,降噪而无损音质。这样歌者能展示甜美歌声,听众也有良好的听觉享受。

3)媒体次要信息同步

而在KTV类的场景中,AB两人轮麦合唱,如果轮到B唱歌时发现歌词没同步,就很难唱下去。这当中技术难点就在于歌词等媒体次要信息是否能做到同步。

即构的KTV解决方案中,支持将非媒体信息注入媒体流中,歌词等媒体次要信息和音视频信息放在同一个媒体通道传输的,做到歌词与歌声同步展示果。
即构KTV实现流程图
4)变声等音效处理

在语音社交APP中,有时需要对用户的音效进行处理,如上述例子中的变声。还有在匿名聊天中为了增加趣味性,也会有变声需求。即构变声功能通过改变用户的音调和音色,使输出的声音在感官上与原始声音不同。可模拟出萝莉、大叔、熊孩子等多种变声效果,实现男声变女声、女声变男声。另外,即构SDK开放了调节参数的接口,客户可根据自己的需要,随意设计更多特定的变声效果。

目前,即构KTV和变声体验demo已上线,可进行体验。

语音社交APP的突破口

基于不同场景的语音社交玩法更能吸引 95 后 00 后等年轻用户的参与,这些社交APP不只是沟通工具,还可以是你的游戏玩伴、K歌歌友、“虚拟”恋人……语音社交APP基于垂直小众领域,打造小而美的产品模式,用户的活跃度较高,付费意愿也更高。

同时也要看到,语音社交APP的功能模式可复制性高,为了找到突破口,未来,在主流的社交APP之外,会有越来越多的小众APP出现,满足用户更多的需求。同时,即构也会根据这些需求,提供相应的解决方案。

Logo

致力于链接即构和开发者,提供实时互动和元宇宙领域的前沿洞察、技术分享和丰富的开发者活动,共建实时互动世界。

更多推荐