语聊房玩法解析，如何快速打造一款语音社交产品

2019 年伊始，多闪、马桶MT和聊天宝三款社交产品同时发布，沉寂已久的互联网社交产品圈再掀波澜。在此之前，很多产品已在社交领域做了尝试。比如职场社交脉脉、语音社交鱼耳、娱乐社交唱吧等等，专注于某个特定场景，成为吸引特定群体的深度社交工具。语音聊天和视频聊天，基本是社交软件必备的功能。除了单纯的 1 对 1 语音或视频聊天，在实时音视频技术支持下，很多APP已经延伸出非常多的玩法。在语聊方面，大.

海水冷却

5533人浏览 · 2019-02-25 15:21:25

海水冷却 · 2019-02-25 15:21:25 发布

2019 年伊始，多闪、马桶MT和聊天宝三款社交产品同时发布，沉寂已久的互联网社交产品圈再掀波澜。在此之前，很多产品已在社交领域做了尝试。比如职场社交脉脉、语音社交鱼耳、娱乐社交唱吧等等，专注于某个特定场景，成为吸引特定群体的深度社交工具。

语音聊天和视频聊天，基本是社交软件必备的功能。除了单纯的 1 对 1 语音或视频聊天，在实时音视频技术支持下，很多APP已经延伸出非常多的玩法。在语聊方面，大家熟知的荔枝、喜马拉雅、酷狗、比心、Blued等多家社交APP，对接了即构实时语音SDK后，打造了语音聊天、语聊房、语音电台、语音游戏等多种玩法。

为大量的社交APP提供技术服务后，即构看到了现今和未来，语音社交呈现出的多种不同的形态，在此与大家分享。

语音聊天玩法分类

目前的社交语聊形态大致分为四大类，其中，又数多人语聊房延伸出的玩法最多。

1、1V1 私人聊天房

2、多人语聊房

多人语聊互动、多人语聊+游戏互动、多人语聊+赛事直播、多人语聊+私密影院和多人语聊+pia戏等。

3、语音电台(有单主播、有多人)

4、KTV语聊房(有单人、有多人)

各类语聊玩法详解

1、 1 对 1 私人聊天房

1 对 1 语聊常见的应用场景有亲密聊、陪聊、语音交友等，大部分社交APP都上线了 1 对 1 语聊功能，分为免费和付费陪聊两种玩法。在客户功能需求方面，即构将之分为几大类：私聊+背景音、私聊+无背景音，转推CDN和不转推CDN，录制上可选单流录制、混流录制、私有化录制或不录制。

2、多人语聊房

多人语聊房延伸出的玩法就非常多，其中每种玩法都有所差别。除了多人纯语聊，还有跟其他娱乐形式结合的玩法，比如多人聊天+游戏互动、多人聊天+赛事直播、多人聊天+pia戏等等。

1)多人纯语聊

多人纯语聊分为无观众和有观众两种模式，纯聊天的语聊房一般会定主题来聊，比如相亲、情感、陪练等等，多人连麦聊天，观众文字互动或打赏。

2)多人语聊+游戏互动

多人语聊用在游戏当中，就是游戏语音，除了用在大型的吃鸡类游戏，还普遍应用在线上的小游戏，比如狼人杀、剧本杀、真心话大冒险、你画我猜等，用户通过语音轮麦的方式进行游戏接力，一起玩耍。

3)多人语聊+赛事直播

直播间内主播将比赛的实时视频流拉进来，和房间内观众连麦，边看赛事直播边语音聊天，没连麦的观众可以边看直播边文字互动。
咪咕直播平台的“主播+赛事直播”
语聊赛事直播还有“主播+赛事直播”的方式，去年雅加达亚运会期间，咪咕直播平台上多个主播，通过在家登录即构的云导播台，将CCTV5 的直播视频流拉过来，加上主播解说视频，合成一路视频流，以“主播+赛事直播”的方式，和网友一起看比赛。

4)多人语聊+私密影院

这个场景和赛事直播的玩法类似，不同是赛事直播拉取的是直播视频流，私密影院拉取的是录制好的视频流，在一个房间内大家边看边吐槽。

5)多人语聊+pia戏

在pia戏直播间，主播邀请其他听众连麦，进行影视剧、小说的配音、pia戏再创作，实时在线飙戏，听众可以自由申请连麦，也能文字互动。
荔枝APP的pia戏语聊房
3、语音电台(有单主播、有多人)

语音电台是目前很多社交APP的玩法，在语音电台中，主播进行语音直播，用户进入直播间收听，主播也可邀请用户语音连麦互动(一般需要打赏或者付费后)。

语音电台主要有两种方式，一是背景音+单人直播，二是背景音+多人连麦。区别于纯音频聊天，语音电台是在聊的基础上，加上了背景伴奏音。

4、KTV语聊房(有单人、有多人)

在KTV语聊房中，大家可以点歌、评论、猜歌、接唱等，主要分为多人连麦和多人轮麦两个模式，两种模式又分有观众和没观众的场景。
酷狗KTV的K歌语聊房
多人连麦的情况下，一个人主唱，其他连麦用户可以边听边说话，主唱听不到其他连麦着说话声，房间的听众则能听到全部的声音。多人轮麦模式是点歌后，一人唱一段，唱完自动轮到下一个人唱，其他用户在等待的时间只能听，只能评论交流，不能语聊。

语聊场景技术难点

视频聊天时候，因为可以看到彼此，对声音也不那么在意。而纯语音聊天时，人注意力都放在声音上，对音质的要求更高。

1)整体稳定的技术

1 对 1 语聊的技术门槛相对较低，多人语聊和特定场景相对复杂，技术实现难度比较大。以pia戏为例，如果经常出现卡顿、延迟和听不清的情况，会将营造的剧情气氛破坏殆尽，主播时不时要退出重新登录，无法全身心投入，用户听到的是断断续续的声音，不能沉浸到剧情中。

即构自研的音视频引擎，通过抖动缓冲技术、前向纠错技术、丢帧补偿技术减少网络抖动和弱网环境下的延迟，保障语音通话低延时且清晰。让用户在复杂网络环境和多类型手机的情况下，也能实现畅通优质的语音通话。

2)多人聊天的语音前处理

以KTV语聊房为例，在房间当中，有人说话声音、歌声、伴奏都在房间呈现，每个人所处的地方，所用的设备也不一样，这就有很大可能出现回声、噪音，或是某个人设备不是很好，发出的声音很小。

即构成熟的语音前处理3A技术：回声消除(AEC)、噪音抑制(ANS)、音量增益(AGC)，杜绝回声和啸叫，降噪而无损音质。这样歌者能展示甜美歌声，听众也有良好的听觉享受。

3)媒体次要信息同步

而在KTV类的场景中，AB两人轮麦合唱，如果轮到B唱歌时发现歌词没同步，就很难唱下去。这当中技术难点就在于歌词等媒体次要信息是否能做到同步。

即构的KTV解决方案中，支持将非媒体信息注入媒体流中，歌词等媒体次要信息和音视频信息放在同一个媒体通道传输的，做到歌词与歌声同步展示果。
即构KTV实现流程图
4)变声等音效处理

在语音社交APP中，有时需要对用户的音效进行处理，如上述例子中的变声。还有在匿名聊天中为了增加趣味性，也会有变声需求。即构变声功能通过改变用户的音调和音色，使输出的声音在感官上与原始声音不同。可模拟出萝莉、大叔、熊孩子等多种变声效果，实现男声变女声、女声变男声。另外，即构SDK开放了调节参数的接口，客户可根据自己的需要，随意设计更多特定的变声效果。

目前，即构KTV和变声体验demo已上线，可进行体验。

语音社交APP的突破口

基于不同场景的语音社交玩法更能吸引 95 后 00 后等年轻用户的参与，这些社交APP不只是沟通工具，还可以是你的游戏玩伴、K歌歌友、“虚拟”恋人……语音社交APP基于垂直小众领域，打造小而美的产品模式，用户的活跃度较高，付费意愿也更高。

同时也要看到，语音社交APP的功能模式可复制性高，为了找到突破口，未来，在主流的社交APP之外，会有越来越多的小众APP出现，满足用户更多的需求。同时，即构也会根据这些需求，提供相应的解决方案。