微信扫一扫,关注公众号

  • 科技行者

  • 算力行者

见证连接与计算的「力量」

首页 未来取决于数据:Clubhouse如何构建TikTok式算法?

未来取决于数据:Clubhouse如何构建TikTok式算法?

2021-02-16 14:21
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-
2021-02-16 14:21 科技行者

像我这种曾先后供职于Snap、LinkedIn并创建过社交媒体分析公司的人来说,Clubhouse的潜力可以说是毋庸置疑。随着奥普拉、扎克伯格、马斯克乃至德雷克等名人纷纷入驻之后,这款“嵌入式音频聊天”应用已经正式步入主流。

未来取决于数据:Clubhouse如何构建TikTok式算法?

但是,Clubhouse的未来命运,取决于它如何帮助用户寻找精彩内容、提高参与程度。虽然面对这个问题,每个人都能想到正确答案——“用户数据”,但具体实现绝对没那么轻松。

“Clubhouse是什么?”

咱们来听听用户们对于Clubhouse的描述:

1. 不适合老年用户

2. 音频领域的下一个Snapchat

3. 带社区功能的Zoom

4. 年轻一代的“收音机”

5. 首个AirPods社区网络

6. 相当于在九十年代的聊天热线上随机闲聊

7. 包罗万有的社交互动层

本质上,Clubhouse的功能就是引导用户加入音频室,与其他人一起聊天。有些聊天房是主持人跟私人好友的闲聊场所,也有些房间则可能有成千上万的用户静静聆听奥普拉的座谈。短短几个月内,Clubhouse就实现了惊人的用户增长,目前估值已经高达10亿美元。

很多人将这一成功归因于我们在疫情引发的社交隔离期间迫切需要恢复社交互动。Twitch或者YouTube中的直播与精心制作的视频显然难以满足这种需求。话虽如此,但这种指数级的增长似乎并不仅仅源于此。

Clubhouse降低了参与对话的门槛。撰写博文与创建漂亮视频往往需要大量精力与技巧性投入。相比之下,参加语音聊天甚至比自拍还简单。设置一次性聊天房也比规划播客节目更轻松。总而言之,这款应用大大简化了谈话广播内容的创作过程。

Clubhouse,广播热线的互联网1.0版本

在互联网浏览器诞生的十年之前,也就是上世纪八十年代,广播热线的风头正劲。其流行原因与Clubhouse非常相似:降低了内容放送与传播的门槛。AM频段提供更充裕的带宽以发布各类内容。另外,宽松的管制政策也让本地广播电台迅速发展为行业规模的内容创作平台。四十年后,互联网的普及给我们带来了类似的效果:以零边际成本发布内容;再以Clubhouse为例,其中没有特定的广播或者讨论专题限制。 @benthompson 在社交网络2.0中强调,Clubhouse拥有典型的互联网1.0特性:

“请注意,v1数字产品的本质特征,在于其单纯复制线下已经存在的内容。对Facebook来说,这代表着将好友与家人间的联系数字化;对Twitter来说,相当于是把酒吧里的轻松聊天搬到公开平台上。之所以这一切只能称为v1,是因为在v2产品中,必须包含某些只能通过数字化这一独特属性才能实现的功能。”

反过来,可以看出Clubhouse并没有充分利用这种“数字化属性”。从根本上讲,一切社交应用都需要解决两个问题:1)寻找社交互动;2)开启社交互动。只要稍微在Clubhouse上转转,大家就会意识到,自己很难在这里找到有趣的对话。当然,你可以关注主聊某些内容的用户,但其中的基本方式与Twitter提供感兴趣选项的推荐方案仍然有所区别。

我们可以把Clubhouse理解成一种社交图谱结构,这正是Twitter最笨拙的信息管理方式。一位好友最近告诉我:“我终于设置好了Twitter账户,现在可以只获取自己感兴趣的内容了。”他可是从2008年起就一直在用Twitter的,到现在才真正摸到符合自己喜好的用法!Twitter会经常要求用户更新并调整自己的关注对象与“用户满意”选项。更可怕的是,我们往往会在Twitter上看到大量自己完全不想看的内容;同样的,用户在Clubhouse上也经常身陷漫长而乏味的尬聊。

问题就在于:数据的挑战

为了寻找最适合当前用户的话题,Clubhouse需要理解全部对话内容,即以实时方式将对话内容转录下来。这一目标在技术上完全可行,目前的语音到文本算法已经非常强大,并没有太高的使用门槛。

Clubhouse目前不会记录用户的谈话内容,我认为这是因为运营方暂时不想影响到对话的真实性。类似的,Snap最初也曾经快速爆红。但请注意,Snap与Clubhouse从未明确表示他们不会保存信息记录。

TikTok的推荐魔法

作为如今第一算法厂商,TikTok凭借强大的推荐功能为Clubhouse的后续发展指明了出路。与Clubhouse或者Facebook不同,TikTok主要依赖的并不是社交图谱,而是强大的推荐引擎。正如 @eugenewei在谈TikTok与“分院帽”中所提到:

“字节跳动的软件工程师们对自己的算法拥有偏执般的关注,并在这方面用掉过去一半的检查周期。字节跳动也被称为算法公司,最早是突破性的「新闻」类应用今日头条、之后是短视频平台抖音,最后又有TikTok。”

TikTok的机器学习魔法源自一种有监督学习系统,能够快速找到用户感兴趣的视频。它会衡量用户看了多久、滚动速度有多快并考量其他多种行为特征,借此尽可能提升推荐算法的准确率。此外,该算法还会评估视频片段的实际属性:内容、速度、声音、颜色、文字等等。为了让算法切实起效,TikTok需要大量数据、海量数据。单是为了创建一套能够识别图像内容的系统,我们就需要1400万张分类训练图像(例如 imagenet)。

是否收集数据一直是产品设计层面的重要选择。在设计TikTok核心时,字节跳动就考虑到这方面问题。如今,该算法已经远远优于Facebook的推荐算法。此外,这部分数据也建立起巨大的业务壁垒,就连Facebook也很难轻松攻克。

未来取决于数据:Clubhouse如何构建TikTok式算法?

TikTok是一家算法优先公司。其不依赖于社交图谱,独立构建起强大的推荐引擎。

随着Clubhouse的发展,运营方也需要在这方面做出设计选择。他们该如何记录对话中的积极情绪?Clubhouse是一种被动的载体,因此用户可能不会直接对对话做出反应。Spotify或者Deezer等厂商面对的问题就相对简单,比如他们可以轻易发现用户不喜欢“切歌”之类的操作出现延迟;但Clubhouse不行,他们甚至很难明确目前聊天房里的用户喜不喜欢当前对话,这大大提高了算法的改进门槛。

推荐内容创作者可能是种衡量用户满意度的明确方法,但这种方式在使用初期往往起效很慢。根据我自己的创业经验,跟踪相同内容在不同平台上的传播情况、或者说转发量,往往也是衡量参与度的理想信号。这种方式似乎也适用于Clubhouse。如今,你已经可以在Twitter或者Facebook等其他平台上收听Clubhouse对话中的精彩段落。因此,未来Twitter与Facebook很可能会拿出与Clubhouse正面竞争的产品,这是因为他们不仅拥有社交图说、也掌握着能够衡量内容质量的传播渠道。

Clubhouse 的未来

尽管面临一系列挑战,但Clubhouse迅猛的前期发展势头仍然值得肯定。而后续能不能坚持住这样的好状态,取决于Clubhouse能否以较低的成本推动发布内容的多元化。运营方当然意识到了这个问题,因此宣布将投巨资为创作工具开发者与内容创作者提供收益。为了扩展业务规模,他们还需要建立各类数据与参与度指标。如果不能成功破圈,Clubhouse只能成为音频内容下的一套子堆栈——本身虽然仍可算成功,但绝对无法发挥出全部可能的潜力。

(声明:本文仅代表作者观点,不代表科技行者立场。)

来源丨Forbes

作者丨Lutz Finger

编译丨科技行者

分享至
0赞

好文章,需要你的鼓励

推荐文章
----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.- ----..---.-...-/--...-.-......./-...-....-..--../-............-.-