👥

机会:Zoom的垂直化与拆分

本周的更新可能想要等到企业微信认证做完之后再推,所以今天先发一篇在Medium上看到的文章。感谢屾屾同学的翻译。

显然被疫情重新塑形过后的数字化办公时代并不会一直被Zoom一家视频会议公司垄断。随着声网上市,我们也看到音视频通话领域开发成本的大幅降低和新的市场机会。其实Zoom在成立初期便是靠着前身Cisco Webex的垂直化与拆分而在消费者领域助力起跑的 — 关于这点详细解读可以关注我前东家TSVC清谷资本(Zoom种子轮唯一机构投资人)。

好了,下面是本篇正文。文章作者JJ Oslund是芝加哥早期基金TechNexus的投资人。

看初创公司如何通过开拓自己的垂直市场来构建视频会议的未来。

image

乍一看,视频会议市场对于行业新酷来说似乎已经饱和且难以渗透。尽管许多VC在Zoom成立之初也有同样的想法,但随着Zoom、微软、谷歌、思科甚至是Verizon等科技巨头纷纷加入地盘争夺战之时,市场环境才显得尤为令人望而却步。

尽管历史会重演,但我们却观察到了两个日益增长的趋势,这两种趋势可能会对Zoom带来比其任何直接竞争对手更大的威胁:

  1. 垂直化(verticalization): 构建针对特定用例的垂直聚焦的应用程序;
  2. 业务拆分(unbundling):使底层技术和功能产品化,从而令定制解决方案更加容易。

正如大自然的力量会随着时间的推移而重塑地貌一般,任何一家企业在水平市场上占据主导地位时,都会出现垂直化和业务拆分这种自然的过程,例如CraigslistLinkedInG Suite。 有利可图的市场吸引了大量创业公司和同类竞争者,他们开拓了可以提供更优质服务的垂直行业或产品。Jeff Jordan和D’ Arcy Coolican(a16z合伙人)研究了与平台有关的这一现象

精明的创始人知道,在正确的时间找到正确的市场就像是为创业公司的成功开了挂。 而在接近极限的广阔水平平台内拓展垂直市场,就像是开了挂中挂:如果你多留心,它将为你指出下一个重要的业务拆分领域,并指引你找出下一波机会和创新将从何而来。

在这篇文章中,我们将探讨视频会议的垂直化在今天如何发展,以及对诸如Zoom之类的通用工具的长期影响。

为什么垂直化如此必要?

像Zoom这样的公司,实现了巨大的扩张与普及,却失去了一项重要的竞争优势:专注于服务细分领域用户的能力。近期的特殊事件(疫情)迫使在一些原本并不是Zoom最初设计的目标应用场景也开始采用Zoom:老师们费劲地管理课堂;与小伙伴们的游戏连线之夜非常不顺畅;与同事协同做项目变得效率低下。Zoom已经变成了任何人都能使用的大众化应用,但它有并不完全适合所有人。

image

垂直聚焦的startup为更好地满足细分领域用户群体的需求而设计自己的产品,这使得他们能够创造和捕捉到比Zoom这样的水平化产品更大的价值。虽然Zoom也可以用于开展小型线上活动,但像Hopin这样的初创公司可以提供一对一网络、虚拟展位和内嵌式注册等功能,大幅降低组织者的操作复杂性。Hopin提供的附加价值使其能够更好地从活动中变现,这就是为什么其能够在狭窄的垂直领域将盘子做大。

视频会议的使命

在列出创业公司可能创建的每一个可能的“Zoom for X”之前,我们首先需要了解视频要去解决的问题。虽然视频当然不是所有沟通交流类型的最佳解决方案,但它却是现如今人们可获得的最接近面对面交流的替代品。

人类通过字词、语音语调、面部表情和肢体语言进行交流。视频提供了这种更高保真度的通信方式,并减少了语音和文本上经常出现的歧义。尽管如此,视频依旧有其缺点。正如Steve Blank指出的那样,视频无法取代拥抱或握手、更细微的非语言暗示以及身处相同空间环境的共享体验。

因此,视频是需要建立更紧密的人际关系的事务的最佳解决方案——无论是建立信任,协议谈判还是建立友谊。垂直化应用程序最有可能在手头的特定工作中促进这种人际关系。下面,我们将逐步介绍当今出现的四类垂直解决方案:

1)社会关系

在Zoom渗透到我们更广泛的社交领域之前,诸如FaceTime之类的通用应用程序已经被用于联系家人和朋友的场景之中。居家隔离使得视频聊天更具普遍性,并使得剩余的那些“晚期从众者”也终于登上了视频聊天的这艘船。 社会认可度和更完善的数字体验将在朋友视频聚会(House Party),屏幕共享(Squad),非共时在线的聊天(Marco Polo)或寻找感情(Bumble)方面迎来新的增长潮。

2)服务提供

视频通信为服务供应商和创作者们提供了更大的灵活性,使其可以远程工作及业务拓展——这两点都在加速热情经济(passion economy)。 远程教育工具可帮助在线导师(Preply)和教师(Outschool)接触学生。其他app则允许健身教练(Class Pass)、房地产经纪人(CloudPano)、厨师(ClassPop)和零售业人员(Hero)继续吸引客户。视频通信的社会普遍性也将持续加速远程患者护理的认可度,以进行心理健康(Talkspace)、身体健康(Medici)和宠物护理(Fuzzy Pet Health)。

3)工作交流

随着团队的分布越来越广,视频通信对于内部协调和外部业务发展都至关重要。 专用的沟通工具有助于实现更有效的团队讨论(Standups),持续进行的团队沟通(Tandem),工作会议(Remote HQ)和漫无目的的闲聊(Snack)。 其他一些app则实现电话销售(Demodesk),异步通信(Loom),职场培训(Hone)和更少干扰的交流(Focusmate)。

4)专业的解决方案

视频工具也是围绕特定用例的结构需求而设计的。 一些程序保证了更安全、去中心化、私人的视频聊天(如Telegram)。另一方面,其他应用程序则尝试尽可能多地消除摩擦(Whereby)。 初创公司也在完善网络研讨会(Livestorm),表演(Moment House)和交互活动(Hopin),使团体视频交流更加有趣与亲密无间。

image

元层 The Meta-Layer

即使垂直化应用程序不断增长,Zoom与其多功能竞争对手也将继续发展,演变成为用于通信的水平化“元层”。Kevin Kwok针对工作流应用程序(例如Figma)内部的协作如何减少对Slack等元层应用程序的需求,探索了一种类似的概念:

越来越多的各类别的应用程序都了解,如果他们想为客户提供最好的服务,就应该且必须将合作作为第一方。Notion、Airtable等都明白这一点。合作的反馈循环变得如此之短,以至于成为生产力循环的一部分。

与应用程序内合作可提高生产力的方式相同,应用程序内的视频通信可改善人际关系。 这些量身定制的应用程序,可以减少因未针对手头任务进行优化的千篇一律的用户体验,从而导致的“Zoom疲劳”。对于诸如Zoom之类的元层工具,总会存在边缘案例(edge case),但提供一种更自然、更具情境的人际关系的新酷公司也将能够捕获围绕在这种互动周围的价值。

Zoom凭借出色的产品取胜,但大规模的应用、不断变化的消费者行为以及搭建视频工具的更少摩擦,将继续带来一股垂直聚焦的公司浪潮,这些公司能够为不同场景实现远程人际交流。

拆分

2014年1月,一位前WebEx工程师成立了一家视频通讯公司,该公司将从VC中募集1.25亿美元,并将不断扩大规模,服务亿万终端用户。这位创始人并不是你所猜想的Zoom的袁征,而是声网(Agora)的创始人兼CEO赵斌。

声网是集视频聊天/直播于一身的API公司,为Bunch, Run the World, Talkspace等产品提供视频音频驱动力。随着视频聊天在新冠肺炎疫情期间的蓬勃发展,声网的注册量在4月份激增300%,使用量增加了60%,并在全球17亿设备上播放了累计400亿分钟的视频。

API增长潮

底层API的开源之所以如此重要,是因为它们仅需几行代码就可以大规模处理高度复杂的流程。 他们将行业中企业的价值中心商品化,并降低了新玩家的入门门槛

最成功的API受益于(并实现了)互联网模式转化的潮流。 Twilio在手机短信兴起之前成立,Stripe在向电子商务过渡期间得到了发展,而Plaid受益于个人理财应用程序的激增。 到2020年,像Agora这样的API会迅速增长,以应对大众对视频聊天和直播的不断增长的需求。

视频API之战

大部分视频通讯API都是运用WebRTC构建的。WebRTC是一种开源实时通讯协议,无需插件或下载即可进行视频聊天。诸如Agora之类的流行视频API消除了WebRTC的应用复杂性,提供了附加功能,并具有更大的可伸缩性。

视频API供应商通过降低实施的复杂性、提升个性化及功能、增强稳定性、和降低成本来脱颖而出。大型公司越来越多通过并购来进入这一领域:

  • Twilio在2016年收购了Tikal Technologies (Kurento背后的团队),从而发布其视频通话API;
  • Vonage在2018年收购了TokBox,来扩展其通讯产品;
  • 8x8在2018年收购了Jitsi,后者是Atlassian的开源视频通讯工具;
  • Enghouse System 在2019年收购了Vidyo。Vidyo曾在此前募集了7亿美元的资金,但却在新竞争中陷入困境;
  • 8x8在2019年收购了Wavecell从而拓宽其CPaaS领域;
  • Dolby在2019年收购了Voxeet来提供3D音频和高清视频API,最近重新发布为io。

尽管这是一个拥挤的领域,初创公司仍旧在发布新的视频通讯API。Sendbird在2020年初发布了视频API,并收购了Roundee,从而增强视频通讯能力。Daily.co在2019年上线了视频聊天API。这家公司原本在2016年通过YC孵化,为会议室销售硬件/软件。但是,他们进行了调整并募集到了460万美元,从而为Tandem等新兴视频应用助力。

除了视频通讯,许多公司也在运用直播API来举办一些线上直播活动、演唱会或表演等。著名的直播软件例如Periscope, Kaltura以及Vimeo是通过Wowza构建的。另一个也是从YC孵化出的Mux,也募集到了超过3千万美元,为Crowdcast、Udemy以及Wistia提供视频直播和分析功能。

视频以外的API

还有更多类别的API,它们围绕视频聊天提供更多高级功能和AI功能:

视频AR及仿真

DeepAR、ARGear以及Banubu提供AR面具、镜头以及背景,供用户定制他们的外形和周围环境。视频AR不仅用于个性化展示,也能为用户提供更私密、舒适的通话体验。Loom.ai和Avatar SDK通过模拟面部运动和手势的自定义头像,为用户提供了更多的数字身份控制权。 面部仿真可能是音频通话的私密性和视频通话的“完全暴露”之间的理想折衷。

音频改善

在视频聊天中,劣质的音频通会比劣质的视频更令人分心。Dolby.io启动了可自动调节响度、音频电平和语音清晰度的API。 像Krisp和BabbleLabs这样的公司使用AI来消除对话中的背景噪音,例如狗叫、婴儿哭闹和开车经过的声音。 Discord近期整合了Krisp的噪声抑制功能,以提高其数亿游戏玩家的通信清晰度。

字幕与注释

转录和翻译API支持实时字幕、会议记录和可搜索的会话存档,从而更加合规。像谷歌、微软和亚马逊这样的大型公司都提供自己的转录引擎,但仍有一些初创公司,比如Assembly AI和Deepgram(刚刚筹集了1200万美元),他们专注于通过更多定制的ASR模型来提高准确性。

会话洞察力

其他API利用AI来提出对于对话或参与者的更深入的见解。Kairos提供了面部识别API,用于估计用户的年龄和人口统计信息。Banuba可以跟踪面部微动,以检测用户的情绪,心跳和视线轨迹。 nVISO的API可以读取人脸,以帮助医疗专业人员评估患者的疼痛程度。 Oto利用“声学语言处理”(Acoustic Language Processing)来分析单词和语调,这比单独使用NLP来分析情感更有效。同样,Voicebase会评估对话见解,例如通话过度、沉默和情绪,从而预测客户流失或创建新业务的可能性。

协同合作

屏幕共享可以通过WebRTC完成,但是类似Surfly的API提供了更强大的共享功能,例如控件切换和更快的性能。 为了改善远程协作,像Miro这样的公司提供了可以嵌入到应用程序中的白板API。

接下来…会是无代码视频聊天吗?

基础架构API使开发人员可以更轻松地设计新的视频聊天应用程序,但我们也对未来感兴趣,那时终端用户将会能够为特定用例情景来定制视频聊天。

如今,非技术用户可以在Webflow上构建网站,在Airtable上构建数据库,在Bubble上构建Web应用程序以及使用VoiceFlow构建语音应用程序。那么谁将实现无代码构建通讯应用呢?

为了画出这一想象的demo,以下是我对于自己的一种特定情境而定制视频会议应用程序的设想——与初创公司创始人的介绍电话:

当我登录时,预填充的配置资料会出现,包括对于创建者/创业公司的有用资料(个人资料,近期的Tweets/新闻,融资轮等)。下面是我们最近的电子邮件往来和所附的投资者资料,我可以在应用程序中参考。

另一方面,创始人看到了我和TechNexus的个人简介。 他们可以滚动浏览我们的投资组合,以更好地了解我们的投资重点。当在然在理想情况下,他们会提前做这些功课,不过我知道大家也都很忙。

嵌入式会议备忘将显示在屏幕上(应用程序之间无切换!)。 这些将与我们的CRM同步。

在整个通话过程中,AI机器人会根据我们的对话提供实时见解。 例如,当创始人提到竞争对手时,这个竞争对手公司的简要档案会显示出来,让我一目了然,或者就直接保存在我的笔记当中。

相同的AI机器人提醒我,我在5分钟内还会打另一个电话,因此我需要赶紧结束。当然,一个很显眼的倒数计时器能帮助保持会议顺利进行。

在通话结束时,我可以选择“快速操作”(quick action)。 在这种情况下,说明我对这家公司真的很感兴趣,因此我在应用程序中调出日历以安排后续会议。

通话后,我可以即刻从我的AI机器人那里得到会议反馈——我是否主导了对话? 我有过分打断对方吗? 我有听起来对对方不感兴趣吗? 等等。

我想如果我们考虑健身教练、老师、财务顾问等的需求,那么就会存在无限的可能性。Zoom的垂直化的终极节点,将是一种无代码工具,可让用户根据自己的需求设计高度自定义的视频应用程序。