首页>新闻>新闻详情>

Snowflake8年估值300亿美元,中国云上数仓的未来在哪儿?| Q推荐

2020-09-15 19:01:00

指导 | 黄勇调研 | 黄勇、冯伟撰写 | 爱分析 冯伟硅谷独角兽、云原生数据仓库厂商 Snowflake 启动 IPO,其猛增的营收和节节攀升的毛利率,向大家展现了一个正在蓬勃发展的新兴市场。云原生数据仓库市场背后有哪些驱动因素?随着中国企业数字化与上云进程的加速,中国市场将如何发展?云原生数据仓库能解决哪些实际痛点? 1 硅谷独角兽 Snowflake 营收连年翻番,上月正式启动 IPO

据媒体公开报道,硅谷独角兽、云原生数据仓库(Cloud Native Data Warehouse)提供商 Snowflake 于 2020 年 8 月 25 日正式向美国证券交易委员会递交了上市申请,据其招股书披露的财务数据显示:

  • 2020 财年(截至 2020 年 1 月 31 日),Snowflake 的营收为 2.65 亿美元,相比于 2019 财年增幅高达 174%。到 2021 财年上半年(截至 2020 年 7 月 31 日),其营收达到 2.42 亿美元,相比 2020 财年上半年增长 133%,预计全年营收将超 5 亿美元。

  • 2019 财年,Snowflake 的毛利率为 46.5%,到 2020 财年则提升到 56%,而到 2021 财年上半年,这一数字进一步提升到 61.6%。

这家 2012 年才成立的独角兽,根据 9 月 14 日披露的 S1 文件,预计股票的发行价在 100 美元至 110 美元之间,IPO 估值高达 277 亿美元~305 亿美元。

尽管“云原生”的概念在近些年刚刚兴起,但数据仓库却并非一个新兴市场,而是有着长达三十年的漫长发展期。而我们要想知道 Snowflake 如今的估值有多高,可以参考下两家更早进入市场的数据仓库厂商的财务数据和市值:

  • 成立于 1979 年,在传统数据仓库市场占据统治地位的 Teradata,在经历连续多年的业绩负增长后,2019 财年营收仍有 18.99 亿美元,但当前市值仅 27 亿美元。同时,其毛利率更是多年稳定在 50% 左右,已经难有提升空间。

  • 另一家厂商是成立于 2008 年 Cloudera,它基于 Hadoop 开源体系成长起来,并已经在 Hadoop 发行版市场中占据统治地位。在经历多年快速增长后,其 2020 财年营收达 7.94 亿美元,毛利率高达 71%,而当前市值也仅有 39 亿美元。


可以看到,Snowflake 在短短几年时间内,迅速在欧美市场崛起,估值大大超越成立时间更久的同类厂商。

相比于欧美市场,国内的云原生数据仓库市场尚处于早期,尚未出现像 Snowflake 一样经历如此快速增长的厂商。但是,考虑到中国企业潜在的对数据分析的旺盛需求,以及企业上云进程的逐步深化,中国的云原生数据仓库市场的发展也值得探讨。

云原生数据仓库市场在美国爆发的成因是什么?国内市场未来的发展趋势如何?有哪些厂商有机会复刻 Snowflake 的增长轨迹?云原生数据仓库能解决哪些实际痛点?爱分析基于对中美市场的研究,以及对 Snowflake 投资方和 Kyligence 等厂商的调研,来详细探讨上述问题。

2 数据仓库历经漫长变革,企业需求变化是决定性驱动因素

要想准确评价“云原生数据仓库”对企业的真实价值,可以先回溯数据仓库的发展历史。

事实上,数据仓库是一项发展历程漫长的技术,其概念确立于上世纪 90 年代初,定位是为企业信息化建设过程中“烟囱式”数据治理困境提供治理能力,建设面向主题的、跨系统集成的分析型数据库,并最终服务于企业的业务决策。

在过去三十年间,企业对数据仓库的整体定位没有发生根本的改变,即为企业提供业务决策支持。

但是与此同时,数据仓库的技术路线却不断升级,从早期以软硬件一体架构、有限的扩展性、昂贵的扩容成本为特征的第一代数据仓库,逐步发展为基于开源软件框架、适配 x86 架构通用硬件、适应海量数据的计算、可灵活扩展的第二代数据仓库,以及基于云服务提供的第三代数据仓库。


从第一代数据仓库发展到第二代数据仓库,企业的具体需求变化主要体现在以下两方面:

  • 面向海量数据的计算能力:随着数字化业务的增长,企业数据量呈现爆发式增长,数据从几个 BP 发展到上百 PB 级别,而第一代数据仓库在面对如此巨大的数据量的时候,会出现明显的性能下降。而第二代数据仓库一般基于 Hadoop、Hive、Spark 等开源框架,以及 Presto 等开源 MPP 架构,能够实现针对海量数据的高效存储和计算。

  • 更灵活的扩容能力:随着数字化业务的不断增长,企业对于数据仓库性能扩展的需求性更为迫切,但第一代数据仓库的扩展性较差。因此,第二代数据仓库逐步采取软硬件解绑、适配通用性硬件的分布式架构,为企业提供更加灵活、更低成本的扩容能力。

但是,第二代数据仓库的不足在于仍然需要依托于线下机房,在性能扩容的时候需要采购硬件,由此带来了较为高昂后期运维和扩容成本。

随着云计算的逐步兴起,第三代数据仓库——云数据仓库(Data Warehouse in Cloud)逐步出现,客户在在公有云上低成本、按需、高效地获取数据仓库资源,其优势在于以下两方面:

  • 更低的扩容成本:数据仓库成为了在云上准备好的虚拟化资源,用户仅需通过界面点击即可按需取用,实现近乎无限的可供扩容、启停、升级的计算节点数量,免去了笨重的硬件采购和线下部署过程。

  • 更低的运维成本:由于云计算本身具有“基础设施即代码”的能力,数据仓库的资源的分配完全可以通过自动化手段完成,降低了因大量运维人员的手动操作带来的运维成本。

3 企业数字化进程深入推进,云原生数据仓库价值何在?

第三代数据仓库同样存在局限,它更像是把第二代数据仓库直接搬到了云上,但却没有根据云本身的特性更好地对自身进行优化,因此仍然没有达到“云原生”的程度。

但是随着企业数字化深入推进,企业对云的应用程度也越来越深,对数据仓库的需求进一步发生了变化,推动了第四代数据仓库——以 Snowflake 为代表的“云原生数据仓库”的崛起。


在从 DW in Cloud 转向 Cloud Native DW 的过程中,企业的需求变化具体表现在以下几个方面:

1)更精细化的资源管理能力

传统的分布式数据仓库采取计算、存储一体化架构,不支持单独扩展,但在数字化业务增长的驱动下,计算、存储的性能扩展需求往往是不同步的,计算性能往往仅需要在负载高峰期间进行扩展,而存储性能则一般是长期、线性地进行扩展。

因此,云原生数据仓库在对象存储技术之上,采取计算、存储分离的架构,支持计算、存储节点单独扩展,从而实现了资源的精细化管理,有效降低了扩容成本。

2)全民化的数据分析、更高的计算性能

数字化时代,数据分析服务的使用者,从企业决策管理层进一步扩展到专业的数据分析师、一线业务人员,乃至企业外部生态中的合作伙伴。

因此,云原生数据仓库能够实现更优化的性能调度、多租户的权限管理能力,从而支撑海量数据分析用户的并发访问,同时实现跨部门、跨组织、跨地域的安全数据共享能力。

此外,除了来自企业需求的驱动因素,Snowflake 之所以能够获得如此快速增长,另外两点原因在于企业 IT 基础设施的变化。

1)良好的云采纳基础

以 AWS 为代表的公有云已经深刻重塑了海外企业的 IT 基础设施,“上云”不但早已成为企业共识,更成为了现实。

事实上,Snowflake 的成长周期,几乎与以 AWS 为代表的云服务厂商逐步建立起统治地位的周期同步。2012 年是 Snowflake 成立的年份,而同样在这一年,AWS 举行了首次开发者大会 re:Invent,这也标志着云计算的用户群体开始得到空前壮大。

因此,以公有云订阅模式作为其主打商业模式的 Snowflake,充分释放了大量公有云客户的数据分析需求,而且公有云特有的轻交付模式使得 Snowflake 的销售成本极低。

2)多云策略的普及

随着企业多种类型业务的全面上云,以及企业对业务稳定性需求的升级,多云策略同样成为企业共识。

因此,相比于 AWS、Azure、谷歌云等公有云之上的云原生数据仓库,Snowflake 能够提供非厂商绑定的、兼容多种公有云的、使用体验一致的数据管理能力,还可以进一步在多云之上提供容灾备份能力,中立性优势更加凸显。

4 国内市场竞争格局尚不明朗

红点创投早在 2014 年就领投了 Snowflake 的 B 轮融资。红点中国执行董事刘岚认为,国内云计算市场相比美国要滞后三到五年左右,对于这一点,投资机构们早有普遍预期,而大家更看重的是未来五到十年的成长潜力。从过去几年美国云计算市场的趋势来看,企业在 IaaS 层的建设结束后,会越来越关注云对企业的业务价值,PaaS 与 DaaS 的重要性会越来越凸显,这也是 Snowflake 能够崛起的根本原因。

此外,中国的云原生数据仓库市场的发展存在一个很关键的有利因素,就是中国庞大的数据体量及潜在的数据分析需求,相比欧美更加旺盛。

由于中国消费互联网市场的爆发式增长,企业内沉淀下来的可供挖掘的数据比欧美更加丰富。因此,在中国经济转型的大背景下,企业对于挖掘数据价值的诉求比欧美更加旺盛。同时,由于国内同行业竞争的激烈程度,企业对于数据服务的敏捷型需求也更加迫切。

相比于美国市场,国内云原生数据仓库市场的竞争格局尚不明朗。首先,阿里云、华为云等公有云巨头厂商已经布局该市场,成为该市场里面的重要玩家。

在独立厂商方面,成立于 2016 年,源自 Apache 开源基金会项目 Apache Kylin 的中国云原生数据仓库厂商 Kyligence,是红点创投在中国市场看好的一家独立厂商。Kyligence 作为一家独立厂商,在 2016 到到 2019 年间的短短三年时间,就已经完成四轮融资 。相比于公有云厂商,Kyligence 的优势与 Snowflake 类似,同样在于更加中立的背景,带来了其在多云策略下的独特地位。

爱分析认为,由于独立厂商在云原生数据仓库市场中的独特价值,未来中国市场有机会诞生一家独角兽公司。

5 从真实案例出发,云原生数据仓库能解决哪些实际痛点?

Kyligence 于 2017 年 12 月正式发布云原生数据仓库产品——智能数据云 Kyligence Cloud,就是其基于领先的 OLAP 技术,结合云上大数据的最佳实践,为企业客户提供快速、易用、安全、可扩展、低成本的端到端大数据分析解决方案,从而支撑企业日益增长的云上分析业务。

正如前文所述,云原生数据仓库的主要价值之一,在于应对多租户环境下的高并发分析痛点。这样的痛点在大型银行、零售企业、制造企业、房地产商等部门和员工众多的集团型企业,以及 SaaS 厂商等拥有众多企业客户的科技型公司,表现得尤为突出。

以 Kyligence 的海外某 SaaS 企业用户为例,该企业的 1800 多家客户分布在全球 40 多个国家,涵盖了 500 强企业的三分之一,其 SaaS 平台上产生的年交易量达到 80 亿美元,而交易产生的数据量更为庞大。

该企业提供的 SaaS 平台,具备一项功能是为客户提供仪表盘(dashboard)可视化页面的功能,而数据源则来自于 SaaS 底层的数据仓库。这意味着即该企业的每家客户仅有一个账号,那么也会有超过 1800 个用户同时访问数据仓库。

过去,该企业采用第三代数据仓库,即 DW in Cloud 的模式,面临的问题是在高并发的状况下,用户访问性能明显下降,不得不建立大量固化视图。尽管这种做法收获了一定效果,但是从长期来看,视图的创建和维护成本越来越高,而且最多仅能支撑 10 个左右的并发访问量。

因此,该企业在重新选择大数据平台过程中,选择了 Kyligence Cloud,最终实现了以下几方面的效果:


  • 功能层面:为终端用户提供灵活交互的仪表盘,具备更加灵活的新需求响应能力,能够搭建支撑机器学习的开放平台;

  • 性能层面:具备更灵活的扩容能力,查询时间小于 2 秒,能够支撑超过 100 的并发数据访问量,数据准备时间缩短到 1 小时以内;

  • 安全层面:提供企业级的数据安全管理,包括数据恢复,以及行、列级别的访问权限控制等;

  • 成本层面:完全基于 AWS,总拥有成本大幅降低。

6 All in Cloud 时代,企业如何进行云上数据分析?

想学习云上数据分析实战经验?金融、零售、SaaS 等领域多家全球名企数字化转型实战分享尽在 Kyligence Cloud 2020 大会。


点击👇【阅读原文】预约直播

热门交易所

热门币种

Bitcoin
BTC+1.86%
17,427.2
Ethereum
ETH+2.48%
528.768

比特币蜘蛛BTCSpider.com是比特币新闻及数字货币信息的聚合站,每天追踪采集全球主流比特币等数字货币财经媒体、项目官网、交易平台的新鲜信息,实时更新海量资讯内容。