文
郑博
企业云数据量的增加以及数据转换、模型构建和可视化工具的出现,推动了现代数据堆栈的崛起。大部分公司都在加大对数据团队的投入,以适应不断变化的需求。然而,我们不难发现共享和发布数据工作仍然复杂,数据从业者经常要使用多个工具,比如JupyterNotebook、SQLscratchpad、GoogleDocs等。
同时,越来越多的企业也开始要求非数据类员工也要具备数据素养,如产品管理、财务和业务运营人员。但是传统工具上手难度较高,对于非技术用户并不友好。此外,工作负载的增长,进一步导致了协作、共享方面的问题。
Hex正是瞄准了这个市场。它提供了一个云端编程环境,用户可以用Python/R+SQL进行编程,同时,它也支持数据可视化和数据间的关系查看。Hex还具有优秀的协同能力,并支持分享。Hex生成的可视化报表能以App匹配的形式分享,也可以嵌入到Notion等在线文档工具中。
简单来说,Hex给客户提供了协同的数据科学编程的工具,用户可以在这个工具里用到一些数据科学计算的能力,然后协同编程,最后直接出动态的BI报表。一句话概述,可以理解为一个带编程协同能力的BI平台。
Palantir工作中发现协作需求Hex成立于年,三位创始人是在Palantir工作期间相识。在工作中,他们发现共享和发布数据工作非常困难,工作流程严重孤立,协作也不理想。他们认为Figma为设计师所提供的工具,Notion为文档所做的事情,在这个市场中同样存在需求。因此,Hex希望将最好的Notebook和数据可视化整合到一个平台中。
Hex通过使基于代码的工作流程更易于访问,并连接技术范围内的用户,使利益相关者能够提出和回答问题、共同工作并积累知识。在没有Hex平台之前,数据科学家和分析师通常在多种工具之间跳来跳去。这种碎片化,导致了协作、共享和生产力方面的问题。Hex致力于消除这种用户摩擦,使数据团队能够专注于他们的工作。
云和AI驱动市场持续增长根据FortuneBusinessInsights报告,全球数据分析市场规模预计到年达亿美元(年至年复合年增长率为13.4%)。
行业增长主要源于三大驱动:首先,用于预测的数据分析工具应用不断增长;其次,数据存储持续向公共云转变;最后,AI和ML在企业应用程序中兴起。此外,伴随云数据平台的增长以及ETL和数据维护工具的激增,使得企业更容易去采用和维护云数仓。
基于订阅模式,用户快速增长Hex的客户群主要由两类构成,一类是目前主打的专业数据从业者,比如数据科学家、数据分析师;另一类是希望扩展得更广泛的非数据从业者,比如产品管理、业务运营、财务人员等。Hex希望能弥合数据团队和非技术利益相关者之间的鸿沟。
基于Hex的两类用户群体,其提供了四种级别的基于席位的订阅定价模式。如果是个人使用,一般选用社区级,其提供最多5个免费项目。对于数据从业者或者小型团队来说,专业级的订阅是合适的,每位编辑者每月收费36美元。
对于大型团队需要扩展数据协作和治理时,一般会选择团队级订阅,每位编辑者每月收费75美元。最后,如果是大型企业用户,Hex的企业级订阅也支持为他们定制定价和解决方案。并且也会为他们提供包括私有云部署、自定义Docker映像以及专门的故障排除和支持等服务。
综上,Hex对编辑者和管理员按席位收费,允许观众和访客在专业和团队计划中免费使用该平台。工程师和产品经理等非数据用户通常以查看者身份进入,然后随着时间的推移成为编辑者。
截至年03月,Hex已经为多家公司提供了服务,包括Brex、Notion、Toast、AngelList、Loom和Fivetran等。公司的客户数量和收入在年增长了4倍,平台用户增长了10倍。
新机遇带来资本助力大语言模型的火爆,也让Hex有机会进一步降低数据从业者的门槛,从而增加潜在用户的数量。例如GPT-4,可以生成SQL和Python代码。
年2月,Hex发布的生成式AI辅助工具HexMagic内测版正是希望迎接这种机会。它能够解析和理解模式和项目上下文,允许Hex将用自然语言编写的问题转换为SQL或Python代码。
AI能力的大幅度提升,会将时间还给数据团队,同时让非技术用户也能够提问和回答问题。进一步而言,伴随用户门槛的降低,Hex专业数据用户以外的商业扩展也值得