文丨第一新声,作者丨九木,编辑丨田艳红
01年,IT运维行业又热闹起来了!
各种新名词、新概念层出不穷,乱花渐欲迷人眼,例如DevOps、SecOps、DevSecOps、AIOps……
融资金额达到历史高峰,第一新声根据IT桔子不完全统计,01年IT运维行业相关融资事件共有4起,融资金额约54.7亿元。例如云智慧、擎创科技、听云等企业先后完成E、D、C轮融资。红杉资本、GGV纪源资本、云晖资本、晨晖资本等知名投资机构的身影不断浮现。
要知道,更早的一波融资热潮还是5年前,年IT运维行业共有4起融资事件,当年融资数量达到峰值。
从传统的手动运维,到DevOps的自动化运维,再到AIOps的智能化运维,运维技术在近几年实现了跨越式发展,IT运维行业也再次吸引了人们的眼球。不仅引发人们的思考,行业又发生了哪些翻天覆地的变化?头部玩家之间的定位和产品有了哪些新趋势?大家都在谈论的AIOps落地过程中面临哪些挑战?
1、融资额超50亿元,达历史高峰
IT运维是全球软件市场规模最大的刚需赛道之一,整体市场规模超过亿美元,且处于快速上升通道。
目前,全球运维软件领域已经出现了多家重量级的美股上市公司,例如ServiceNow(亿美元)、Datadog(亿美元)、Splunk(0亿美元)等。
中国是全球不可忽视的市场,国内IT运维的潜在发展空间超过千亿元,其中,金融、制造、能源等领域的大中型客户的年客单价达到几百万元。
例如前瞻产业研究院数据显示,01-年,中国IT运维市场规模呈现波动趋势。从增速来看,年达到近年来最高增速17.34%,达到了.亿元的市场规模。年,中国IT运维市场规模达到34.3亿元,同比增长15.73%,00年我国中国IT运维市场规模达到亿元左右。
艾瑞咨询数据显示,01年中国IT服务将突破万亿大关,其中,IT运维市场规模在01年达到.亿元,预计03年达到.4亿元,00-03年的年复合增长率为11.7%。
西骏数据CEO何泽松向第一新声表示,国内IT运维正在蓬勃发展,运维和安全是企业IT部门的两大业务支柱,安全领域现在非常的火爆,上市公司有二三十家,而在运维领域里,无论上市公司还是融资的企业相对还是较少,未来赛道渗透率还将大幅提高。
国内IT运维的市场规模迅速增长的同时,行业融资也是热火朝天。
第一新声根据IT桔子不完全统计,00年-01年,IT运维行业融资金额约1.76亿元。其中,01年IT运维行业相关融资事件共有4起,融资金额约54.7亿元,金额达到历史高峰。例如云智慧、擎创科技、听云等企业先后完成E、D、C轮融资。尤其是云智慧在01年7月获得E轮1.5亿美元,再度创下国内智能运维行业的最高融资记录。
第一新声发现,在IT运维领域活跃着一批国内知名投资机构,其中不乏红杉资本、真格基金、晨晖资本、云晖资本、梅花创投等身影。
随着融资热潮,尤其是多家头部企业获得巨额融资,IT运维行业也再次被推到聚光灯下,是巧合还是行业发展又到了某个节点?新入局者是否还存在机会?
“年行业出现创业和融资热潮,到了年IT运维行业更是过度发烧,大家恨不得一步就迈入智能化、决策智能的时代。到了00年、01年近两年,绝大多数客户才开始回归理性,强调数据治理、数据平台的基石作用。这个风向一旦到来,预示着一个新兴科技领域即将进入规模化发展的拐点。”擎创科技CEO创始人杨辰向第一新声解释,根据Gartner的IT运营技术成熟度曲线变化来看,一般前几年会突然出现一个期望的高峰值,往往伴随着市场的极度不理性,随着期望值的降低,市场回归理性,与此同时行业规模却会快速上升,所以其认为01年是IT运维行业规模上升的重要起始点。
杨辰认为,到目前为止,IT运维赛道已经逐渐的层级化,强者逾强,因为软件领域一旦产品化程度高了,技术壁垒随之建立起来,逐渐的收敛市场。在这样的形势之下,完全初创没有积累的企业再进入,发展难度会越来越大。
晨晖创投投资副总裁文超同意上述观点,其向第一新声解释称:“国内IT运维的融资热潮是分阶段的,呈现阶梯式上升,整体天花板还是很高的。如果对标到国外头部企业ServiceNow,其营收规模近50亿美元,市值空间已突破千亿美元。行业在演进,例如AIOps(智能运维)是在以一种更高效更智能的方式解决IT运维问题,新机会下国内也有望跑出一些大型甚至超大型企业。但在这个节点上,新入局的企业可能会比较难,目前大量资金资源已逐步聚焦于行业头部企业,而且他们仍然在标杆客户的关键项目上持续迭代产品、打磨团队,加上ToB领域本身也存在品牌效应和客户粘性,如果一个全新的公司进入,则需要很长的时间才有可能追赶上头部企业的步伐。”
不过,听云总裁赵宇辰和日志易创始人陈军持有不同的看法。
听云总裁赵宇辰认为,IT运维行业一直都有机会,AIOps、云原生监控等细分领域海外已经有新的公司层出不穷,因为场景在不停的迭代。随着云化,可能导致以前所做的事情都有机会重做一遍,这是一个长期的发展过程。随着云原生和数字化的加速,IT运维的业态也随之发生变化,例如原来产品很多是私有部署,现在都是用云的形态,里面的技术栈、组件、架构都进行了变化,更加弹性和敏捷。
“AIOps发展至今,从前期一个算法覆盖所有场景,一个场景覆盖所有客户,一个厂家覆盖所有场景,已经发展到更聚焦,不同行业有不同场景,场景百花齐放,每个场景都会选择最专业的厂家来实现。”日志易创始人陈军说道。
目前,国内IT运维赛道上玩家众多、暗流涌动,尤其是今年多家头部企业获得充足“弹药”,进入白热化竞争期,似乎有“大战一触即发”的紧张感。
对于市场格局未来的发展,西骏数据CEO何泽松进行了分析,一是随着云和大数据、数字化转型的发展,IT运维再经过5~10年的充分竞争之后,预计每个大的细分领域会有1~家比较有影响力的公司出现。
二是不同赛道之间的头部玩家在逐渐融合。例如今年有很多获得较大融资金额的公司,以前做APM、应用监控等业务的传统运维软件厂商来到AIOps赛道,以此作为下一轮融资的起点。
三是无论AIOps还是IT运维软件,本身的可验证性需求非常强,只有真正帮客户解决问题,才能得到认可,所以最终这个市场还需要靠口碑做大。接下来的5-10年,至少有3-4家的智能运维厂商脱颖而出,成为具有中国甚至全球影响力的企业。
第一新声通过与多位受访人交流发现,越来越多的企业开始利用云计算及大数据等新兴信息技术进行数字化转型,国内企业的IT成熟度逐渐提高,与此同时,国内IT产业也面临包括系统架构复杂化、运维数据多维化、用户需求多样化等变革,IT运维市场由此迎来更多新的机遇和挑战。在这样的背景下,运维技术在近几年实现了跨越式发展,从传统的手动运维,到DevOps的自动化运维,再到AIOps的智能化运维。
、AIOps的“火与冰”
AIOps的持续发展必将推动IT运维的增长。
年春季,云智慧是在业内首家提出“智能业务运维”理念的公司。同一年,Gartner也在运维行业提出了新概念“AIOps”。
之后,AIOps开始进入资本市场,第一新声根据IT桔子不完全统计,在年-年间,多家智能运维公司在此期间创业或传统IT运维厂商转型,并且获得融资。例如成立于年的鼎茂科技在年进入AIOps领域,00年、01年连续获得两轮融资。
在AIOps的风潮之下,国内主要有三类玩家,一是类似云智慧、擎创科技、听云、日志易、西骏数据等创业公司,二是以外包和项目为主的传统IT技术公司,三是基于阿里、腾讯、百度、头条、美团、滴滴等互联网大厂研发的产品线,均在搭建自己的AIOps平台,进而实现对自身业务的精细化管理。
“在数字化大趋势下,IT运维本身的复杂度在不断提升,很坚信未来将从一种工具、软件延伸到AIOps(智能运维)是必然趋势。在整个市场体里面,目前AIOps的发展阶段比较早,所以我认为未来提升渗透率的空间比较大,将是一片蓝海市场。”晨晖创投投资副总裁文超预测道。
Gartner发布的《01年中国ICT技术成熟度曲线报告》显示,00年全球AIOps市场规模在9亿美元至15亿美元之间,00年至05年的年复合年增长率约为15%。预计到0年,AIOps的采用率将会达到50%。
此外,MarketsandMarkets发布的AIOps全球市场预测报告中提出,全球AIOps市场规模将从年的5.5亿美元增长到03年的.亿美元,复合年增长率(CAGR)达到34.0%。而得益于国内AI技术的普及和IT数据量的爆发式增长,中国AIOps市场在未来5年的增长速度将领先全球市场。
一边是如潮水般的玩家纷纷布局,一边却是现实中AIOps落地速度不达预期中的迅猛。出现两极分化的原因是什么?AIOps落地存在哪些挑战?
AIOps实际应用及落地时间还很短,目前主要处于在运维数据集中化的基础上,通过机器学习算法实现数据分析和挖掘的工作。主要应用场景包括异常告警、告警收敛、故障分析、趋势预测和故障画像等。
AIOps离不开人工智能两大要素,数据和算法。AIOps想要落地一是要实现对数据的统一收集和管理,二是需要构建统一监控平台来实现IT资源的统一管控。
云智慧总裁刘洪涛对此现象的解释是,一方面从数据治理来看,因为每家客户的IT系统都有历史,如果是上一款全新产品没有问题,因为一开始就完全规划好了,数据采集、分析、决策等逻辑很清楚,但绝大部分客户都有历史遗留问题,要把客户不同阶段建设的系统整合在一起,然后建立AIOps,这个时候数据采集工具的整合,标准统一等问题就耗时耗力了,但这又是必须要做的事。另一方面统一管理平台是必然趋势,统一监控是刚需,因为现在客户系统多了,必须要用一套平台把资源都管理起来。例如一家公司采购了不同的IT运维平台或者工具,工具和工具之间,平台和平台之间也存在问题,比如无法做到无缝衔接、协同,而云智慧就可以解决。
针对这两个挑战,云智慧已经为行业打造了范本。
在数据层面,云智慧早已洞察到,AIOps将对系统的实时数据采集、存储和分析能力的要求越来越高,团队认为要解决的第一件事就是构建企业数据中心。即AIOps要想落地,在贯穿检测、分析、发现(告警)、处置四大环节之中,先要解决数据的收集问题,之后才基于客户实际应用场景,解决实际业务问题,有效地提升IT运维效率。
在统一监管、管理平台方面,云智慧率先构筑了“全栈”、“全场景”及“全行业”的三大优势,构建了贯穿数字化系统从IT咨询、运维建设、工具和服务的产品矩阵,形成了面向运维全生命周期的解决方案;涵盖ITSM、ITOM、ITOA、AIOps等多个领域。
目前,云智慧是国内唯一可以提供全栈IT运维产品的公司,还曾在多次国际竞标中,依托自身运维产品和服务模式,一度战胜了国际大厂的竞争对手。
此外,在数据的收集和管理方面,擎创科技、听云、日志易、西骏数据等公司也给了不同的答案和方向。
“公司的发展方向与Datadog比较趋近,但是我们数据的支持范畴更广一些。擎创科技主要做指标数据、调用链数据、日志数据,把这三种数据放在一个allinone的平台里,以业务为视角对它进行融合的处理,然后达到运维的可观测性。“擎创科技CEO创始人杨辰介绍,公司相比Datadog不同之处是,前者会对这三类支柱数据产生的告警进行实时智能分析和处理,同时利用配置关系数据,起到迅速降低告警噪音,大幅提高应急处置效率的功效,所以擎创科技比对Datadog的数据处理类别更广一些,但是方式方法趋同,目标也是趋同的。
杨辰对AIOps的未来趋势是这样分析的,首先场景和场景之间,场景和平台会趋向于融合,也就是一体化的运维数据中台加多个应用场景的模式会成为一种趋势。其次3~5年内,AIOps上层的场景和既有的监管控场景的融合,也会变成一种趋势。例如智能运维的分析,如果实时性做得非常好,它可能会逐渐的开始替代既有的监控产品,在流程方面可能因为智能运维的分析判断加自愈变成一种更自动化的处理,所以流程也会被淡化。
听云总裁赵宇辰指出,数据收集和管理是大趋势,之前有人只做前端的监控,有人只做后端的监控,但这两个数据是割裂的,并不能联动起来,但客户更希望有一个整体的解决方案,所以听云做了端到端全站打通的形态。现在公司也在为一些客户做试点,希望把他们各种各样的内部运维数据、IT数据汇聚到一起,同时数据之间的关联性建立起来,分析才更有意义。
“现在做AIOps的公司很多,概念已经被泛化了,真正的AIOps是把机器学习的算法用在运维数据的分析上。斯坦福大学教授、机器学习权威吴恩达在今年提出了著名二八定律:80%的数据+0%的算法=更好的AI。我比较认同这个看法,AIOps首先做好数据治理,否则就是空中楼阁。”日志易创始人陈军介绍,日志易有一个数据工厂,专门做数据治理。
日志易在00年初推出了基于日志、指标数据、调用链追踪的可观察性产品‘观察易’,并把机器学习算法用于可观察性分析。有数据做支撑,场景算法可以不断地衍生进化,日志易SPL也提供了几十种经典机器学习算法做更灵活的分析探索。
日志易的特点是,自主研发了国内首个高性能高可用性的日志搜索引擎Beaver,每天可处理PB级日志,相比通用开源搜索引擎来说,Beaver性能提升了10倍且硬件成本降低了50%。此外,日志易自研的低代码编程语言SPL(SearchProcessingLanguage)已实现了多个函数及指令,全面覆盖智能运维分析和安全分析工作需求,对接了后台几十种机器学习算法,实现了智能运维AIOps。
西骏数据CEO何泽松提出了4个挑战:第一个是没有大数据平台的支撑能力,当客户的各种结构化、非结构化的运维数据被采集的时候,运维平台到底有没有自主能力提供高性能的处理?
第二个是大量异构的数据来源和数据类型,如何采集?已经采集的数据如何进行数据清洗处理?因为每个客户使用的监控工具都有非常大的区别。需要通过低代码的支持去实现数据的采集和接入,有效地降低在数据采集方面定制化开发的工作量,缩短交付时间。
第三个是涉及到算法的实时化以及框架化如何处理?通过静态历史数据构建算法模型的方法在实际应用过程中会由于用户的参数调整、系统升级等原因而失效,这时静态算法模型的预测效果就非常差。
“在实际运维中,经常出现人为操作、业务异常导致采集的数据出现较大异动,使用静态模型预测就好比我们拿一个高速公路的交通数据建模来预测市区的交通情况,差异会比较大。这就要求我们能够实时根据用户的需求构建模型、进行调参,支持多种算法偏好,并且能帮用户实时分析评估不同算法的预测结果。”何泽松介绍了三个纯技术性的难题。
第四个是管理上的难题,客户在尝试AIOps之前已经有很多的运维监控工具,甚至已经投入了几千万、上亿的成本,如何能保证一个新生的AIOps系统,就一定比运行了5年10年的监控系统更有用?这就需要AIOps平台不仅能够采集数据、分析数据、展现结果,还要反向赋能。
“西骏数据的AIOps是赋能平台,帮助客户更好地使用原来的监控系统、日志分析系统,把我们的分析结果给原来的监控系统分享过去,让客户的监控工具更安全和智能。与原来的系统变成一种共生关系,而不是替代的关系,这样才能让客户已有的投资保值增值。否则AIOps在客户那边只能唱独角戏,收获大片的反对声音。”何泽松说道。
此外,多位受访人还对第一新声表示,AIOps落地过程中还存在其他的挑战。
例如擎创科技CEO创始人杨辰指出,客户群体的成熟度还有待提高,即客户的运维理念、运维管理方式要改变,公司引入的不仅是一款智能运维产品,实际上是引入一种运维观念。转变就是从原来的监管控体系的传统经典的ITOM的产品演进到以数据来推动运维。“因为智能运维的本质就是IT运维行业的数字化转型,就应该更理性的去规划建设路线,根据目前的数据条件,然后有序的去治理数据,再根据不同场景利用数据辅以算法处理以发挥更大的价值,甚至于很多场景不一定要利用算法,但是数据仍然推动价值。这需要至上而下进行,需要管理层主动推动。”
一是要整合,把制度、流程和技术进行整合,把服务器、操作系统、网络和存储等进行整合;其次是建立服务治理机制,根据PDCA方法论形成运维管理闭环;三是建立运维数字化,让运维一目了然;四是完善智能监控分析体系;五是提升运维自动化和智能化水平。
听云总裁赵宇辰强调,AIOps不是一个单点问题,而是一个系统工程。就像是航天登月,并不是发动机、燃料、电脑计算系统等某一项获得突破就能登月,而是每一块都需要很多工程师的努力,算法、数据架构、数据治理、知识库、专家库、产品的设计等各方面都具备较好的条件才可行。
毕竟在中国独特的产业环境内,IT运维服务商承担的不仅仅是运维的职责,还需要通过一套完整的产品帮助客户解决跟运维相关的几乎所有的问题。
3、云原生是一把双刃剑?
如果说AIOps是IT运维行业的一剂兴奋剂,云原生则是一把双刃剑。
云原生领域的运维会更加的重要,因为云原生在资源的交付和上层应用之间实际上是动态变化的,并不是一对一永远绑死的关系,对于资源的调用非常灵活,所以它可以节约资源,而且发布应用的速度会非常快,这是好处。
反之带来的坏处就是,基于云原生的应用发布速度很快,但应用和具体的计算资源、存储资源之间的关系不明确,这就让保障上出现问题,不一定能够做的严丝合缝。所以基于云原生的运维,对AIOps的要求变得非常高,因为云原生是动态变化,所以需要AIOps等新兴的方法,能够快速判定IT的问题以及原因,然后阻断问题的蔓延。而传统运维是基于个人经验,关系是一对一,在未来云原生环境下无法做到。
基于对云原生各方面的分析与预判,擎创科技CEO创始人杨辰指出,公司目前的产业方向有两点,第一个是云原生,在云原生领域形成一个Allinone的智能应用平台,里面包括了各种各样的监控、智能化处置、告警、定位,甚至包括一些自愈,全部都会为原生去打造,所以这是一个重要的方向。第二是扩大对信创的支持,会在信创领域打造一个信创板的智能运维。
西骏数据CEO何泽松的观点是,一是AIOps最终的形态应该是云原生运维,一方面要适应越来越多客户把自己的系统部署在云上的趋势,另一方面AIOps也变成云的一部分。二是AIOps与过去运维监控工具最大的不同是需要穿透各种云架构,去跟踪客户的业务系统调用进行分析。三是系统的监测和可观测性方面,AIOps将形成反向的输出和赋能,让现有的监测和观测系统更加智能。最终形成一个构建在云基础上的云原生智能运维平台,变成一种云运维服务平台。
基于云原生对IT运维的影响,行业也出现新的挑战和要求。
云智慧总裁刘洪涛认为有个方面,首先云化带来的变化是运维对象越来越多。
随着企业推进数字化转型,新增的应用系统越来越多;随着线上业务规模扩大,应用系统不断地进行细化拆分,组件的数量越来越多;随着微服务的推行,节点朝着小而多的方向迅速发展。现在,一家企业一套应用系统有几百台服务器,几百个容器已经是常见的事情。虚拟机和容器的爆炸式扩大增长,已经不是危言耸听。这要求着运维人员投入更多的精力来保障和运维系统。但是传统的运维模式,例如操作文档手工运维,脚本方式手工运维,按系统类型分类运维,大量个性化特殊化运维等等方式已经无法解决。
第二对运维的要求越来越高。IT规模小的时候,传统运维可能还可以停留在几台服务器的搭建,基础软件的安装,日常的变更维护等等,只要保证系统的安全稳定运行即可。但随着企业的规模发展,对运维也会提出更高的要求,例如几百台服务器规模化的部署,几千台大批量的操作,分钟级甚至秒级的敏捷资源供给,自动化的资源扩缩等。在这些场景下,依靠传统的资源管理和人工操作方式已经无法满足业务对运维服务的要求。
随着软件不断的迭代升级,目前云智慧处在4.0前后阶段,国内整个IT运维市场已经处在高增长阶段了。刘洪涛强调,4.0阶段的企业有几个维度需要注意,例如要有完善的管理体系,有足够好的市场地位,产品质量、服务质量以及客户满意度都达到相对成熟才行,云智慧在往这个方向努力的过程中。
4、万事俱备,出海只欠东风?
前文提到,国内IT运维技术在近几年得到跨越式发展;赛道上也有云智慧、听云、日志易等众多玩家依靠产品获得客户认可;企业客户的IT成熟度逐渐提高,运维思维也在进行转变;资本市场今年更是加大力度......从各方面来看,国内IT运维企业出海好像“万事俱备,只欠东风”了?
针对国内IT运维企业是否具备出海的能力以及机遇,各位受访人也给出了不同的答案。
其中,云智慧、听云、日志易在出海方面已经是先行探索者。例如云智慧其在东南亚的出海过程中,已经可以和国际TOB巨头同台竞技,甚至在某些特色方面能更胜一筹。“云智慧要成为一家全球性的通用软件企业,这是我们的最终愿景。”云智慧总裁刘洪涛展望到。
“日志易年即发布英文版,开始布局海外,目前已经成功签约来自新加坡、荷兰、伊拉克、中国香港等市场的多家海外大型企业,在日志搜索处理通用语言SPL技术方面,日志易SPL在指令集数量、灵活性等方面已达到国际领先水平。”日志易创始人陈军说道。
西骏数据CEO何泽松的观点是,中国IT运维企业出海有两个天然优势。第一是国内运维数据量远高于国外大多数国家。在中国设计出来的系统架构和处理能力放在全球没有太大性能问题,甚至具有天然优势。第二是中国客户样本丰富,运维需求多种多样,同一个客户对异常检测或者根因定位的理解可能完全不一样。如果IT运维企业能够在国内不同的行业里都有一定的市场占有率或者优势,意味着产品的灵活性、功能性能等各方面具有非常大的优势,能够提前覆盖海外的各种场景,形成自己的优势。如果仅服务个别行业,在出海时就会遇到较大的挑战。
晨晖创投投资副总裁文超对此看法有两面性,一方面欧美地区IT水平已经比较成熟,如果出海到这些地区会是硬碰硬拼产品力的状态,必然存在较大挑战。不过国内企业可以充分利用大型项目的落地经验打造竞争优势,因为国内金融、运营商、交通等领域的C端用户基数庞大,在其背后支撑的IT运维的复杂度和性能要求必然也是Top级别。经过国内标杆案例考验打磨过的产品,加上一些用户体验和软件兼容上的适配,也是有机会出海与欧美产品PK一下的。另一方面,企业出海也可以瞄准一些发展中国家,来输出我们数字化转型升级的经验。
此外,擎创科技和听云提出了不同的想法。
擎创科技CEO创始人杨辰指出,国内IT运维企业出海的能力和机遇都没有到,认为产品化的程度离出海还有距离,因为他自己一直都在国际性的企业工作,特点是它对产品化的要求非常高,而国内现在喊出海的这些企业,产品还不具备真正意义上的出海的能力。
“国外与中国的客户不一样,国外很多企业的员工动手能力比较强,产品的文档比较全,有一个社区就可以自己动手做,也接受专业的工具干专业的事,所以他们经常有几十个工具配合协同完成。中国客户更希望厂商提供更好的服务给他们,最好一个统一的平台或者统一的工具能覆盖框架,覆盖所有诉求。所以从使用的角度上看,目前国内IT运维企业似乎还未到大规模出海的状态。”听云总裁赵宇辰说道。
不过,赵宇辰也表达了自己对出海的思路和战略,那就是跟随一些中国客户出海,当中国客户走向海外的过程当中,IT运维企业跟随他们一起出海,听云已经有大量的相关案例。例如已经为华为、阿里提供了海外数字化系统的监控和运维等服务。
在数字化转型、云原生的浪潮下,IT运维的盘子会变得更大,产品市场更是足够细分,例如从传统的基础设施运维服务、应用系统运维服务、安全管理服务、网络接入服务、内容信息服务等,到较新的自动化、AIOps等。因此,资本、企业不断进入IT运维这个巨大的角斗场中,他们如何根据自身优势群雄逐鹿,成为未来的"王者"?今年获得E轮1.5亿美元的云智慧有希望吗?