【金猿人物展】数睿数据创始人兼CEO穆鸿:大数据价值创造关键在于应用普惠
【数据猿导读】 本文由数睿数据创始人兼CEO穆鸿撰写并投递参与“数据猿年度金猿策划活动——2022大数据产业趋势人物榜单及奖项”评选
事情还得从我2022年这一年经历的一些事情谈起,由于工作的原因,我要经常往返于北京和南京、上海以及深圳、成都等地。跟很多网友描述的情况类似,曾经一段时间我始终无法消除健康码的弹窗,甚至通过12345主动申报也不好使。大数据用于防疫,我认为是大众能够感受大数据价值和威力的一个最生动的样板。但是大数据不是万能的,时空数据分析受限于数据获取的准确性和时效性,我们没有办法获取到准确的用户行程轨迹,再加上受限于数据安全管控等原因,我们很多数据还得依赖用户上报。从这个意义上,我是理解健康码技术实现上的一些不得已的,但这并不意味着不可改进。
我另外一个印象比较深的是在某地出差,一次核酸信息登记系统的崩溃,风中等了好几个小时。我是真实感受到现场的忙乱以及后台技术人员的压力的,最后可能是一个业务小BUG导致的,但是修改很麻烦。我当时就想,类似这种数据采集系统如果能够现场搭建和修改,并且由底层来保障性能和可靠性,那该多好。后来,到了各处又填了各种各样也不知道是哪个供应商的数据采集系统,我对我自己个人信息泄露又有了担忧,这些信息大部分是重复的,或者本来是不需要申报的,但是可能没有统一的管理入口,或者没有好的共享机制,导致二维码满天飞。现实是最好的教科书,当我们真正经历了很多事情,我们就会有更深刻的认知和感同身受。
还有一段切实的感受,来自我对一个制造业企业老板的拜访,我完全没想到他对数据驱动企业运营和生产是如此热衷和执着,他们采购了全世界最先进的自动化生产设备,也采购了业界最好的ERP等管理系统。他一直在努力解决三个方面的问题:
① 如何实现全流程数据打通,从材料到制品,从生产到物流,从人员到财务;
② 如何实现知识的沉淀和复用,过去生产参数配置是在有经验的一线工人脑子里的,需要将他们数据化并形成他们行业的算法,然后根据客户需求能够自动化生成个性化的最佳参数,他们自己开发了很好的应用来完成这一点;
③ 如何实现数字化应用DIY?他有很丰富的经验,他知道企业数字化痛点,他不懂计算机专业技术,但是希望能全程参与构建,甚至他的员工和一线工人也可以根据业务需要去构建应用。
对于以上这些问题,无非需要的就是一个打通的数据底座和一个能构建各种数字化应用的平台。无论是成本还是技术,他不认为传统供应商能帮他解决这个问题。
在即将过去的2022年,无论是政府还是企业对大数据的价值发挥都有了更多的认知和迫切的期待,但是我们还需要持续努力,抛砖引玉,我提出五个主要需要解决的问题,供大家参考:
1、改进数据供给的质量,数据作为生产要素,必须对数据的采集、加工、共享和应用的端到端质量进行管控,尽量减少人的参与,推动自动化水平的提升;
2、解决数据跨供应商、跨部门、跨组织和行业的共享问题,在风险可控、合规的前提下,推动数据价值共享、交换和增值,尽量从技术而不是管理的角度解决产业关切的问题;
3、降低数据应用开发的门槛,让普通工作人员也能按照岗位的需要,自助取数、自助分析以及开发数据应用;
4、提升数据分析的手段和效果,不仅是统计分析、关联分析、预测和决策,诸如图像视频分析、地理分析、文本分析等也能围绕场景需要轻松完成;
5、提升应用开发和修改的效率,应用要能够满足场景多变的需求,可以随时随地进行修改,并且快速上线。
解决上面的问题也不是一蹴而就的事情,这里面有很多是老生常谈的问题,也有自研能力强的公司已经在局部很好地解决了问题。就更大范围的大数据应用普惠而言,还有很大的差距,这里重点强调“普惠”,就是门槛要低,人人皆可用。从空间角度看,用的人多了,累积的价值就多了;从时间角度看,门槛低了,上线时间就缩短了,迭代改进就变频繁了。我们一直以来的观点,好的应用是快速上线反馈改进出来的。
回顾2022年,为解决上面提到的问题,技术、工具和方法都可圈可点,简单总结如下:
1、大数据过程管理能力落地,提升数据供给质量。无论是DCMM的推广认证实施,还是DataOps的落地尝试,都有助于提升企业数据管理水平,推进数据价值转化;
2、大数据安全和隐私计算,为应用和共享背书。随着相关法规制定和落地,大数据安全和隐私保护得到了全行业的关注,数据安全的产品也更加丰富。为推动数据要素流通而生的隐私计算开始走向商用,尽管还存在性能等问题,但仍备受期待;
3、低/无代码开发工具日趋普及,大大降低应用开发门槛。无论是数据集成、数据分析、机器学习还是数据应用开发,低/无代码已经被企业用户普遍接受,大规模流行还需要时间;
4、处处是AI,不仅是分析外部数据,也用于软件本身。无论是前几年兴起的智能数据治理、AIOps,还是智能数据库,大数据产品本身,不断用AI增强自身能力。此外,AI用于外部数据分析仍然在持续发展。
大数据分层示意图及每层控制点说明
如上图所示,为实现应用普惠,我们需要多层次的大数据能力支撑。
要有好的数据源支撑,这个主要取决于数据资源的获取能力,数据来了,要有好的存储、计算和分析引擎来支撑。目前主流的大数据引擎技术Hadoop、Spark、Flink等,大部分还是来自国外。2022年Apache Doris、Pulsar等由国内团队主导的引擎得到了迅速的发展,但我们仍然跟国外有较大的差距,因为这层的核心竞争力来自对基础理论的突破。理论的突破会带来断代的竞争力提升。从商业角度,生态卡位则是这一层另外一个最重要的考量点。
再往上,是各种工具,工具对支持应用普惠是最重要的。体验是用户最关注的点,而工程能力是主要的竞争力。尽管过去这层积累也不足,包括数据治理工具、BI分析工具等,过去主要是国外产品天下。随着应用场景的丰富,技术的更新换代,我们完全有机会后来据上。
最后是业务理解力,这块主要取决于用户和行业专家业务知识积累。
每一层竞争力的提升都需要我们不断地应用、尝试、反馈和修正,才能累积真正的产品竞争力并最终创造商业价值。
2023年即将到来之际,随着疫情的逐步结束,企业数字化转型必将加速进行,从信息化、数字化到智能化,将大数据用起来、用好,并能够让更多的企业、企业里面更多的人用起来,已经成为企业的必然要求。这是企业管理从粗放化到精细化经营的必然要求,也是企业生产从机械化、自动化到智能化的必然要求。
从过去几年,我们服务客户的表现来看,仍然面临着诸多问题和挑战,主要表现在以下3个方面:
1、缺乏循序渐进的商业推动力
大数据应用的构建和落地总是需要投入,如果不能很好的呈现商业价值,任何的投入都有夭折的风险,尽管企业有宏大的顶层设计,也要有不断的价值呈现,最好这些价值呈现可量化,并能和商业结果(降本增效)挂钩。企业如果没有很好的闭环评估体系,或者缺乏试错、纠错和容错的机制,商业推动就会很难。只有领导者的支持很难长久。
2、缺乏优秀的平台和工具产品
对于大部分企业而言,要么是自己购买平台和工具做数据治理和分析,要么是它的供应商来做。这都需要优秀的平台和工具,这些产品的研发需要大量的客户积累和长时间的打磨,需要巨大的研发投入,而碎片化的市场、不讲究的客户和行业的内卷,让打造一款真正的好产品越发困难。
3、缺乏适应转型的组织支撑
应用普惠的目标是推动企业数字化转型,让人人都能成为数字化工作者,产生数据、运用数据并形成洞察落地到改进企业的各项活动中。“甲乙方思维”、“多一事不如少一事”以及“运动式改进”等都会导致目标落空,或者不能长期发展。
如果我们认可大数据价值发挥是企业数字化转型的必由之路,并且希望企业每个角色都能通过大数据应用带来价值,我们会有一些具体的建议给到大家,这些建议是基于最近几年我们在为大型国企提供数字化转型解决方案和客户共同摸索出来的,也代表着我们对趋势的判断,即大数据价值创造的关键是应用普惠,这也是推动企业数字化转型的重要举措。
1、建立匹配的混合型组织
无论这个组织是实体还是虚拟的,是诸如数据治理委员会、数字化转型工作组,还是类似低/无代码应用开发CoE。这个组织一般由业务人员、IT人员(可选)以及IT服务商(提供软件产品和服务)组成。这个组织的目标之一是推动大数据应用普惠,能够开发各种生产和消费数据的应用。这个组织一般要由相当层次的人作为领导者或者Sponsor,组织应当明确下面几点:
• 业务人员是业务应用构建的第一和主要责任人,业务人员要参与到应用构建中,推动中大型应用的实施落地(有IT人员参与),一些小微应用甚至不需要IT人员参与,IT服务商主要以软件产品供给和技术支持服务为主;
• 业务应用的目标和范围,尽管我们希望每个人都能用起来,但是仍然要有节奏地推进,包括阶段性的目标和里程碑设定,以及业务范围;
• 奖惩措施的确定,对内部员工而言,成功意味着升职加薪;对外部IT服务商而言,意味着成为客户战略合作伙伴,有持续的商业回报。
2、从解决一个具体问题开始
我们可以有顶层设计,有宏伟蓝图,但所谓大处着眼、小处着手,我们更建议带着解决一个个具体问题,逐步向规划的目标前进,这个具体问题可以是上一个新的应用系统,或者是通过数据分析去解决一个具体的质量问题,甚或是完成国家、上级组织的一个具体任务(比如建立行业数据中心)。
3、选择一个好的支持柔性应用的平台
所谓柔性应用就是应用能够快速构建和上线,能够根据业务的变化随时调整,最好业务人员就能自行完成。无代码软件平台就是个很好的选择,把适应变化作为第一要素考虑,就是为了面对不确定性,水利万物而不争,业务永远是主角而不受限于信息技术。
4、建立一个快速试错的机制
尽早让真实用户用起来,尽早拿到数据结果比其他都重要。比如,主流程跑通了,就可以上线试运行起来,我们首要是拿到业务结果的真实反馈,然后发现问题就去修改,尽管不是必须,但是无代码平台能够帮助我们完成这一点。
5、拥抱变化是新常态
大数据的发展史就是不断拥抱变化的历史,过去大部分需求明确,所以有数仓模型、有周期性报表和预计算的OLAP分析还有固定的数据专题应用。后来,为了应对不确定需求,有数据湖、有动态的OLAP分析以及无代码的数据应用构建,所以我们的架构设计、管理流程和技术堆栈都要能够适应变化,以主动元数据为核心的智能数据目录、自适应的AI系统、自动数据增强、元数据驱动的数据编织都会随着应用的需求提到日程上来。
6、建立良好的度量体系
所谓没有度量就没有管理,这里的度量有两个层面的含义。一个是度量构建各种应用对企业的价值,是降本了还是增效了;另外一个层面是能不能快速通过各种度量给业务把脉,即在各种应用中快速建立度量体系,指标中台被认为是加速度量的重要方法之一。
7、机器能做的事情让机器做
因为机器总是不知疲倦,我们希望在构建应用的时候,或者构建出来的应用都通过“机器”实现自动化处理。前者,例如通过自然语言界面,能够自动生成关于数据的见解,这些见解可以是文字或者图表。最近很火的ChatGPT可以被用于构建问答式用户界面。推荐技术最近也被大量数据处理或应用开发平台采纳来加速应用构建。后者的典型例子包括应用中自动化流程节点的处理,IDP(智能文档处理)可以在这里得到用武之地,或者采用智能工作流技术用于组织内流程的自动优化和改进,流程挖掘是这两年比较热门的话题。
8、让应用更好地为生产服务
过去我们的各类应用主要是西方管理知识的承载,是西方在工业生产管理基础上提炼总结的,当西方制造业转移后,很多场景我们已经无法获取到信息化解决方案。我们必须结合中国产业的特点来找到自己的解决方案,让不懂信息技术的客户能够直接参与应用构建,让应用更好地为生产服务,而这样的价值是远远大于一些简单的管理改进的。
一旦我们通过应用普惠,不仅实现每个岗位的效能提升,而且真正去解决企业经营和生产的具体问题,我们就通过应用真正实现了大数据价值创造。我们能够让每个人都真正参与到企业数字化转型中来,我们就对未来充满了信心,实现从信息化到数字化,并进而实现智能化。对此我充满期待。
·关于穆鸿:
穆鸿先生是数睿数据的创始人兼CEO,数睿数据是数据驱动的企业级无代码平台的开创者和领导者,先后获得包括银杏谷资本、云启资本和红杉资本等数亿元融资,其推出的无代码产品smardaten服务数百家客户,客户知名度和满意度均处于领先地位。
穆鸿先生曾任360集团副总裁,负责集团大数据、人工智能、区块链以及云计算等技术中台的构建,管理超过200EB的大数据集群。在加入360前,穆鸿先生是华为中间件产品和大数据产品创始团队负责人,研发了包括Hadoop的商业发行版本、分布式关系数据库、分布式ETL平台、机器学习平台以及BI分析平台等。穆鸿先生是计算机学会大数据专委会和区块链专委会的执行委员。
来源:数据猿