܄

阿里巴巴副总裁车品觉:数据驱动≠大数据

【数据猿导读】 阿里巴巴副总裁在第四届中国电子商务年会上演讲中,他提到,网络安全、物联网、传统科学和分析的融合等是大数据在美国非常有影响力的方面,并且表示,数据驱动和大数据是两码事,企业要搞清楚这两点

阿里巴巴副总裁车品觉:数据驱动≠大数据

第四届中国电子商务年会近日在上海隆重举行。阿里巴巴集团副总裁车品觉出席并演讲。

以下为演讲实录:

车品觉:我刚才在楼上还没下来之前就去看了一些大数据的资料,我其实每天都看很多大数据的资料,我讲一个最新的说法,从德勤2016大数据趋势里面有几个讲到大数据在美国来讲是非常有影响的地方是网络安全、物联网、传统科学和分析的融合,以及洞察力的构成。

大数据对于传统行业和电商可能都会出现一个非常大的关系,但我想跟大家说一个重要的观点,就是数据驱动和大数据是两码事。很多年前,包括20年前已经有商业智能部,数据驱动的企业所讲的是BI,它所做每一个决定可能都是有数据可依的。

大部分企业的开始是从经验驱动,没有一个企业可以说不是从经验驱动的。很多VC投资的时候很喜欢找曾经创业过的创始人去创业公司。对刚启动的公司来讲非常重要。数据对于刚启动的企业来讲没有这么重要。不管哪一种企业,必须要清楚什么叫数据驱动,但经验还是依然非常重要。

从这个地方里面我先解释一下这个图是什么意思,当用一个数据作为企业的开始,会发现数据帮我们去描述今天你的公司怎么样,你今天做了什么。记得好几年前淘宝的总裁是我觉得见过最好的老板。我作为一个智能商业部的领导对总裁说:我可以给你什么?他说你告诉我上个礼拜什么做对,什么做错就OK了。这个事情就是很清楚地描述一下企业的现状,如果一个公司还没有能力去用数据描述自己公司的现状,第一点就不行了。所以很多企业很变态地拼命地做很多报告出来,去描述自己企业的现状,这样不行。当这个出现的时候,要知道其实我们要这么多报告,原因是我们希望对一个企业做出诊断,诊断就是做的是对的,还是错的。当有能力的时候,想一下未来怎么样,能不能告诉我三个月、六个月以后怎么样。然后把数据辅助于行动,如果我们的数据在描述整段预测的时候,瞄准的是可行动的东西,那这个东西肯定已经走进数据驱动了。但这样还不够。

我今天想说的是跨入这个闭环里的东西,从布点搜集存储刷新,关联,这个地方来讲我们是搜集数据之后,怎么样来引领它。看到韩总的PPT里,有很多的标签,很多东西,这些是数据的基本功。这个基本功扎实,才能地证明这个公司有没有大数据驱动的潜力,有没有分析能力的公司,不代表有大数据的能力,有分析能力的公司。我们懂商业分析,但是这个公司不一定有商业技能。商业技能是一个体系。分析是里面工具的其中一部分。你一定需要有分析的能力,同时要有搜集数据整合的能力之后,这个数据的闭环就成立了。当数据闭环成立,再把经验放进去以后,就发现了整个公司在学习的阶段。一个公司没有学习的话,它还不能说是一个有数据驱动能力的公司。这时候还没有跟大数据有关系,这不是大数据,这只是数据驱动而已。

从你们的左手边可以看到这里有两个数据的中心化,一个是数据的碎片化。从上而下是问题的确定与问题的不清楚,你会发现大部分是20年前,甚至30年前开始,已经有左上角的地方数据很集中,问题很清楚。这就是传统上的商业技能所谓的KPI,或者是运营指标驱动。为什么突然之间有大数据呢?因为有PC、移动,很多数据搜集以后,很多零碎的碎片化数据解决同一个问题时候,其实发现有更多数据来处理过去没有办法解决的问题。今天大家都是电商,很简单,如果你们做跨境电商的话,你们没有购买这个工具数据包的话,等于没有做过跨境电商。是吧?因为它把亚马逊河易贝购买的大数据都搜集在里面,如果没有看趋势,而是盲目地做某一个行业,其结果相信会是很惨的。我其实用了大量的数据和谷歌数据来知道未来的趋势到底是怎么样的。我现在想说的是,从左手边到右手边是利用更多的碎片化数据来帮助你理清楚很多问题。以前并不知道这个客户怎么来的,现在有了碎片化的数据以后,可以更清楚地知道客户怎么来的。

右上角走到右下角的时候,碎片化数据加上问题不是很清楚的深度学习,也就是说我们用非常多的数据来告诉我们一些经验上没有的东西,我们不知道的东西。希望今天能够介绍一下这个框架,其实当我们在很零碎数据,很零散问题里找到一个问题所在,就回到了左上角的区域:数据中心化,这是一个循环。

其实我们在做大数据的时候,商业智能的体系里面要学会怎么学会应用别人数据的冗余,包括很多很多数据的冗余,不知道它的存在,但是有一些人知道它存在,知道后面其实有这么多的数据去让他知道不同的区域里有些什么。好象几十个国家的数据在中国里边没办法知道有什么数据可以用。

我想说当你知道碎片化数据的时候,会发现在搜集布点存储的地方里面已经很不一样了。等于说今天如果你是个传统零售店,你知道现在在美国有多少个工具可以用不同的方法来看实体零售店的流量和整个用户的行为轨迹,这已经是非常非常地在出现了。我想说的是这个闭环并不是一个很新的闭环。其实我们在数据世界并没有这么完美。外面跟你讲得很好很好所谓大数据公司的能力,其实它的数据是零乱不堪的,所以工程师要花非常非常多的时间来整理,整理到怎么样呢?整理成井井有条。你只有看到这些稳定数据的时候,这个数据使我们使用的时候才会比较容易。右手边比较乱,但是发现我们今天大数据的世界里面,会发现左手边的东西和右手边的东西同时存在,大数据本身是多元的,非常多的来源,而且非常多所谓的多元异构所组成,所以注定结构就是不稳定的。所以不能强求像右手边的图那样完美。

今天电商面对的全渠道,全渠道有两件事情要注意,到底每天有多频繁使用,以及花多少时间来应用,这不一样的。比如视频网站会让你停留在这里比较长时间,微信很频繁。为什么要知道这一点呢?当你要看哪一个应用所产生的数据对你特别有用的时候,可以用两个地方来看,数据的产生来源于应用,另外一个,数据的应用必然跟终端有关系。所以你看一下未来的终端PC到手机以后,发现大家很努力地要做智能电视。智能电视也有一些很努力地做物联网。所以不同的空间里面可能会出现不同的数据入口。这个地方在数据上来讲要卡位的,从应用的卡位到终端的卡位,这是大数据里面的数据来源,但不管怎么样,会发现为肯定是多终端,多应用,所搜集出来的数据让我们知道这个人怎么怎么样。

最终想知道这张图,用什么吸引他,什么时候吸引他,只不过需要这样360全维度的图,我说这张图是电商用的,如果是别的行业,这张360又不一样了,金融环境里又不一样。只不过想要一张这样的图。如果做大数据的时候心里面并没有这样的图,你是没办法做大数据的,因为你需要预先知道哪些数据对你来说比较重要。

好的,大家有一个认知说:当讲到数据的时候,有人跟你讲大数据,人家说有没有,不是有没有的问题,而是数据够不够准,够不够细,够不够全、稳定不稳定、够不够快,这几个方面都会影响到大数据的用途。其实所有的大数据基本上都朝这个方向来走。会发现这个世界根本就没有准确的数据,所有的数据都有偏差,每一个在大数据里的工作就是减少偏差而已,让这个东西变得尽量接近准确数据,但没有真正的准确数据。

好,今天要讲的就是这么多。谢谢大家。


来源:新浪财经

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

2018 AI in China之智能制造数据驱动产业变革高峰论坛在京召开
2018 AI in China之智能制造数据驱动产业变革高峰论坛在京...
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数据”智慧丨数据猿新冠战“疫”公益策划
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...
张涵诚:大数据招商平台可推动地方供给侧改革
张涵诚:大数据招商平台可推动地方供给侧改革

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部