܄

邓白氏高级副总裁安东尼:大数据运用应着眼于企业自身需求 而非盲目使用

【数据猿导读】 邓白氏高级副总裁、首席数据官安东尼也参加了数博会。在安东尼看来,大数据如同于二十一世纪的石油。“对原油进行加工,相当于对数据进行加工,这样我们从数据当中能够挖掘出它能够带来的价值。”安东尼对记者表示

邓白氏高级副总裁安东尼:大数据运用应着眼于企业自身需求 而非盲目使用

如今,人们已经开始逐渐了解到大数据的创新驱动能力,并试图让数字经济和实体经济相结合,以促进经济的需求。但邓白氏高级副总裁、首席数据官安东尼·斯克里费加诺(Anthony Scriffignano)博士近日在贵阳举行的数博会上指出,当企业选择利用数据提升竞争力时,不能盲目寻求一大堆数据进行使用,而是要有一个正确的问题来触发对数据的需求,然后再利用数据去解决问题。

在安东尼看来,大数据如同于二十一世纪的石油。“对原油进行加工,相当于对数据进行加工,这样我们从数据当中能够挖掘出它能够带来的价值。”安东尼对记者表示。

大数据自身其实具有以下五个特点:一是量特别大;二是数据变化的速度非常快;第三是大数据的种类非常多,第四个特点是不同的数据有不同的价值。此外,大数据还具有真实性不同的特点,即不是所有的数据都是真实的,而且即使是真实的数据,并不是同时都是真实的。

“基于以上特点,我们会发现,也许大数据能告诉你很多东西,但这些数据同样可能对解决企业所面临的问题没有任何帮助。”安东尼说。

他举例称,若一家公司想要知道自己最佳的客户是谁,就看自己公司内部的资料,看这些客户的支付历史,从而选择出自己最佳的客户。然而,这些信息都是公司内部保有的、最容易接触到的,它是基于现有的信息做出的决定。

实际上,这个公司应该看到自己企业之外的信息,比如这些客户是不是发展速度很快,这些客户是不是在新闻媒体上有一些负面的报道,这也需要了解,这些都是非常重要的信息,但是这并不是在企业内部已经掌握的信息。

另外,安东尼指出,企业在使用数据的过程中,往往没有对静态数据和动态数据进行区分,有一些数据就是动态的,另外一些数据则是变动的。

静态数据好比如一个酒店的地址,无论何时,答案基本上是一样的。动态的数据就是这个酒店它每一天有多少客人入住,但问的时间不同,答案就不是一样的。

而且,很多数据都是相对静止的,也有很多的数据变动的速度非常快。每一天,邓白氏的数据库中都会进行数百万次的更新,“所以当你问我要数据的时候,我给你的是这一时点上的数据,但是企业一定要谨慎,不要把这些动态的数据拿走了,放在一个地方,让它变成静态的数据,变成死的静态的数据。”安东尼说。

作为全球历史最悠久的企业征信资信和数据金融分析公司,邓白氏和数据打交道的历史超过百年,来到中国也有20多年。今年正是其在华合资子公司华夏邓白氏成立10周年。华夏邓白氏为众多中外企业提供服务。尽管如此,但是安东尼直言,无论是中国企业还是国外的企业,在大数据应用中面临的最大困难,依然是如何选择适当的方式解决合适的问题。

据他介绍,大数据分析是邓白氏所提供的万千种服务之一。而目前全世界的数据中,85%的数据是非结构化的。中国便非常关注结构性的数据。安东尼认为,对于非结构化的数据要进行进一步的定义。现在非结构化的数据这个词被随意进行使用,原因是我们对这个数据的结构不知道,所以我们就把它叫做非结构化的数据。

但是实际上,关于数据我们知道它是在哪,以及我们从哪得到的这个数据,以及我们什么时间获得的这个数据,这就是源数据的基本的内容,所以我们不能随意使用非结构化的数据这个词汇,关于非数据的科学就不能这么简单的认为:我不知道这个数据的结构,所以我不能做什么,不是这么简单的。

在处理非结构化数据的时候,我们要去除它的模糊性,把这些模糊的概念变得清晰。比如我们走到会展中心,录音60分钟,里面可以听到数千人发出的各种各样的声音以及各种噪音。我们拿到这个录音之后第一个反应就是这是完全非结构化的数据,什么也不能做。

其实,这个数据首先是声音,这个声音的音频是所在区间能得到是人在说话。而女性说话的音频就比男性要高,我就可以把人的声音和非人的声音区分开来,把人群女性和男性的比例计算出来。这样,一个非结构化的数据变得有一点结构了,我可以从中发现一些东西。其实我还可以做更多的事情,有更多的发现。

例如通过数据来发现欺诈行为。从企业巨量的信息中,从企业交交易的时间、金额等数据中,我们就可以发现这些都是非结构性的数据。但它们是一些数据的集群,从这个数据的集群中会发现有一些数据可能会反映出一些不太寻常的行为。

虽然这个过程并不是很完美,但是我们可以把一些复杂的巨量的信息简化,去关注那些小的简单的数据集,在这个数据集当中有可能发现欺诈的行为。


来源:界面

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

CCPA与全球消费者隐私保护对中国出海企业意味着什么?
CCPA与全球消费者隐私保护对中国出海企业意味着什么?
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数据”智慧丨数据猿新冠战“疫”公益策划
#榜样的力量#疾控AI分析平台WDCIP——以科技力量贡献“大数...
WIFIPIX:后疫情时代,私域流量让家居零售企业重获新生
WIFIPIX:后疫情时代,私域流量让家居零售企业重获新生

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部