Taste Analytics CEO 汪晓宇:一切没有应用价值的大数据都是空谈
【数据猿导读】 当前的大数据行业,业界的关注重点已慢慢从基础设施层,转移到分析和应用层面。大数据的价值,目前来看主要是应用价值,Taste AnalyticsCEO汪晓宇觉得,没有应用价值的大数据一切都是空谈
最近与几位互联网行业的CIO在探讨一些关于大数据的问题,中国大数据研究专家,中国互联网协会大数据工作委员会委员龚才春的一句“不以预测为目的的大数据都是耍流氓“语惊四座。言简的一句话便道出了大数据的四大本质属性:4V+1C。
大数据的四大本质属性解读
4V之一是指Volume,即体量大,但须注意数据体量与当时的技术及应用场景有关。
4V之二是Variety,即数据类型多,一个大数据任务,一定要有各种各样类型的数据在一块处理,包括文本的,格式化的,非格式化的,视频的、音频的等等。
4V之三是Velocity,即数据的时效性,今天的大数据在明天就不一定是大数据。
4V之四是Value,即数据价值, Value应具有两个特性,一个是商业价值高,另一个是价值密度低。
1C则是Complex,即数据足够复杂才能称之为大数据。
全球大数据分析技术现状
目前,中国与美国在大数据分析领域的差距,体现在理念和客户心态上。企业数据分析,中美在理念方面相差2-3年,而在实际执行层面或许有5年左右的差距。此外,国内的企业级客户在进行大数据分析时,仍以分析结构化数据为主,而对于内涵丰富的非结构化数据,市面上并没有有效的工具进行分析。同时,在进行结构化数据分析时,仍采用了“招标+外包”的传统模式,即需要大数据分析服务的企业按照历史经验首先建立自己的数据分析KPI(关键绩效指标),然后将整个数据分析任务外包给第三方大数据公司,经过数月的时间后,大数据公司将数据分析的结果返还给甲方企业。
美国有很多主流的企业已经进入到了以非结构化数据分析以及数据驱动、实时分析、人机互动、结果易读等为特点的数据分析的新纪元。但由于中国的大数据分析与应用刚刚兴起不过三至五年时间,人才比较匮乏,比如新浪微博就曾希望将1亿的微博客户进行精准分析与定位,但每天产出的近1亿微博数据几乎都是文本、图片及视频数据,这些数据类型统称为非结构化数据,也是目前大数据处理过程中的难点。其中尤其以非结构化数据处理人才更是奇缺。
一个有意思的现象是,大型国际IT企业一般通过收购、战略投资、合作等方式获得非结构化大数据的处理技术与人才,比如惠普(HPE)大数据,通过开放60个API接口,以获得部分处理文本、图像、视频的能力。相反,有一些小型的初创企业,基于其对某个领域的深入研究,也在大数据的风口博得快速成长。Taste Analytics这家总部位于美国的大数据高新科技公司,以强大的非结构化数据分析能力和创新能力,便引起了笔者的注意。
说得这么玄乎,4V+1C看起来好复杂,其实大数据的本质就是实现数据价值。
大数据:体现应用价值
当前的大数据行业,业界的关注重点已慢慢从基础设施层,转移到分析和应用层面。大数据的价值,目前来看主要是应用价值,没有应用价值或者不能帮助实现应用价值一切都是空谈。各大互联网公司自身有很多研究大数据的专家,针对应用本身进行了很多研究。
Taste AnalyticsCEO汪晓宇
尽管都知道数据中蕴含价值,但究竟如何洞察?Taste Analytics的CEO汪晓宇认为大数据不是神话,不是数据科学家和大企业所独有,“让人们真正看见大数据分析的价值,同时让大数据分析工具化,让这个工具让所有人使用,没有应用价值的大数据一切都是空谈。”
如何让大数据体现应用价值?
如果说让大数据体现应用价值还属于理念范畴,如何让大数据分析工具化?让这个工具为所有人使用,并最终让大数据体现应用价值则属于工具与方法的范围。Taste Analytics推出的Signals非结构数据可视化分析平台无疑是一个绝佳的方案。
Signals平台具有实时动态、图像可视化、非结构化数据分析能力等综合智能数据分析能力,可用于对每一个企业日常经营的实时智能数据进行分析。其独特在于强大的非结构化文本文档数据的深度分析能力,同时灵活的支撑着各种传统的结构化数据(报表、销售记录等)。此外,Signals平台具有广泛的适用性,以人为本的设计理念,也方便了各个企业的管理和业务人员自由灵活地使用这个产品,目前可以成熟的分析包括中文在内的12种文字、语音等非结构化数据。
Signals平台一共提供三层服务:
第一层是数据采集层,它可以帮助企业更快更全的采集到各类第三方数据。目前已集成了上百个数据接口,包括亚马逊、天猫、Salesforce,ZenDesk, Esty, Yelp、Twitter、Facebook、Apple Store、Google Play Store等,并且这个数字还在飞速扩大。此外,为加强中国市场,Taste Analytics也正在和国内知名的第三方数据提供商进行合作,期望为中国客户提供更多本地化的数据;
第二层是数据分析层,用于对非结构化和结构化数据进行深度机器分析。Taste Analytics研发了“预测性分析”技术,基于该技术运用,用户可以享受到结构化和非结构数据的精准分析结果,并对市场行为做出及时预测;
第三层是图像可视化层。Signals非结构数据可视化分析平台会把数据分析结果进行可视化输出,为客户提供10余种图像可视化模式,并且支持客户自定义分析,将包括一共15种不同的可视化分类。Signals非结构数据可视化分析平台可根据用户的不同喜好,继续推出有价值的图像展示,方便企业的使用。
通过上述三层服务,Signals通过可视化分析结果和简单易用的使用界面,帮助企业了解新的市场增长点、做出正确的决策,并可把分析能力推送给企业的决策层和领导层,以帮助企业做出决策。
实时交互是第五本质属性
大数据对于客户应用价值的体现,还体现在“实时交互”上。汪晓宇说:“大数据时代推崇的是以用户为中心、体验至上,这种体现建立在“实时交互”上。实时交互已经逐渐成为大数据的第五项特征。”
因此,Taste Analytics研发的Signals非结构数据可视化分析平台具备成熟的实时分析包括中文在内的12种文字以及语音等非结构化数据的能力,同时,具有强大的深度分析和预测能力。Signals通过深度学习非结构化的自然语言,根据用户的用词、造句、行文方式来理解文字含义,通过对大范围的用户、上千万个消费点进行聚类分析,打破传统的舆情分析需要企业建立专有模型等问题的桎梏。Signals的服务适用于各种非结构化数据分析场景,只要有聊天记录、对话记录和邮件记录,就可以和数据源直接对接,易用而安全。Signals并通过数据分析结果的可视化输出,为用户提供10余种图像可视化模式。用户可根据企业内部人员不同决策地位的需要和喜好,自定义分析结果,获取对自己有价值的分析展示,方便了企业的管理和决策。
大数据价值探索 任重道远
从笔者观察来看,大数据价值的探索与挖掘大家都在做着努力,从客户层面,从梳理自身的需求出发,倒推着技术的解决方案,从技术层面,从满足客户需求出发,从技术上做着长远准备。
Signals非结构化数据可视化分析平台以文本数据处理方面的独树一帜挑战着非结构化数据分析的难题,但显然,它正在为大数据价值的探索做着超前的技术准备,虽然,目前算不上“强大“,毕竟在图像及视频的处理方面还得继续努力。但我们看到了Taste Analytics这个大数据公司的快速成长,2015年底,已经完成了全部产品的中国本土化,包括产品使用中文化、云服务部署落地化、技术支持规模化等。并在2016年2月完成了由真格基金领投,聚合数据、华创资本跟投的A轮340万美元的融资,而这一切都建立在300%的营收增长速度之上。
从Taste Analytics等大数据创业公司的成长,也从另一方面说明了大数据在未来所拥有的价值。但大数据价值的探索,其实还只是刚刚开始,无论是作为整个行业技术短板的图像、视频的处理技术,还是用户本身对需求的认知与梳理,目前都还只是处于初级阶段,大数据价值的探索,任重而道远!
来源:企业网
我要评论
活动推荐more >
- 2018 上海国际大数据产业高2018-12-03
- 2018上海国际计算机网络及信2018-12-03
- 中国国际信息通信展览会将于2018-09-26
- 第五届FEA消费金融国际峰会62018-06-21
- 第五届FEA消费金融国际峰会2018-06-21
- “无界区块链技术峰会2018”2018-06-14