܄

脑洞大开!看大佬们如何对待互联网和大数据

【数据猿导读】 从互联网时代到大数据时代经历了20余年,大数据在近两年得到广泛的传播,但是,目前大数据行业发展却面临各种困境,比如数据共享与数据安全,数据交易与标准制定,数据商业模式与变现等问题,下面来听一下互联网和大数据领域的大佬们是如何看待大数据和互联网

脑洞大开!看大佬们如何对待互联网和大数据

互联网在我国经历了近20年的发展历程,出现过门户、搜索、电商时代,现在迎来大数据时代;与前三个时期不同,大数据虽具备互联网特征,但又表现的相对独立,比如目前以政府和国企数据为例,这些大量线下数据的存在,其数量和价值并不亚于互联网企业数据。所以,当我们谈论大数据时,它的语境似乎更加宽泛,相较于互联网的门户、搜索、电商形态,大数据生态探讨要复杂的多。

经过这两年传播,大数据的价值可谓人尽皆知,但是,目前大数据行业发展却面临各种困境,比如数据共享与数据安全,数据交易与标准制定,数据商业模式与变现、大数据生态建设与国家战略实施等等问题。这些问题的解决,一方面可以参考西方国家,但更多需要借鉴互联网发展积累的经验以及行业探索者的智慧与情怀。

本文通过对几位之前在互联网深耕多年、现在从事大数据创业先锋者的采访,以他们的探索经验和实践思考,展开对大数据发展迷雾的层层解蔽,点亮大数据启航之灯,贡献数据行业先行者的智慧和力量。

1、各位互联网和大数据领域的大佬们,你们如何看待互联网和大数据的关系?

揭宇飞:我打一个比喻,如果把互联网看作是一个管道,大数据就是管道输送的水或石油。

丰强泽:互联网催生信息大爆炸,有价值的信息成了数据,没价值的信息成了垃圾。需要说明的是,除了互联网,线下也有大数据,比如政府数据。

王大亮:互联网是解决信息不对称的问题,当信息足够多了,人们反而迷失在信息之中,这时通过关联性寻找有用信息的价值就产生了,这就是大数据。

柴银辉:我觉得两者有关系,但关系不强。仅就基础数据层来说两者关系不大,现在谁掌握数据?政府、国企和互联网企业,政府和国企的数据量巨大,但都是线下数据,不属于互联网数据。到了应用层面,数据聚合到互联网,才跟互联网产生关系。

小结:

就数据源来说,大数据跟互联网的关系很紧密,两者有交叉也相对独立,TAB企业产生线上数据,政府和国企产生线下数据,两者的数据是基于不同应用场景的数据源。2014年2月,据中云网统计,中国目前可存储数据容量大约在8EB-10EB左右,存储数据的大体分布为:媒体/互联网占据现有容量的1/3,政府部门/电信企业占据1/3,其他的金融、教育、制造、服务业各部分占据剩余1/3数据量。

2、互联网解决的是什么问题,大数据解决什么问题?

丰强泽:互联网解决人类信息流通的问题,问题是信息本身也存在优胜劣汰的周期,有价值的信息成了大数据,大数据是解决互联网信息泛滥时代下寻找有用信息的产物。

柴银辉:互联网解决信息和沟通的问题,大数据解决的是经验分享的问题,因为数据产生后,我们根据这些数据进行分析得出结论来指导未来。现在大家过多关注互联网和大数据交叉重合的领域,却忽视了彼此独立的区域,比如我们有一个合作伙伴,他们是给大型工厂的机器(发动机、电器之类)做数据采集和挖掘工作的,通过分析机器运转与业务发展之间的关系,来发现新的价值空间,这类数据跟互联网就没有任何关系。互联网和大数据交叉的区域已经发展成红海了,独立的区域还无人涉及,空间巨大。至于大数据未来会发展成什么样子,会不会像互联网的今天一样,我觉得很有可能不太一样。但在前期,互联网的模式会给大数据一定的借鉴价值。

小结:

公开数据显示,百度2013年拥有数据量接近EB级别、阿里、腾讯声明自己存储的数据总量都达到了百PB以上。此外,电信、医疗、金融、公共安全、交通、气象等各个方面保存的数据量也都达到数十或者上百PB级别。2014年3月在杭州召开的“2014西湖品学大数据峰会”上,阿里巴巴披露已积攒100PB数据。基于互联网产生的大数据可以部分借鉴互联网发展模式,这部分产业已经被TAB几乎垄断,所以说属于红海市场;而独立大数据(需要采集数据来发展)企业发展需要探索除互联网之外的模式,需要不断挖掘探索,这部分线下数据源占据半壁江山,但市场开发还处于蓝海之域。

3、您认为当前大数据发展的困境是什么?解决这些困境的途径在哪里?

柴银辉:数据开放面临的问题,首先涉及到数据源企业的数据价值跟主业之间的利益权衡;开放以后,如何保障权利?如何获得大数据挖掘以及相应的技术?最后合作利益如何分配等。对于独立大数据企业来说,困境在于如何架构一种全新模式,形成合理的数据共享以及利益分配机制。目前行业内的企业都在尝试,这种尝试可谓叫好不叫坏。

揭宇飞:确实如此。还有一点也很重要,那就是数据应用端的需求不大或者需求模糊也是一个问题,毕竟应用端是源头,源头的大小决定下游数据源市场规模的大小。

丰强泽:大数据的困境,还在于还没有建立一个好的生态圈。现在的数据比较分散,缺乏相应的协作机制将分散的数据聚拢。这就要求政府首先要看懂大数据战略价值并制定相应的政策保障,数据源企业需要建立共享机制并打通数据资源,数据分析和挖掘企业需要协助应用方寻找产品形态和挖掘数据需求,应用方应该深入挖掘用户痛点以准确提供产品和服务。

小结:

从政府政策层面,国务院于今年9月通过《促进大数据产业发展行动纲要》,大数据已经上升为国家战略,由工信部牵头并正在加紧制定大数据“十三五”规划,其中就涉及大数据产业发展标准问题。现在来看政策和监管层面给予积极信号较多。从行业层面,拥有数据的企业都不以数据来赢利,做数据的企业都没有数据,是此时整个大数据产业发展的制约瓶颈,突破的方式在于合作共赢,尤其是在一个新兴产业还没有真正崛起之时,不存在实质性的竞争,只有合作共赢才是唯一出路。

4、大数据交易市场看起来如火如荼,你如何评价交易所的模式和电商的模式?

揭宇飞:数据交易首先面临标准化问题,数据交易标准都是根据数据买方的要求进行处理,我们做数据交易有几种形式:一种是全定制的,我们没有但是可以帮他采集过来;第二种是通过商业合作的方式提供给他们;第三种,是我们有这方面的数据,直接交易给他们。第三种方式最省力,但前提要求我们掌握更多的数据资源。这是数据堂长期实践的结果。

丰强泽:交易所和电商的本质是一样的,互联网电商模式,追求简单化、没有太多条条框框限制,交易所偏传统路子,限制很多,门槛也比较高。

柴银辉:我不看好交易所的模式,很有可能成为明日黄花,你试想大到标准化问题,小到数据交付、验收等,知识产权和获益是否对等,整个交易市场有多大?这些问题都解决了吗?电商模式不妨一试,但公开交易的模式有问题,之前我们尝试过,因数据质量等诸多问题而搁浅,所以现在我们调整成节点式模式,就是你将数据卖给我,我来处理,然后我再卖给别人。

小结:

2015年是大数据交易所遍地开花的时代,首先是贵阳大数据交易所,随后是长江大数据交易所,华中大数据交易所,据悉上海大数据交易所正在建设中,交易所的模式借鉴证券市场,背后依托政府和政策,门槛相对较高;电商模式是互联网文化产物,追求公开便捷和低门槛,更加民间化,像数据堂的数据商城就是典型代表;两者同时并存,孰优孰劣,还是让时间来检验吧!

5、现在我们看到互联网公司纷纷合并,大数据未来是否也是寡头垄断?

丰强泽:大数据公司有可能会走向合并,但目前还不是时候,现在的大数据公司还没有开花结果。

柴银辉:肯定会,但寡头垄断不一定,某一特定领域可能会,但综合起来不会。

小结:

互联网公司合并大都经历一个从创立、成长到成熟的过程,比如大众点评2003年成立,土豆2005年成立,优酷2006年成立,美团网2010年成立,只有滴滴和快的是2012年成立, 可以看出这些互联网公司合并经历的年限多则十多年,少则两三年,平均也有六七年,而大数据元年是2013年,至多经历2年发展时间,所以现在谈合并还尚早,不过就某些领域的合作已经形成行业内的普遍共识,比如数据共享。

6、你能想象大数据的明天会是怎样的图景?

丰强泽:大数据企业以后会有两个方向的分化,一个是垂直细分领域,企业自己整合数据源、做数据挖掘以及开发产品,这种模式会出现一批;主要是取决于数据的特点决定,这类数据跟其他数据的关联性不大,自身具备价值。还有一些企业,掌握了很多行业的数据,成就一个大而全的数据平台。

揭宇飞:我个人觉得大数据行业还处在一个上升期,以后会发生什么谁也无法说清楚,但有两点需要强调,一个是做大数据必须要有数据源,这是立身之本,另一个就是创新,数据拿到了,你以什么样的产品形态对外服务,好的产品能将企业打造成百亿级别的公司,有这样一个好的模型再去复制其他的产品,规模很快便能做大。

王大亮:我认为以后的社会越来越智能化,从我自身的经历便可感知。我起初做NLP(自然语言处理),从事自动文本摘要研发工作,中间经历信息检索的搜索引擎时代和以推荐信息为目的的探索引擎时代,现在正在经历自然交互时代,人类已经部分实现了人工智能,将来社会会更加智能,这是大数据之功。

柴银辉:我从事互联网这么多年来,当新事物一出现,我总带着思辨的眼光去看,有时看到一些负面的东西,不过后来大多出乎我的意料,他们慢慢都做起来了。这就告诉我,当新事物出现时,要多权衡利弊,尤其是多发现正面的东西,我认为大数据还是一个很大的产业,只不过现在还处在一个比较Low的状态,这需要整个行业的人共同携手探索。总结来说就是八个字:开放合作,大胆尝试。

小结:

根据Gartner 发布的Emerging Technologies Hype Cycle 2014 显示,全球范围内,整个大数据产业处在5-10年发展阶段,中国稍稍落后于这个时间段,但差距也就在3-5年水平之间,可以说差距非常小。就我国而言,今天的大数据放在整个产业发展史上来看,仅仅只是一个小小的开始,万事开头难,现在的困境和难关,或许在十年后再回头看,也不过Soso;对于一个新兴产业,我们呼吁多一些宽容,大数据必定会让人类向着更加智能化的生活方向迈进,这一点,需要坚信。

人物简介:

柴银辉:超过18年的互联网及IT行业工作经验,现从事大数据行业高层管理工作。

丰强泽:中科院计算所计算软件理论博士,现从事大数据技术高级研发管理工作。

揭宇飞:15年IT行业经验,现从事大数据行业工程研发管理工作。

王大亮:北京科技大学博士,现从事大数据行业产品研发管理工作。


来源:数据观

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

刷新相关文章

MIT训练出了一只变态、罪恶、极度阴暗的人工智能——诺曼
MIT训练出了一只变态、罪恶、极度阴暗的人工智能——诺曼
#榜样的力量#内蒙古自治区互联网医疗服务系统丨数据猿新冠战“疫”公益策划
#榜样的力量#内蒙古自治区互联网医疗服务系统丨数据猿新冠战“...
#后疫情时代的新思考#构建工业互联网新生态,在疫情“新常态”下砥砺前行丨数据猿公益策划
#后疫情时代的新思考#构建工业互联网新生态,在疫情“新常态”...

我要评论

精品栏目

[2017/12/19]

大数据24小时

More>

[2017/12/18-22]

大数据周周看

More>

[2017/12/18-22]

大数据投融资

More>

[2017/12/18-22]

大咖周语录

More>

[2017/12/13-20]

大数据周聘汇

More>

[2017/12/12-19]

每周一本书

More>

返回顶部