深度干货丨DAAS调研与简要分析
【数据猿导读】 在使用DaaS时,理论上来说所有烦人的“基础细节”都不用再操心了(在组件和基础设施上的大量投入),企业也就可以专心解决业务问题。DaaS提供商承担合规和数据保护的成本,当数据存储到他们的云服务器上后,一切工作将由他们负责

来源:数据猿 作者:张涵诚、陆骥
背景
当前大家都知道:
1、数据交易市场的繁荣为时过早,数据加工和处理太过于分散化;
2、数据金字塔顶部的数据成为重要的资产,然后拥有者并不知道如何释放;
3、互联网数据聚合及释放数据价值的经验值得所有企业参考。
笔者团队经历对于DAAS的几个阶段,艰辛万苦,若有所思,现在把研究成果分享出来,以求大家反馈,研究研究在改进
DAAS是什么
基本定义
Users can access vendor provided databases
用户可直接获取由BD公司提供的数据库
Users can host their own databases on vendor managed systems.
用户可在BD公司提供数据管理平台上处理自己的数据库
Users have the option to access data (their own and/or other parties) on a usage sensitive basis.
用户可以按照自身意愿对多源数据进行应用级别的分析处理
DAAS哪些公司在做
DAAS有哪些产品
Amazon EMR Core DaaS
1、Amazon Elastic MapReduce (Amazon EMR) 是一种 Web 服务,它简化了大数据的处理,提供托管Hadoop框架,可以让用户轻松、快速、经济高效地在多个动态可扩展的 Amazon EC2 实例之间分发和处理大量数据。
2、用户还可以运行其他常用的分发框架(例如 Amazon EMR 中的 Spark 和 Presto)与其他 AWS 数据存储服务(例如 Amazon S3 和 Amazon DynamoDB)中的数据进行互动。
3、Amazon EMR 能够安全可靠地处理大数据使用案例,包括日志分析、Web 索引、数据仓库、机器学习、财务分析、科学模拟和生物信息。
Altiscale Performance DaaS
1、Altiscale通过将Hadoop的全部服务转向云端,并提供Hadoop即服务以减少Hadoop的复杂性;
2、将Hadoop服务推向云端,意味着更广阔的受众,而客户在遭遇不可避免的问题时,完全可以依赖Altiscale的服务。由于Altiscale完全专注于Hadoop,因此解决问题的过程可以从几天缩短到几个小时。
3、有的时候,Altiscale会在处理阶段自己发现问题,有的时候则是客户主动上报问题,因此客户并没有被迫要自己去追踪问题,然后留给Altiscale来解决。
4、该产品被业界认为具有规模生产效应。
Qubole Feature DaaS
1、Qubole致力于解决基础设施冲突的问题,一旦互联网的政策到位,任何数量的数据分析都可以在Hive,spark、Presto等数据处理引擎的协助下实现一键访问,也可连接其他服务的API来导入数据。
2、Qubole简化、加快和缩减了处理存储在AWS、谷歌或者Azure云中的大数据分析的工作量,用户无需了解Hadoop系统管理,大大简化了大数据应用的复杂性,而且成本更低。
3、Qubole是一个企业级别的解决方案,它的灵活性使得它脱颖而出,成为一款相当值得使用的软件平台。
DAAS有哪些案例
DaaS案例 - 云平台
Amazon Elastic MapReduce 支持的功能包括:
1、查看过此内容的人还查看过
2、要点回顾
3、键入搜索内容时自动完成词语
4、搜索拼写建议
5、热门搜索
6、广告
Yelp 每天运行约 200 个 Amazon Elastic MapReduce 作业来处理 3 TB 的数据,并借助AWS来帮助他们进行 Hadoop 应用程序开发,帮助Yelp节省 55 000 USD 用于前期购置硬件的资金,并且从设置到运行只需几天,而不是数月。
Yelp 使用 Amazon S3 来存储每天的日志和照片,每天可生成约 100 GB 的日志。该公司还使用 Amazon EMR 支持近20个单独的批处理脚本,它们当中的大部分都用于处理日志,开发人员可以集中精力应对其他挑战。
1)DaaS案例-自建
Big data cloud service makes ad-hoc analysis easier in Hadoop.
2)DaaS案例-技术输出到数据拥有者
IBM所提供的Twitter服务分析:IBM向企业提供访问数据和分析的渠道,查看Twitter每日5亿条推讯,还有2.8亿月活跃用户。此外,它还提供了一个叫做“firehose”的推讯分析工具与应用,将这些混乱的非结构化数据转变为有意义的信息;它还培训了4000名咨询师,协助企业将计划付诸行动以期获益。
苹果和IBM刚刚宣布,合作开设了一个大数据的健康平台。苹果手表的出现可能会使商用可穿戴设备成为主流,毫无疑问也会带来新一波BDaaS的应用爆发。预测将有数百万使用者进行各种操作,包括监控心率、安排社交日程、遥控家庭娱乐设备,从而造就大量的数据。然后苹果再找出新办法,将这些数据包装起来重新卖给我们。
3)DaaS案例-自产自销
农业机械生产商John Deere,他为所有拖拉机配备了传感器,这些传感器会收集机械、土壤以及庄稼状况的信息,并将这些流数据传到MyJohnDeere.com与Farmsight服务上;从何时该订购备件,到哪里种植庄稼一应俱全,农场主可以付费订阅这些分析情报。
DAAS可能存在的商业模式
在使用DaaS时,理论上来说所有烦人的“基础细节”都不用再操心了(在组件和基础设施上的大量投入),企业也就可以专心解决业务问题。DaaS提供商承担合规和数据保护的成本,当数据存储到他们的云服务器上后,一切工作将由他们负责。租用他们基于云的存储与分析引擎,然后按使用时间或者处理的数据量来付费。向客户提供分析服务(分析报告或者人工服务费)。直接卖加工后的数据。
行业DaaS平台:服务行业巨头
需要释放数据价值获取更多数据:
1、行业数据的提供
2、行业数据分析的结果
3、对数据进行分析
4、数据驱动产业变革
数据门户:服务小企业
需要DaaS新的云化有数据的环境
工具
数据
DAAS展望
通过利用BDAAS对所收集的大量个人数据进行分析,客户能够更加有效地发现和吸引潜在客户。这类服务有数千家中小型企业级使用者,将目标对准了潜在消费者可能存在的相关利基市场。亚马逊的AWS以及谷歌的AdSense和AdWords,Acxiom都可归为这一类,属于其中的佼佼者。随着软件即服务的流行,我们越来越习惯在虚拟环境中通过web界面来工作,将分析整合到这个过程中也就成了自然而然的下一步。我们已经能看到:很多之前认为大数据遥不可及的企业,现在都看到了大数据项目的可行性。
如何做DAAS
数据源:专注在IT能力比较弱,但是数据价值较高的行业客户上;
数据云化:强调数据管理的云化;
数据产品SaaS化:为可以接受SaaS服务的客户提供数据产品
DaaS(数据管理服务)的技术整体架构
(图来源百分点科技)
管理的具体措施
(图来源百分点科技)
数据的积累、挖掘、整理、利用,是现代企业所必需的基本素养,没有它,你的企业将无力面对未来的竞争。数据在云端的管理开始变得更加重要,很多软件企业开始思考数据在云端的交互,这样对于数据流通有天然的氧吧。数据服务(DAAS)虽然今天看起来还很模糊,缺少法律支撑,缺少数据流通技术支持,缺少成功案例,缺少企业涉足,但我们坚信:
1、数据流通必然需要很多专业的公司提供服务;
2、数据的流通必然会节省整个社会的生产成本。
作者简介:
张涵诚,百分点咨询总监,中关村大数据交易产业联盟副秘书长,中国通信协会顾问专家,北大电子商务总裁班特聘讲师、大数据课题组主任。
注:
张涵诚是数据猿特邀专栏专家,点击查看张涵诚更多干货文章。
来源:数据猿
我要评论
活动推荐more >
- 2018 上海国际大数据产业高2018-12-03
- 2018上海国际计算机网络及信2018-12-03
- 中国国际信息通信展览会将于2018-09-26
- 第五届FEA消费金融国际峰会62018-06-21
- 第五届FEA消费金融国际峰会2018-06-21
- “无界区块链技术峰会2018”2018-06-14