利用大数据提升业绩和打击欺诈,PayPal是怎样做到的?
【数据猿导读】 经常海淘或出国的朋友对“PayPal”肯定很熟悉,在北美及欧洲,PayPal的地位相当于中国的支付宝。每天要准确无误的处理来自全球的交易数据,PayPal是如何做到的呢?这篇文章将详细为大家介绍
PayPal,就是我们通常说的“PayPal贝宝国际”,针对具有国际收付款需求用户设计的账户类型。它是目前全球使用最为广泛的网上交易工具。它能帮助我们:
进行便捷的外贸收款,提现与交易跟踪;从事安全的国际采购与消费;快捷支付并接收包括美元、加元、欧元、英镑、澳元和日元等25种国际主要流通货币。
PayPal是eBay旗下的一家公司,致力于让个人或企业通过电子邮件,安全、简单、便捷地实现在线付款和收款。PayPal账户是PayPal公司推出的最安全的网络电子账户,使用它可有效降低网络欺诈的发生。PayPal账户所集成的高级管理功能,使您能轻松掌控每一笔交易详情。截止2012年,在跨国交易中超过90%的卖家和超过85%的买家认可并正在使用PayPal电子支付业务。
截止到2015年8月,有165,000,000活跃用户;
10,000,000+用户每天登录
13,000,000交易
处理超过1.1PB的数据
每年处理2500亿美元的付款
每天超过203个市场处理12500,000个单子
持有26种不同货币基金
每个PayPal账户平均23个交易。
PayPal 是在市值中排名前5的支付公司,逐渐成为去那里的网上支付交易处理。对于领先的支付网络-PayPal, 大数据是一种资产,用于严肃的商业战略。大数据分析和数据科学家是17岁的PayPal的所有过程的核心。PayPal 拥有自己逐渐增加的市场份额和成长的强大数据驱动技术,这些技术拉动创新,和整体业务策略。这是一个大数据应用的案例——PayPal 如何用大数据分析和数据科学技术丰富客户体验的每一天。
Palpal 通过拍卖网站和供应商用一种安全和保密的方式进行云计算处理付款从而制造舒适的购物业务。PayPal 真正的消费者是商人,以及每个商人的客户是PayPal间接的消费者。PayPal 提供了先进的预测能力,帮助商户提高他们的客户体验。
让我们假设,沃尔玛有精彩的感恩节销售,他们希望确保他们的钱花的很有效,能为他们的消费者提供更多相关或令人愉快的广告。PayPal的数据科学团队可以帮助他们创造一个列表和一个更好的方式击中目标客户群,因为它有一个很好的成分,这是”交易数据”成功的秘密!交易数据是可靠的驱动因素帮助科学家预测人们的购买行为模式。它也有在线数据,例如,有多少人看了在线数据,她们访问了哪些网站,等等。但是交易数据仍然在PayPal中是客户行为最强的预测指标。
PayPal 如何使用Hadoop?
在Hadoop出现之前,PayPal 只是让所有的数据经过,因为它很难抓住传统的数据库框架类型。现在PayPal处理通过Hadoop和HBase的一切-不论是何数据格式。PayPal 把传统的数据库和Haddoop之间的强连接变成了为客户提供更好的服务。
Hadoop与传统数据平台在PayPal满足不同的业务需求,例如,客户的情感分析,欺诈检测和市场细分。这种传统数据平台与Hadoop共存的方式帮助科学家们为假设检验并对存储在Hadoop的数据研究去探索查询数据,而BI分析师可以找到她们的报告的问题,利用类似SAP HANA的存储系统的答案。PayPal 扩大Hadoop在HBase的使用去利用HDFS。HDFS同样作为HBase的读写-大型非结构化数据集的存储层。
PayPal 使用Hadoop作为一个互补和有效处理指数级增长的数据量和品种的成本效益的数据平台。考虑到Hadoop缺乏先进的安全措施,PayPal机构通过匿名它的数据在存储到Hadoop之前加强管理和实施安全措施。
在PayPal的原始点击流数据在Hadoop通过清洗阶段的处理阶段。 PayPal 使用半结构化数据,预订商业智能和大数据分析项目,并将其存储在云,PayPal在全球范围内的员工都可以访问它。它每天收集超过20百万兆字节日志数据做情感分析,事件分析,客户细分,推荐引擎以及基于提供的信息发送实时信息。
PayPal的数据挖掘系统是建立在机器学习算法上的,这种算法是在Hadoop上用java和Python以及运行在hadoop上有价值的见解去挖掘复杂数据模型。
数据科学——帮助打击在PayPal上的欺诈
一个拥有17年记录的安全在线支付,PayPal 持续改进其数据基础设施来识别潜在的欺诈案件。PayPal 通过结合像hadoop和spark开源的各种技术,采用机器学习算法,在线缓存和人类侦探,建立新的和修改现有的欺诈分析系统。一旦机器学习模型识别出了欺诈的可能性,人类的侦探们就开始工作,去找出究竟是否存在欺诈。
“很多时候商业软件不能够完全满足我们的需求,所以,在这种情况下,开源真的非常放任有效。我们能够接受它们,并且调整我们自己。真正去释放我们数据科学家的力量。王惠说,PayPal的全球风险科学高级总监。PayPal使用3种类型的机器算法——神经网络学习,深度学习和线性回归。风险管理应该是超快的,算法必须以毫秒为单位做出它是否是一个良性交易还是想从事欺诈活动的交易。如果一个人被认为是值得信赖的,他将会得到一个快速的交易,以保证他有满意的体验。然而,如果一个该算法确定了这是一个非良性的交易,它将减慢系统,以获得额外的数据,并进行深度分析。
PayPal的数据科学团队分析历史赔付数据去找出能表明企图诈骗的特征。不同类型的机器学习算法分析了在实际中的1000个数据点分析,如商家的网站和PayPal网站近期的活动,存储在cookie的数据,购买历史等。大约有300个变量被寻找潜在欺诈性交易的每个机器学习模型计算。分析的结果被认证供应商提供的外部数据比较与认证。例如,如果分析显示多个IP地址来自世界各地的不同地点,一个账户-那么它可能是一个账户被黑客攻击的迹象。它会被标记并被专家审查。
欺诈检测是PayPal在大数据使用图形处理中最大的案例。数据科学家在图中配置节点,要与客户使用的设备相关,以登录到商家账户上。如果一个客户使用一个不同的IP地址或不同的移动账户,然后PayPal确保他们不能从账户中取钱。这里不只是图中的一个节点有助于检测欺诈,而是三个或者四个节点试图在同一时间提取或存入资金,并且都被捕获到。
使用先进的大数据分析,提供相关的优惠和个性化广告
PayPal与多通路的平板电脑,智能手机,商店和网站上有联系,通过以位置为基础的广告和优惠以诱惑客户。因为现今的客户使用多种方式购物——移动端,网站和商店——这对于一个营销和广告主来说很难去做决定——什么是放置个性化广告和相关报价的最好的选择。PayPal 可以撬动大数据并发送相关客户服务和商家折扣给客户。使用基于购物媒介的过去的购买历史的分析算法——在线或应用程序建议,以及商户帮助客户节约金钱并且推动更高交易量。PayPal将用大数据来配合客户的喜好和口味,位置,在不同网站的购买历史和用户活动,发送相关优惠报价以及个性化广告。
PayPal使用类似预测客户购买行为的数据,数据访问模型在相似的地方寻找客户。PayPal知道哪些客户在Home Depot最有可能吃subway. 使用这种洞察分析,PayPal在Home Depot附近的subway折扣店提供三明治的折扣。
交易数据是用来创建客户的基因序列,这些序列创建了外观相似,细分客群成为不同的组,以帮助创造强个性化的信号,目标广告和建议。 PayPal的预测数据模型能够精准到69%, 预测到他们的客户最可能在哪里花钱。
通过基于Hadoop文本挖掘丰富的客户体验
自然语言处理算法是在PayPal的成功场景之后的——丰富客户经验。单独的文本数据不能提供商业上的见解,但在使用时,它有助于从谈话以及网上交易中提取信息,基于Hadoop文本挖掘是预测建模的一个重要组成部分,收集,评分影响,在PayPal的多样主题造型的科学数据活动。
当客户在某个特定的商家进行购买时,很难预测客户是喜欢还是爱他或她购买的产品品牌。基于Hadoop的产品信息文本挖掘产品信息,帮助数据科学家了解客户是否喜欢某个特定的品牌,然后使用此信息来建议产品。
原文:Big Data Use Cases: How PayPal leverages Big Data Analytics
来源:36大数据
我要评论
活动推荐more >
- 2018 上海国际大数据产业高2018-12-03
- 2018上海国际计算机网络及信2018-12-03
- 中国国际信息通信展览会将于2018-09-26
- 第五届FEA消费金融国际峰会62018-06-21
- 第五届FEA消费金融国际峰会2018-06-21
- “无界区块链技术峰会2018”2018-06-14