阿里云们死磕芯片自研,不想沦为英特尔、英伟达们的“打工仔”
【数据猿导读】 在当今快速发展的数字经济时代,云计算已成为推动各行各业创新和转型的关键力量。作为云计算的核心组件,芯片的作用不言而喻。它不仅是服务器算力的源泉,更是云服务提供商提供高效、可靠服务的基石。随着对数据处理能力需求的激增,云服务提供商开始寻求突破传统供应链模式,通过自研芯...
在当今快速发展的数字经济时代,云计算已成为推动各行各业创新和转型的关键力量。作为云计算的核心组件,芯片的作用不言而喻。它不仅是服务器算力的源泉,更是云服务提供商提供高效、可靠服务的基石。随着对数据处理能力需求的激增,云服务提供商开始寻求突破传统供应链模式,通过自研芯片来掌握技术发展的主动权。从AWS的Graviton系列到阿里云的倚天710,自研芯片的浪潮正在席卷全球。这不仅是一场技术革新的竞赛,更是云服务提供商在追求成本效益最大化、供应链自主化以及市场竞争力提升的过程中所做出的战略选择。
那么,国内外都有哪些云厂商选择自研芯片,他们做的怎么样呢?
国外有哪些云厂商在自研芯片,做的怎么样?
在全球云计算市场的激烈竞争中,自研芯片已成为云服务提供商提升竞争力的重要战略。国外云厂商如AWS、微软云和谷歌云在这方面的探索和实践尤为引人注目。
AWS——AmazonGraviton和AmazonTrainium
AWS的自研芯片之旅始于2015年,当时它收购了AnnapurnaLabs,这一举措标志着AWS正式进军芯片设计领域。三年后,AWS推出了基于ARM架构的Graviton处理器,这是其首款自研服务器芯片,旨在为云服务提供更高的性能和更低的能耗。随后在2020年,AWS发布了Graviton2,这款芯片在性能上相比前代有了显著提升,为客户提供了更强的计算能力和更高的性价比。
到了2023年12月,AWS宣布推出新一代自研芯片AmazonGraviton4和AmazonTrainium2。Graviton4在性能上相比Graviton2提升了高达30%,而Trainium2则在AI训练速度上提升了多达4倍。尽管AWS未公开这两款新芯片的具体出货量,但可以预见,随着云计算需求的不断增长,这些高性能芯片将在AWS的数据中心中发挥重要作用。
微软Azure——AzureMaia100和AzureCobalt100
自2020年起,微软开始为Azure云服务定制芯片,这一战略转型引起了业界的广泛关注。2023年11月,微软在Ignite大会上宣布推出了两款自研芯片——AzureMaia100和AzureCobalt100。
AzureMaia100是一款专为大语言模型训练和推理而设计的芯片,采用台积电5nm工艺制造,拥有高达1050亿颗晶体管,显示出微软在AI领域的雄心壮志。AzureCobalt100则是一款基于ArmNeoverseCSS设计的128核服务器CPU,旨在提供高性能的云计算服务。尽管微软尚未公布这两款芯片的具体性能基准或出货量数据,但它们的推出无疑将进一步巩固微软云在云计算市场的领导地位。
谷歌云——TPU和Axion
自2016年起,谷歌就开始推出自研的AI张量处理单元(TPU),这些专为机器学习设计的芯片在谷歌云平台上提供了强大的AI加速能力。到了2023年2月,市场传言谷歌正在开发基于Arm架构的服务器CPU,这一消息引发了业界的广泛猜测。
2024年4月,谷歌在其“CloudNext”大会上公开了其首款自研Arm构架CPU——Axion,并宣布该芯片已经在内部投入生产,支持多种服务,并计划未来向公众开放。Axion芯片的推出标志着谷歌云在自研芯片领域迈出了坚实的一步,尽管具体性能数据和出货量尚未公开,但谷歌云的这一战略布局无疑将进一步推动其在云计算市场的创新和发展。
总体来看,国外云厂商在自研芯片领域的发展呈现出积极进取的姿态。通过自主研发,这些云服务提供商不仅能够提供更加定制化的服务,满足特定工作负载的需求,还能够在成本控制、供应链管理和技术领先方面取得优势。随着技术的不断进步和市场需求的日益增长,自研芯片将成为云服务提供商竞争的新高地。
国内有哪些云厂商在自研芯片,做的怎么样?
在中国云计算市场的快速发展中,阿里云、华为云和腾讯云等国内主要云服务提供商纷纷投入自研芯片的开发,以期在未来的技术竞争中占据有利地位。
华为云——鲲鹏和昇腾
在中国,华为是在芯片领域投入最大,也最成功的企业。华为云在自研芯片领域的探索可以追溯到1991年,当时华为成立了集成电路设计中心,开始了在芯片领域的早期研究。2013年,华为推出了麒麟910,这是华为自研的第一款手机处理器。
在云计算领域,华为主要是鲲鹏和昇腾芯片。
华为在2018年的全联接大会上,发布了昇腾310推理处理器与异构计算架构CANN。这标志着华为昇腾在人工智能领域的初步布局,开始从硬件向软件扩展,构建全栈全场景的AI解决方案。
2019年,华为发布了昇腾910训练处理器与全场景AI框架昇思MindSpore,包括面向人工智能计算中心的Atlas900集群。同年,华为鲲鹏计算产业发展峰会在北京举行,公司轮值董事长徐直军对外表示,华为计划在未来的5年之内投资30亿元发展鲲鹏产业生态。鲲鹏芯片的发布,特别是鲲鹏920处理器,采用了台积电7nm技术,基于ARM架构开发,定位于服务器市场。
2020年,MindSpore实现了全量开源,同时,为了解决行业用户人工智能应用开发难的问题,华为陆续推出了昇腾应用使能MindX。这表明华为昇腾在进一步推动AI技术的开放和应用落地。同年,华为鲲鹏920芯片在多个行业领域得到应用,如电力行业,与南方电网合作实现了软硬件资源全栈国产化的成功测试。
2023年,华为全联接大会期间,华为宣称其鲲鹏和昇腾AI开发者已超过350万,合作伙伴超过5600家,解决方案认证超过15500个。
可以看到,在自研芯片方面,华为是走的最稳健的,成效也是最显著的。不仅在自研芯片上持续投入,还在积极构建整个生态体系。如果中国有一家企业能够挑战英特尔、英伟达,那多半就是华为。
阿里云——倚天710
阿里云的自研芯片之路始于2018年,当时阿里巴巴全资收购了中天微,这是一家中国大陆唯一的自主嵌入式CPUIPCore公司。此次收购为阿里云的芯片自研奠定了坚实的基础。随后在2019年,阿里云发布了含光800,这是一款专为服务器设计的AI芯片,标志着阿里云在AI硬件加速领域的深入探索。到了2021年,阿里云在云栖大会上推出了倚天710,这是首款自研的云原生处理器CPU,代表了阿里云在芯片设计领域的重大突破。
2022年云栖大会上,阿里云宣布倚天710已经在数据中心实现大规模部署,其算力性价比提升超过30%,单位算力功耗降低了60%以上,显示出倚天710在能效比方面的显著优势。同时,阿里云还推出了“磐久”自研服务器系列,首款搭载倚天710的磐久高性能计算系列也亮相,这一系列采用灵活模块化设计,能够满足不同计算需求。
2023年,阿里云自研CPU倚天710已在数据中心大规模部署,并以云的形式服务阿里巴巴和多家互联网科技公司。同时,阿里云计划在2024年,20%的新增算力将使用自研CPU芯片倚天710。磐久服务器系列在技术上也持续进化,采用灵活模块化设计,可实现计算存储分离,包括高性能计算系列、大容量存储系列、高性能存储系列。
腾讯云——AI推理芯片“紫霄”、视频转码芯片“沧海”和智能网卡芯片“玄灵”
2021年腾讯数字生态大会上,腾讯披露了三款自研芯片:AI推理芯片“紫霄”、视频转码芯片“沧海”和智能网卡芯片“玄灵”。
到了2023年,腾讯AI推理芯片紫霄已经流片成功并顺利点亮;沧海视频转码芯片压缩率相比业界提升30%以上;智能网卡芯片玄灵性能提升了4倍,这些成果标志着腾讯云在自研芯片领域的实质性进展。
当然,跟华为云和阿里云相比,腾讯云在芯片领域的布局,只能算是“浅尝辄止”。其他几家云厂商,百度云、金山云、京东云以及几家运营商云等,在自研芯片方面的存在感就更低了。
云厂商为什么要做芯片?仅仅是为了降低成本?
那么,为什么这么多云厂商热衷于自研芯片呢?
云厂商自研芯片的核心动机之一是为了降低成本,这在竞争激烈的云计算市场中尤为关键。通过自主研发,云厂商可以直接控制芯片的设计和生产成本,从而减少对外部供应商的依赖和采购成本。这种成本控制能力使得云厂商能够更有效地管理其运营开支,提高整体的利润率。自研芯片还允许云厂商优化供应链管理,减少中间环节,从而降低采购成本和物流成本。此外,自研芯片可以根据云服务的具体需求进行定制,避免不必要的功能和性能过剩,进一步降低生产成本。
长期来看,自研芯片的规模化生产能够分摊研发成本,随着产量的增加,单位芯片的成本将逐渐降低。这种规模经济效应使得云厂商在成本控制上具有更大的优势,尤其是在面对市场波动和原材料价格变化时,能够保持较为稳定的成本结构。
云厂商通过自研芯片能够掌握更多的议价权和定价权,避免成为英特尔、英伟达等传统芯片制造商的“打工仔”。这不仅有助于提升利润空间,还能够在价格竞争中保持灵活性,根据市场情况调整定价策略,以吸引更多的客户和业务。
当然,云厂商涉足自研芯片的动机是多方面的,不仅仅是为了降低成本。虽然成本控制是企业经营的重要方面,但在云计算这样一个技术密集型行业中,自研芯片所带来的战略价值远不止于此。
例如,自研芯片可以实现软硬件一体化,这是云厂商追求的核心优势之一。通过自主研发,云厂商能够根据自家的业务需求和特点定制芯片,从而实现硬件与软件之间的无缝对接和优化。这种优化可以显著提升云服务的性能和效率,为用户提供更加流畅和高效的服务体验。这种策略有点类似苹果公司通过软硬一体化战略,成功打造了一系列高性能的个人电子设备,其产品在市场上享有极高的声誉和用户忠诚度。
而且,自研芯片能够提升云厂商在供应链中的掌控力。在全球半导体供应链中,芯片供应商通常占据着重要的地位,而云厂商作为下游客户,往往受制于供应商的生产能力和价格策略。通过自研芯片,云厂商可以减少对外部供应商的依赖,避免在供应链中受到限制,从而在激烈的市场竞争中构建差异化竞争力。当别人都被缺芯困扰的时候,自己手里有足够的芯片,就能成为非常时期的制胜法宝。这一点,相信阿里云、腾讯云、百度云等中国云厂商深有感触。
再者,自研芯片还有技术创新上保持领先的考量。随着云计算、大数据、人工智能等技术的快速发展,数据中心面临的工作负载越来越多样化。自研芯片使得云厂商能够快速响应市场变化,及时推出符合新需求的产品和服务,这种快速迭代和创新能力是云厂商在技术竞争中保持优势的关键。
自研芯片还有助于云厂商提升数据安全和隐私保护的能力,在当前数据安全日益受到重视的背景下,云厂商通过自研芯片可以在硬件层面实现更加严格的安全控制和隐私保护措施,增强用户对云服务的信任。这在中国市场具有特殊的价值,随着全球范围内对于信息技术自主可控的重视,以及对于国产化、信息化的推动,云厂商自研芯片可以更好地服务于国内市场,满足政府和企业对于国产化解决方案的需求。
目前还没有一家能够称得上成功
正是有上面这些好处,云厂商才对自研芯片趋之若鹜。然而,这却不是一件容易成功的事情。在实践中面临着一系列挑战,这些挑战使得目前还没有云厂商能够完全依赖自研芯片运营其数据中心。
想追求规模优势,但却总掉在“规模劣势”的泥潭里。
在芯片行业,规模效应对于成本控制至关重要。传统芯片制造商如英特尔和英伟达拥有庞大的生产规模和市场份额,这使得它们能够实现大规模生产,从而降低单位成本。这种规模优势不仅体现在直接的生产成本上,还包括采购原材料、设备折旧、研发分摊等方面的成本效益。
规模劣势还意味着云厂商在与供应商的谈判中,可能缺乏足够的议价能力。英特尔和英伟达等大型芯片制造商由于其市场地位,能够与原材料供应商和制造合作伙伴进行更有利的谈判,从而获得更优惠的价格和服务。而云厂商由于采购规模较小,可能无法获得同样的条件,这进一步加剧了成本上的不利。
相比之下,云厂商的自研芯片主要用于自家的数据中心,其出货量相对较小。这意味着云厂商在芯片研发和生产上的投入,很难通过大规模销售来实现成本回收。此外,由于自研芯片的市场推广受限,云厂商难以通过扩大市场份额来进一步降低成本。这种规模劣势限制了云厂商在芯片研发上的投资能力,影响了其在技术创新和产品迭代上的速度和效率。
此外,中立性问题是另一个挑战,云服务市场依赖于中立性,以赢得客户的信任。如果一个云厂商使用自家的芯片,可能会引起其他厂商的疑虑,担心数据安全和锁定问题。这种中立性问题限制了云厂商自研芯片的市场范围,因此它们主要只能自用,而不能广泛推广到其他云服务提供商。
兼容性问题也是云厂商自研芯片必须面对的挑战,云计算环境通常需要支持多种操作系统和应用程序,这就要求芯片必须具备良好的兼容性。如果自研芯片不能与现有的软件生态系统无缝集成,可能会导致客户在迁移和部署应用程序时遇到困难,从而影响云服务的吸引力。
可以说,尽管自研芯片在理论上具有成本优势和战略价值,但在实践中,云厂商需要克服规模劣势、总拥有成本、中立性问题、兼容性问题以及技术挑战等多方面的难题。只有当这些问题得到有效解决时,云厂商自研芯片才有可能实现大规模部署和成功运营。
除了采购英特尔、英伟达和自研外,有没有第三条路?
对于云厂商而言,完全采购英特尔、英伟达的芯片,可能大部分利润都被芯片厂商拿走了,自己沦为打工仔,而且在芯片紧缺(比如最近英伟达的GPU紧缺)的时候,容易出现供应链危机。
然而,自研芯片,又势单力薄,到头来不定是一笔划算的买卖。
那有没有第三条道路呢?有的。那就是几家云厂商联合出资,再引入其他战投,成立一家独立的合资芯片公司,就像当初英特尔、三星、台积电出资ASLM一样。这样,新成立的芯片公司,就能成为英特尔、英伟达的备胎,给他们造成压力。而且,几家联合起来,资源实力更强,还解决了身份的中立性问题,研发的芯片,几家云厂商都可以采购。
云厂商可以通过这种方式,与其他厂商合作,共同投资研发芯片,从而减少单一厂商的财务负担和风险。通过资源共享和风险共担,共同推动芯片技术的发展。这种合资公司的成立,可以带来多方面的好处。
例如,多家云厂商的联合采购能够增加议价能力,降低原材料和生产成本。资源共享可以加速技术的研发进程,缩短产品从设计到市场的时间。此外,合资公司可以利用各方的技术优势,开发出更符合市场需求的芯片产品,提高产品的市场竞争力。
而且,合资公司的成立还有助于解决中立性问题。当多家云厂商共同参与时,可以确保没有任何一方能够控制芯片的设计和生产,从而保证了所有参与方的利益。这种中立性对于吸引更多的云厂商加入合资公司至关重要,因为它确保了所有参与者都能公平地获得芯片供应。
如果发展得当,合资公司可以成为传统芯片供应商的有力竞争者。通过提供性能相当或更优的芯片产品,合资公司能够对英特尔、英伟达等公司形成竞争压力,推动整个行业的技术进步和价格合理化。这种竞争不仅有利于合资公司的发展,也有利于整个云计算行业的健康发展。
当然,合资公司的成立和运营也面临着挑战。如何平衡各方的利益、如何确保技术的中立性和如何实现有效的管理和运营是关键问题。此外,合资公司需要有足够的市场洞察力和前瞻性,以确保研发的芯片能够满足未来市场的需求。
综上,随着云计算技术的不断进步和市场需求的日益增长,云厂商自研芯片的探索正逐步走向深入。尽管面临规模劣势、成本考量、中立性问题和兼容性挑战,云厂商通过自研芯片寻求供应链自主性、成本优化、技术创新和市场竞争力提升的动机依然强烈。
展望未来,云厂商自研芯片的前景充满机遇与挑战。通过持续的技术创新、战略调整和合作模式探索,云厂商有望在芯片领域实现更多的突破,为全球云计算市场带来更多的可能性。随着技术的成熟和市场的响应,云厂商自研芯片的浪潮将如何塑造未来的技术生态,值得我们持续关注。
来源:数据猿