文心一言自4月1日全面免费开放 深度搜索功能上线;字节豆包大模型团队提出稀疏模型架构UltraMem丨每日大事件
laurus Bella | 2025-02-13 20:34
【数据猿导读】 文心一言自4月1日全面免费开放 深度搜索功能上线;字节豆包大模型团队提出稀疏模型架构UltraMem丨每日大事件

-
文心一言自4月1日全面免费开放 深度搜索功能上线
2月13日消息,据百度官方公众号,文心一言宣布自4月1日起全面免费开放,PC端和APP端用户均可体验其最新模型。同时,文心一言上线了深度搜索功能,并将于4月1日起免费开放使用。该功能具备强大的思考规划和使用外部工具能力,可为用户提供专家级内容回复,并支持多场景任务,实现多模态输入与输出。目前,用户可以在官网体验该功能,APP端也将同步上线。(格隆汇)
-
OpenAI计划在未来几周内发布GPT-4.5模型
2月13日消息,OpenAI首席执行官奥尔特曼宣布,OpenAI将在未来几个月内推出名为GPT-5的模型,该模型将整合OpenAI的大量技术,包括o3,并应用于聊天机器人ChatGPT以及API平台。因此,OpenAI不再计划将o3作为独立模型发布。根据奥尔特曼的帖文,在GPT-5推出之前,OpenAI计划在未来几周内先发布GPT-4.5模型,代号为 “Orion”。奥尔特曼称,这将是OpenAI最后一个“非思维链模型”。与o3及OpenAI其他推理模型不同,非思维链模型在数学和物理等领域往往不太可靠。(金融界)
-
阿里国际站:全流程AI外贸产品已接入DeepSeek-R1
2月12日消息,从阿里国际站了解到,其全流程AI外贸产品已接入大模型DeepSeek-R1,将全面应用于外贸生意的各个核心环节,大大提升推理能力,更好帮商家拓展生意增量。据悉,此前阿里国际站已上线全流程AI外贸产品生意助手,通过4个AI Agent帮外贸商家实现商品的托管运营、客户的自动接待,并帮助商家在全球各个市场智能营销,实时检测合规风险。同时,阿里国际站还在测试通义千问Qwen 2.5-Max模型,集合最先进的AI能力,为商家提供更好服务。(钛媒体)
-
顺丰同城宣布接入DeepSeek大模型
2月12日消息,顺丰同城宣布已接入DeepSeek大模型,成为物流行业首批接入DeepSeek的企业。顺丰同城称,将依托DeepSeek低成本、高性能、高开放度的三重优势,为其全场景业务和全生态链参与者提升智慧化赋能。(界面新闻)
-
字节豆包大模型团队提出稀疏模型架构UltraMem
2月12日消息,据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。据介绍,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。(界面新闻)
-
创新奇智工业大模型技术升级,完成DeepSeek-R1蒸馏AInno-75B技术适配
2月12日,创新奇智宣布旗下AInnoGC工业大模型迎来技术升级,已经完成DeepSeek-R1蒸馏AInno-75B技术适配。通过蒸馏DeepSeek-R1 ,显著提升了AInno-75B的推理能力,同时还保持了AInno-75B模型对工业知识深入理解和低成本私有化部署的优势。创新奇智始终致力于为客户提供高效、灵活且经济实惠的AI解决方案。此次技术升级使得AInno-75B能够在更广泛的工业环境中实现部署应用,满足不同规模企业的需求。(36氪)
-
粉笔深度整合DeepSeek, 实现公考培训赛道商业化新突破
近日,职业教育企业粉笔宣布,公司已于2024年底全面拥抱DeepSeek大模型,推动粉笔自研垂域大模型性能释放,通过智能技术矩阵重构公职培训产业生态,实现用户体验智能化升级与运营效能指数级提升,为教育科技行业开辟价值增长新范式。据了解,目前技术升级已覆盖公务员考试核心场景,在用户练习点评、面试点评等关键环节构建起技术护城河。(36氪)
企业动态
36氪获悉,中国银河证券表示,AI大模型+优质IP,前景广阔。AI玩具将大模型融入传统玩具属性中,实现AI技术与教育、陪伴、益智等玩具应用场景和属性的结合,未来商业化空间广阔。(36氪)
掌阅科技:积极推进人工智能大模型在数字阅读垂直领域应用
2月12日消息,掌阅科技在投资者互动平台表示,公司积极推进人工智能大模型在数字阅读垂直领域的应用,充分利用在内容版权资源、创作者生态、海量用户等领域的优势,将国内领先人工智能大模型和公司内外部业务场景进行深度融合。大模型的开源和不断进化,使得公司内外部AI的投入产出比不断提升,公司会利用效率最高且最匹配公司内外部各种场景的大模型(包括但不限于DeepSeek、豆包以及其他大模型)来进行业务赋能。(证券时报)
何小鹏:5月推出MONA M03 MAX,搭载行业最顶尖自动驾驶技术
2月12日消息,纳米AI搜索“百车行动”在北京举办,小鹏汽车董事长何小鹏表示,要做一款2万美元的顶级智驾产品。何小鹏表示,小鹏汽车今年5月会推出MONA的顶配版MONA M03 MAX,“搭载行业最顶尖的自动驾驶技术”,MONA的名字来自“made of new AI”。他认为,下一个10年,高阶智能驾驶的渗透率会从2%提升至50%,甚至80%—90%。对于小鹏汽车是否接入DeepSeek大模型,何小鹏表示“可以期待”、汽车时代或从“智能汽车”过渡到“AI汽车”。(财联社)
百度自动驾驶或出海至阿联酋
2月12日消息,从知情人士处获悉,百度自动驾驶或将出海至阿联酋。迪拜王储Hamdan bin Mohammed在2月12日表示,近日与百度创始人李彦宏在迪拜会面。此前,李彦宏与联酋AI部长奥马尔·苏丹·奥拉马(Omar Sultan AI Olama)进行对谈,奥马尔表示,“期待在明年的大会上,所有车队都是由萝卜快跑支持的自动驾驶。”(新浪财经)
投融资
鸿擎科技获3亿人民币A+轮融资
2月12日消息,鸿擎科技完成A+轮融资,融资金额达3亿人民币。本轮融资由昆仑资本、京国瑞投资、广州无线电集团和白云基金等多家投资机构共同参与。鸿擎科技是一家专注于低轨宽带互联网通信卫星业务的高科技公司,致力于为国内外主要星座运营商提供大批量卫星制造和卫星组网整体解决方案。本轮融资将助力其进一步拓展市场和提升技术能力。(网易)
鲁欧智造获数千万人民币A+轮融资
2月12日消息,鲁欧智造(山东)数字科技有限公司近日成功完成A+轮融资,融资金额为数千万人民币。本轮融资由中关村发展集团启航投资领投,源禾资本跟投。融资资金将主要用于热数字孪生技术体系的研发与商业化落地,进一步巩固鲁欧智造在电子热管理领域的领先地位。(每日经济新闻)
Xmind宣布收购Briefy,加速布局人工智能矩阵
近日,全球知识管理企业Xmind宣布完成对AI总结工具Briefy的战略收购,后者凭借对大语言模型驱动的多模态解析运用,可将长视频、万字文档转化为结构化大纲或思维导图,并通过知识库帮助用户消化和管理知识。此次收购将强化Xmind在生成式AI领域的技术纵深,通过智能拆解复杂信息的底层能力,推动知识管理服务向轻量化、普惠化方向迭代。(创业邦)
玻尔智造完成数千万元人民币A轮融资
近日,AI工业视觉企业玻尔智造完成数千万元人民币A轮融资。本轮由台商基金中华开发金控领投,新股东民银国际跟投、老股东浩澜资本继续加码跟投。截止本轮完成,玻尔智造已累计完成人民币亿元级别融资。本轮融资主要用于半导体检测新方向初试与既有成熟消费电子行业检测大面积量产,进一步加固商业与技术壁垒。(创业邦)
潞晨科技完成新一轮融资 加速AI大模型应用落地
潞晨科技近日宣布完成新一轮融资,投资方为亦庄国投。作为一家专注于解放AI生产力的科技公司,潞晨科技致力于打造世界级的分布式AI开发和部署平台。其核心产品Colossal-AI通过高效多维并行、异构内存管理、大规模优化库以及自适应任务调度等自研技术,为企业提供面向大模型时代的通用深度学习系统。这一系统能够显著降低AI大模型应用的复杂性和成本,助力企业高效实现智能化产业升级。此次融资将进一步推动潞晨科技在AI领域的技术创新与市场拓展,加速其在全球AI生态中的布局。(DoNews )
其他
据北京发布消息,中关村人工智能科技园主园区昨日正式开工建设。该科技园位于门头沟,计划于今年下半年开园,全面建成后预计年产值将达百亿元。京西正从传统“千年煤城”转型为“京西智谷”,力争成为全球人工智能产业的新高地。(北京发布)
OpenAI CEO:计划与DeepSeek领导层会面
当地时间2月11日播出的一档节目中,OpenAI CEO山姆·奥特曼表示,“为了不让OpenAI被超越,每天都有压力。计划与DeepSeek的领导层会面。”(澎湃)
百度沈抖:大模型的混战还没有完全结束
2月12日,百度智能云事业群组(ACG)召开全员会。会上,百度集团执行副总裁、百度智能云事业群总裁沈抖提到了ACG在2024年的业绩表现,也提到了当下DeepSeek爆火,对ACG乃至整个模型赛道的影响。在应用层,ACG旗下着重对代码助手、智能客服、数字人三个领域做了布局。沈抖先是肯定了整体的回款率,也提及了应用层的毛利有所改善,但他也坦言,虽然DeepSeek横空出世,但大模型的混战还没有完全结束,战况依然非常焦灼。他判断,接下来多模态的需求会进一步提升,行业的重心将从训练转移到推理,多模态会成为主流的需求。(36氪)
杭钢股份:算力业务预计2024年度占公司营业收入总额的0.06%
杭钢股份发布异动公告,公司主营业务为钢铁及其压延产品的生产和销售,且短期内公司主营业务不会发生变化。公司算力业务的经营模式主要为硬件设备及相关软件的采购,集成后向客户提供租赁服务,不涉及算力核心技术的研发等,预计2024年度占公司营业收入总额的0.06%,占比极小。相关媒体报道中涉及的DeepSeek部署适配是指,在上述业务模式下,公司在合作伙伴的系统中安装了DeepSeek软件。公司与DeepSeek系统的开发、应用等核心技术无关,且与杭州深度求索人工智能基础技术研究有限公司无任何业务往来。(格隆汇)
来源:数智猿
刷新相关文章
我要评论
不容错过的资讯
大家都在搜
