• 张尧浠 打卡获得20积分
  • aa123213打卡获得20积分
  • 张尧浠 打卡获得10积分
  • jxy打卡获得20积分
  • jxy打卡获得10积分
  • 张尧浠 打卡获得15积分
  • lywmx77打卡获得15积分
  • 金论非凡打卡获得20积分
  • 何小冰打卡获得20积分
  • 张尧浠 打卡获得20积分
  • aa123213打卡获得15积分
  • 宝星环球打卡获得10积分
  • 张尧浠 打卡获得15积分
  • 张尧浠 打卡获得10积分
  • 张尧浠 打卡获得15积分
  • 闫瑞祥打卡获得15积分
  • 张尧浠 打卡获得15积分
  • 趋势感悟打卡获得20积分
  • 张尧浠 打卡获得20积分
  • 张尧浠 打卡获得10积分
  • 张尧浠 打卡获得15积分
  • 张尧浠 打卡获得20积分
  • 张尧浠 打卡获得20积分
  • 张尧浠 打卡获得20积分
  • 张尧浠 打卡获得20积分
  • 张尧浠 打卡获得20积分
  • 张尧浠 打卡获得10积分
  • 何小冰打卡获得10积分
  • 张尧浠 打卡获得15积分
  • 邵悦华打卡获得20积分
我要打卡

行业动态 | 马斯克称 Grok 3 为“地球上最聪明 AI”,DeepSeek 同步发表最新研究成果 NSA
机构 | Doo Prime 2025-02-19 17:03:45

行业动态 | 2 月 18 日至 19 日,xAI 举行 Grok 3 发布会,马斯克称赞其为“地球上最聪明的人工智能”,并表示 Grok 3 版本调试成熟后将会开源。同日,梁文锋携 DeepSeek 研究团队发布了最新的研究成果原生稀疏注意力 NSA;Kimi 紧随其后迅速推出了自家的稀疏注意力技术——MoBA。与此同时,特朗普或对进口汽车征 25% 关税;英特尔传获“金主”股价拉升 17%;新西兰央行、澳洲联储如期降息;百度智能云营收大增 26%。

美国总统特朗普表示,将对进口汽车征收 25% 左右的关税,预计将在 4 月 2 日就此话题发表更多声明。除了汽车关税,特朗普还提到要对半导体和药品征关税,特朗普在海湖庄园谈到进口药品时说“那将是 25% 甚至更高,而且会在一年之内大幅提高。”值得注意的是,4 月 2 日也是特朗普****可能开征“对等关税”的时间。   

据称,私募股权投资公司 Silver Lake Management 正在就收购英特尔子公司——可编程逻辑器件(PLD)生产商 Altera 的多数股权进行独家谈判,接近达成协议,具体交易规模还未确定。消息传出后,本已涨超 10% 的英特尔股价涨幅进一步扩大,尾盘刷新日高时,日内涨逾 16.7%,创将近五年来最大盘中涨幅。 

新西兰央行将基准利率下调 50 基点至 3.75%,符合预期,为连续第四次会议降息。另外,澳洲联储宣布降息 25 个基点至 4.1%,符合预期,为 2020 年 11 月以来首次降息。澳洲联储表示,生产率增长尚未加速,如果政策放宽太多,通胀回落可能过早停滞,因此对进一步放松政策的前景保持谨慎。 

百度发布 2024 年第四季度财报,2024 年总营收达 1331 亿元,归属百度核心的净利润达 234 亿元,同比增长 21%;2024 年 12 月,文心大模型日均调用量达 16.5 亿;四季度,智能云营收同比增长 26%。百度创始人李彦宏透露,文心大模型 4.5 将开源,“希望客户和用户能比之前更方便地体验这款模型”。 

2 月 18 日,xAI 举行 Grok 3 发布会,超过 100 万人在线观看。马斯克领衔主持这场发布会,并与 xAI 的首席工程师 Igor Babuschkin、联合创始人 Jimmy Ba、Yuhuai “Tony” Wu 共同亮相,详细介绍了 Grok 3 的核心特点。 

图片来源:YouTube

马斯克称赞其为“地球上最聪明的人工智能”。发布会演示显示,在数学推理、科学逻辑推理等多方面的性能表现上,Grok3 和 Grok-3 mini 都超过或媲美 Gemini、DeepSeek 和 ChatGPT 等对手,此外 xAI 还推出功能更为强大的 Grok3 Thinking 推理模式。 

马斯克表示,Grok3 版本调试成熟后将会开源。 

此外,马斯克团队还透露,xAI 在短短三个月将数据中心容量翻倍,使用了 20 万个英伟达 H100 GPU 打造出最佳 AI。此外,xAI 即将与戴尔科技达成协议,收购价值超过 50 亿美元的配备英伟达 GB200 芯片的 AI 优化服务器,旨在满足 Grok 3 和其他 AI 应用程序日益增长的计算需求。   

与此同时,梁文锋携 DeepSeek 研究团队发布了最新的研究成果——原生稀疏注意力(Native Sparse Attention, NSA)。这项技术有望大幅提升下一代大语言模型处理长文本的能力,同时还能兼顾效率,可谓是 LLM 领域又一里程碑式的进展! 

DeepSeek 提出的 NSA 机制,巧妙地将算法创新与硬件优化相结合,其实验效果令人惊艳,不仅性能不降反升,速度也大幅提升。 

不仅如此,Kimi 也迅速推出了自家的稀疏注意力技术——MoBA(Mixture of Block Attention)。这份由月之暗面、清华大学和浙江大学的研究人员共同发布的技术报告《MOBA: MIXTURE OF BLOCK ATTENTION FOR LONG-CONTEXT LLMS》,其设计理念是将全上下文划分为多个块,每个查询令牌(query token)学习关注最相关的键值(KV)块,从而实现对长序列的高效处理。 

MoBA 在长文本处理任务中可以保持相近性能的同时,将注意力计算的时间和内存消耗显著降低,特别是在处理超长文本(如1000万token)时,MoBA 的优势更加明显,可以实现 16 倍以上的加速。 

【版权申明】友财网部分内容及图文转载于网络,仅供学习、参考、介绍及报道时事新闻所用。友财网不拥有版权,版权归版权持有人所有,如有版权方请联系我们删除!