【友财网讯】-AI 算力领域的“ 图灵奖 ”—— MLPerf 测试,发布了一个关于当前主流 ai 芯片的基准性能的测试结果。一家首次参加测试的芯片企业——墨芯人工智能,化身“ 草根英雄 ”,火速制裁了 AI 芯片的霸主英伟达。
墨芯 S30 芯片在主流 AI 模型之一的图像分类( ResNet50 )中,以 95784 FPS 的单卡算力夺得全球第一。是英伟达现役最强 GPU——A100 的 2 倍,是即将上市的英伟达 H100 的 1.2 倍。
市场研究公司 Omdia 调查显示:英伟达占据了全球人工智能( AI )处理器 80.6% 的市场份额。而作为他的旗舰产品 A100、H100 几乎代表了全球同类芯片的最高水平。
如果墨芯 s30 真能超越英伟达最新科技的话,说不定双方的团队已经在洽谈收购的事情了。不过,更逆天的是,墨芯 S30 竟然用 14nm 纳米的制程就暴打了 4nm 工艺的英伟达最强 GPU——h100 系列。
所以要是不出意外的话,凭借这个技术,名不经传的墨芯公司完全可以,名扬大中华,技术封锁美利坚,然后带着欧盟 27 个小弟称霸世界了。好了,说到这里,想必各位差友都知道了
如果不出意外的话,那么意外就来了。很快有人扒出来:墨芯这瓜,它不保熟。虽然,这个叫做 MLPerf 的性能测试,权威且保真。但是,也有很多周旋的空间。
比如,虽然墨芯公司官方的宣传里,着重强调了“ 算力全球第一 ”。但后续有人扒出了,这个“ 全球第一 ”的数据经过了“ 美化 ”的处理。
Closed 代表的固定任务分组,进行的是正式比赛。也就是说,厂商们,需要运行统一的算法,对同一个模型图像分类( ResNet50 )进行计算,实现芯片之间的性能比较。
而这个 open 分组就是用来展示一些创新性的成果的,也就是所谓的表演赛。
在这个组别里,只要不改变测试的内容,你想怎么玩都行。而墨芯参加的恰恰就是 open 分区的测试。于是,墨芯 s30 凭借着“ 稀疏化 ”的算法,用“ 无规则格斗 ”的打法胜了英伟达的“ 空手道 ”。
然后,公司再一运作,删删减减,一个全球算力第一的营销广告就这么华丽的出现。
就是在 ai 模型的训练过程中,把一些不重要的运算过程去掉,大大增加计算的效率。这就像识别一个超清的图像,如果我们降低到标清的水平,传输速度就会快上许多。但是,这种成倍提升算力的“ 黑魔法 ”怎么会没有代价呢?
一来, 这种提升算力的方式应用场景比较小,不适合高精度的模型训练。二来,算力是通用的,ai 的模型并不是,这就需要根据不同的模型,研究不同的稀疏算法。
但问题的重点在于,稀疏算法并不是墨芯一家的专利,英伟达家的 h100 也能支持。而且,英伟达依然是目前唯一一家在每轮 MLPerf 基准测试都参与所有主流算法测试,然后横扫各项测试成绩的全能选手。
回到 ai 芯片的性能本身,我们还是很难否认英伟达在这方面的统治力。不过,抛开这次的“ 吊打英伟达 ”的乌龙事件不谈,最近几年国内还是涌现出一批优秀的国产 ai 芯片。
比如在今年 3 月,壁仞科技诞生了一枚名为 BR100 的芯片。这颗芯片 16 位浮点算力在 1000T 以上,8 位定点算力达到了 2000T 以上,打破了此前一直由国际巨头保持的通用 GPU 全球算力纪录。而 19 年,华为发布的昇腾 910 芯片的算力也号称是当时国际顶尖水平的两倍。