近年来,随着国内大模型的蓬勃发展,GPU在AI领域的重要性再次凸显。于是,越来越多的国产GPU厂商逐渐涌现,并在市场中占据了一定的份额。
然而,GPU技术也的确存在着高壁垒和生态建设难等问题,这使得烧钱搞研发成为了国产GPU厂商难以逃避的行径。但这对于一些厂商而言,并非拥有如此充足的资金去支撑GPU芯片的投入。
国产GPU,陷入困境
9月1日,国产GPU企业象帝先通过官方公众号发布公告,针对此前有关“象帝先公司全员解散”等不实传言进行澄清。然而,据有关信息透露,该公司确实正在进行一轮大规模的裁员行动,补偿方案遵循了N+1的标准。
图源:象帝先微信公众号
象帝先成立于2020年9月,专注于高性能通用及专用处理器芯片的设计。公司先后在北京、上海、重庆、成都、苏州等地设立了研发中心。据悉,公司曾推出天钧一号和天钧二号GPU,这些产品主要面向桌面、高性能计算及云服务等应用场景。而且按照公司宣传的目标,天钧一号、天钧二号如果能规模量产,将填补国内高性能通用GPU芯片市场空白。
然而,随着市场竞争的加剧和融资环境的恶化,象帝先在寻求融资的过程中曾面临一定的挑战。2023年时,象帝先公司曾按照120亿的投前估值寻求融资未果,后降至80亿估值仍未寻求到新的资金输血。
此外,几个月之前,也有一则关于“国产GPU砺算科技濒临破产”的消息在业内不胫而走。有传言称,该公司早在去年6月就出现了欠薪问题,并且到现在都没有彻底解决。
不过,相比于象帝先,幸运的是砺算科技在今年迎来了转机。8月20日,东芯半导体股份有限公司发布对外投资公告,公司拟通过自有资金2亿元向国产GPU厂商——砺算科技(上海)有限公司(上海砺算)增资,认购其新增注册资本500万元。
根据公开资料显示,砺算科技是一家致力于研发多层次(可扩展)图形渲染GPU的公司。公司基于自研“盘古”架构,成功研发出国内首款6nmGPU芯片,性能比肩英伟达高端显卡。
近日,千亿“AI芯片第一股”寒武纪发布了2024年半年度报告,公司仍未走出亏损困境。根据报告显示,公司上半年实现的营业收入为6476.53万元,同比下降43.42%;归属于母公司的净利润为-5.3亿元,经调整后净利润为-6.09亿元,亏损仍在持续。
国产GPU,也在逐渐落地开花
相比于英伟达等国际大厂,虽然国产GPU起步较晚、声势较小,但在艰难爬行前进的道路上,国产GPU也在不断开花结果,国内不少厂商成长之快,在某些领域逐渐有所建树。
在7月份的2024 WAIC上,包括壁仞科技、摩尔线程、无问芯穹、天数智芯、燧原科技等国产AI芯片公司集体精彩亮相并纷纷展示了自己的AI产品线,向世界展现了中国强大的“芯”力量。
壁仞科技:从硬件集群算力、软件有效算力、异构聚合算力三个维度入手,通过chiplet架构、单节点8卡全互连、千卡集群建设方案等技术创新,有效解决了算力瓶颈问题。此外,壁仞科技开发了异构聚合算力技术,支持壁仞GPU与英伟达A100 GPU协同训练,效率超过90%。
摩尔线程:宣布其AI旗舰产品夸娥(KUAE)智算集群解决方案升级,在GPU显存和传输带宽方面,夸娥万卡集群具备PB级显存总容量、每秒PB级超高速卡间互联总带宽和节点间互联总带宽,全面提升集群计算性能。
无问芯穹:发布了千卡规模异构芯片混训平台,称这一训练集群算力利用率最高达到了97.6%。无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性。
天数智芯:联合合作伙伴推出大模型推理16卡服务器,搭载16张自主研发的智铠100推理卡,性能和性价比达到国际一流水平。同时,天数智芯与爱特云翔合作建设千卡GPU算力集群,可支持千亿以上参数大模型的全量预训练,支持客户进行微调、参数高效微调等服务,解决了大模型训练高端算力紧缺的瓶颈问题。
燧原科技:展示了智算中心落地案例和里程碑系列产品,还带来了基于燧原算力的AIGC交互体验站,展示其最新商业落地成果及规模化应用。同时燧原科技还展示编程助手、AI视频生成、3D生成等交互技术。
……
值得一提的是,近日中国证监会披露了燧原科技首次公开发行股票并上市辅导备案报告,其IPO辅导机构为中金公司。根据了解,自2018年成立以来,燧原科技已完成十轮融资,累计融资额近70亿元,背后知名投资机构云集,其中腾讯更是连续六轮参投。
目前,燧原科技的核心业务涵盖了芯片、板卡、智算一体机、液冷算力集群以及配套的软件系统,包括基于“邃思”的云端训练加速卡“云燧T10”和第一代推理产品“云燧i10”以及第二代训练产品“云燧T20/T21”和推理产品“云燧i20”,还有配套的“驭算”软件平台等等。
此外,在9月6日-7日的全球AI芯片峰会(GACS 2024)上,壁仞科技也宣布取得多芯混训核心技术突破,打造出异构GPU协同训练方案HGCT,其是业界首次能够支持3种及以上异构GPU训练同一个大模型,即支持用「英伟达+壁仞+其他品牌GPU」混训,通信效率大于98%,端到端训练效率达到90~95%。
写在最后
优胜劣汰,本就是任何行业都会遇到的市场法则,国产GPU行业自然也不例外。近两年来,在市场需求、资本推动等因素的影响下,GPU受到疯狂追捧,于是市场也出现了浑水摸鱼、乱象丛生等状况。但GPU是一个高门槛且重积累的领域,需要一个较长时间的积累和持续的技术创新等,以足够的耐心才能沉稳地打磨出一个个高质的GPU产品。因此在激烈的竞争格局下,市场的优胜劣汰也在加速。但同时我们也相信,随着以大模型为代表的人工智能浪潮愈演愈烈,对算力的要求不断提高,推动着云边端AI芯片的创新迭代。在此背景下,国产AI芯片企业将更加务实地砥砺前行,未来国产GPU也将开启属于自己的星辰大海。
(来源:物联世界)