技術(shù)
導(dǎo)讀:國內(nèi)首家估值超百億的純推理GPU獨(dú)角獸曦望(Sunrise)宣布,已完成新一輪超10億元人民幣融資。
“我們的目標(biāo)是將推理成本降至‘百萬Token一分錢’,讓AI像水電一樣成為普惠基礎(chǔ)設(shè)施?!?/p>
曦望(Sunrise)董事長徐冰的這句表態(tài),背后是AI算力領(lǐng)域正在發(fā)生的深刻變局——一場圍繞推理算力的權(quán)力重構(gòu),正悄然拉開序幕。
4月20日,國內(nèi)首家估值超百億的純推理GPU獨(dú)角獸宣布,已完成新一輪超10億元人民幣融資。
這是2026年AI產(chǎn)業(yè)全面邁入“推理落地、智能體普及”時(shí)代后,國內(nèi)GPU賽道誕生的最大單筆融資之一。
在GPU賽道“訓(xùn)推一體”成為主流的當(dāng)下,曦望為何選擇All in推理? 這筆錢又將如何攪動(dòng)正在爆發(fā)的AI應(yīng)用市場?
超10億融資落地
資本用腳投票,推理賽道成新風(fēng)口
事實(shí)上,分拆獨(dú)立僅一年多的曦望已實(shí)現(xiàn)資本布局的快速突破:累計(jì)完成七輪融資,總?cè)谫Y額約40億元。
根據(jù)公開信息顯示,曦望投資方陣容堪稱豪華,涵蓋產(chǎn)業(yè)資本、頭部VC/PE及國資背景機(jī)構(gòu)三大陣營——既有三一集團(tuán)旗下華胥基金、范式智能、杭州數(shù)據(jù)集團(tuán)等產(chǎn)業(yè)方的深度綁定,也有無極資本、IDG資本、高榕創(chuàng)投、中金資本等頭部財(cái)務(wù)機(jī)構(gòu)的強(qiáng)力加持,更有誠通混改基金、杭州金投、杭州高新金投等國資力量的鼎力支撐。
資本的密集加碼,本質(zhì)上是對(duì)推理賽道爆發(fā)性增長潛力的精準(zhǔn)預(yù)判。
正如徐冰所言,2026年AI推理計(jì)算需求將達(dá)到訓(xùn)練需求的4-5倍,推理算力租賃價(jià)格半年漲幅近40%。
隨著AI產(chǎn)業(yè)加速從“訓(xùn)練紅利”向“推理紅利”深度轉(zhuǎn)型,大模型規(guī)模化落地、智能體全面普及所帶來的推理算力缺口,正成為國產(chǎn)GPU實(shí)現(xiàn)突圍的核心突破口。
基于此,曦望本輪融資的用途將主要用于新一代S3推理GPU的規(guī)?;慨a(chǎn)交付、全棧軟件生態(tài)建設(shè),以及S4/S5后續(xù)芯片的研發(fā)迭代。
這意味著,曦望將進(jìn)一步鞏固技術(shù)優(yōu)勢、擴(kuò)大產(chǎn)能,加速從“技術(shù)研發(fā)”向“規(guī)?;涞亍钡霓D(zhuǎn)型,搶占推理算力的市場先機(jī)。
差異化破局
All-in推理,拒絕“訓(xùn)推一體”內(nèi)卷
與多數(shù)國產(chǎn)芯片廠商不同,曦望摒棄了傳統(tǒng)訓(xùn)推一體GPU為訓(xùn)練優(yōu)化的設(shè)計(jì)思路,從成立之初就堅(jiān)定“All-in推理”的差異化路線,成為國內(nèi)首家專注于推理GPU的芯片公司。
資料顯示,曦望前身是商湯大芯片部門,2024年底分拆獨(dú)立運(yùn)營,專注于高性能GPU及多模態(tài)場景AI推理芯片的研發(fā)與商業(yè)化。公司憑借八年技術(shù)沉淀、二十億研發(fā)投入及兩代量產(chǎn)芯片的工程化驗(yàn)證,已成為國產(chǎn)GPU替代的核心力量。
截至目前,曦望已推進(jìn)三代推理GPU迭代、數(shù)萬顆GPU量產(chǎn)落地,實(shí)現(xiàn)了從芯片研發(fā)、產(chǎn)品量產(chǎn)到解決方案交付的完整閉環(huán),并保持“芯片均實(shí)現(xiàn)一次性流片成功、流片后性能符合設(shè)計(jì)預(yù)期”的行業(yè)一流標(biāo)準(zhǔn)。
具體來看,曦望的產(chǎn)品布局精準(zhǔn)貼合不同推理場景需求:
第一代S1芯片聚焦視覺推理,適配千余種CV模型,累計(jì)銷量超2萬顆,為商湯科技計(jì)算機(jī)視覺業(yè)務(wù)提供堅(jiān)實(shí)支撐;
第二代S2芯片采用GPGPU架構(gòu),深度兼容CUDA生態(tài),可適配推理DeepSeek、Qwen等開源大模型,以及文生圖、文生視頻、文生3D主流模型,實(shí)測性能接近英偉達(dá)A100的80%,可適配多元大模型推理場景;
于2026年1月正式發(fā)布的第三代啟望S3芯片,是國內(nèi)首款搭載LPDDR6且兼容LPDDR5X內(nèi)存的推理GPU,定位“推理性價(jià)比之王”,堪稱曦望搶占市場的核心利器。
與傳統(tǒng)GPU不同,S3芯片沒有盲目照搬高端訓(xùn)練GPU的HBM顯存路線,而是基于智能體推理的本質(zhì)需求,從AI Core計(jì)算架構(gòu)到內(nèi)存IO系統(tǒng)進(jìn)行全鏈路重構(gòu)。其核心優(yōu)勢的體現(xiàn)在于“極致降本增效”:推理性能較上一代S2提升5倍,目標(biāo)實(shí)現(xiàn)Token成本下降90%,原生支持FP16至FP4全鏈路低精度運(yùn)算,吞吐量較FP16提升3-4倍,真正解決了企業(yè)推理算力“成本高、效率低”的核心痛點(diǎn)。
更關(guān)鍵的是,曦望始終堅(jiān)持原創(chuàng)、全棧自研。從指令集、GPGPU IP到編譯工具鏈,所有關(guān)鍵核心技術(shù)均實(shí)現(xiàn)自主可控。截至目前,公司已累計(jì)持有超過200項(xiàng)核心專利,且此前推出的芯片產(chǎn)品均實(shí)現(xiàn)一次流片成功。正是這份過硬的研發(fā)與工程化能力,構(gòu)成了曦望贏得資本青睞、獲得行業(yè)認(rèn)可的核心底氣。
寫在最后
對(duì)于曦望而言,本次超10億融資只是一個(gè)新的起點(diǎn)。按照其規(guī)劃,2026年將圍繞“落地、兌現(xiàn)、增長”的核心原則,全力推進(jìn)S3芯片的規(guī)?;慨a(chǎn)交付,完成與國內(nèi)外主流大模型、多模態(tài)模型和Agent框架的全面適配,實(shí)現(xiàn)“百萬Token一分錢”的行業(yè)新基準(zhǔn)。
從長期來看,曦望的布局已著眼于未來。公司已完成S4高性能推理GPU和S5安全可控推理GPU的技術(shù)路線規(guī)劃,同時(shí)持續(xù)加碼近存計(jì)算、光電共封等前沿技術(shù)探索,不斷鞏固技術(shù)壁壘。未來,曦望將繼續(xù)堅(jiān)守“讓AI推理便宜、穩(wěn)定、隨處可用”的核心目標(biāo),為中國AI發(fā)展鑄造堅(jiān)實(shí)的算力底座。
10億融資的背后,是資本對(duì)推理賽道的信心,更是國產(chǎn)算力替代的加速信號(hào)。曦望的“All-in推理”之路,不僅為自身贏得了發(fā)展機(jī)遇,更為國產(chǎn)GPU突圍提供了全新思路。隨著S3芯片的量產(chǎn)落地,以及后續(xù)產(chǎn)品的持續(xù)迭代,相信這家推理GPU獨(dú)角獸,將在國產(chǎn)算力替代的浪潮中,書寫更多屬于中國芯片的精彩篇章。