本報訊 (記者袁傳璽)1月27日,專注于推理GPU的曦望(Sunrise)在杭州舉辦首屆Sunrise GPU Summit,發(fā)布新一代推理GPU芯片“啟望S3”,并披露其圍繞推理場景構(gòu)建的算力產(chǎn)品體系及共建推理云生態(tài)計劃。這也是曦望在近一年累計完成約30億元戰(zhàn)略融資后的首次集中公開亮相。

與強調(diào)峰值算力和通用能力的訓推一體GPU路線不同,曦望在啟望S3芯片上繼續(xù)強化其“All-in推理”的定位。
曦望聯(lián)席CEO王勇表示,AI行業(yè)正在進入以應用落地為核心的下半場,推理逐步超越訓練,成為主要算力消耗場景。相比訓練階段的一次性高投入,推理更強調(diào)長期交付能力、單位成本和系統(tǒng)穩(wěn)定性,這也正在改變GPU的競爭邏輯。
據(jù)介紹,啟望S3是一款面向大模型推理深度定制的GPU芯片,圍繞真實推理負載,對芯片架構(gòu)、存儲體系與互聯(lián)方式進行了系統(tǒng)級設(shè)計。相比上一代產(chǎn)品,啟望S3在典型推理場景下的整體性價比提升超過10倍。
在算力與存儲設(shè)計上,啟望S3支持從FP16到FP4的精度自由切換,在保證模型效果的前提下顯著提升低精度推理效率;同時率先在國內(nèi)GPU產(chǎn)品中采用LPDDR6顯存方案,顯存容量較上一代提升4倍,緩解了大模型推理中常見的顯存瓶頸問題。
在DeepSeekV3/R1滿血版等主流大模型推理場景中,啟望S3的單位Token推理成本較上一代降低約90%。王勇表示,這是使“百萬Token一分錢”從概念走向可規(guī)?;渴鸬墓こ棠芰Α?/p>
王勇表示,曦望的推理GPU并非單點硬件創(chuàng)新,而是通過芯片架構(gòu)、軟件體系與算力交付方式的一體化設(shè)計,將硬件能力穩(wěn)定轉(zhuǎn)化為可交付、可計價的推理算力。目前,曦望已構(gòu)建與CUDA兼容的基礎(chǔ)軟件體系,支持推理應用低成本遷移與持續(xù)優(yōu)化,相關(guān)能力已覆蓋ModelScope平臺90%以上主流大模型形態(tài)。
圍繞啟望S3,曦望同步發(fā)布了面向大模型推理的寰望SC3-256超節(jié)點方案,可高效支撐PD分離架構(gòu)與大規(guī)模專家并行(EP)部署,適配千億、萬億級參數(shù)的多模態(tài)MoE推理場景。
同時,曦望還推出覆蓋PCIe、OAM模組、一體機及AI計算集群在內(nèi)的S3產(chǎn)品矩陣,覆蓋從單機推理到大規(guī)模集群部署的多樣化需求。
值得關(guān)注的是,曦望通過生態(tài)共建推理云被視為其推理算力體系中的關(guān)鍵一環(huán)。依托自研推理GPU,曦望實現(xiàn)從底層芯片到上層平臺的全棧優(yōu)化,將硬件能力以平臺化方式穩(wěn)定釋放,從而降低模型適配和系統(tǒng)部署復雜度,形成面向應用落地的完整算力交付路徑。
曦望聯(lián)席CEO王湛表示,新一代的AI算力平臺,應具備軟硬件深度協(xié)同、資源利用高度彈性、技術(shù)門檻低且運行穩(wěn)定可靠等特征?;谶@一判斷,曦望通過云化方式對算力交付模式進行重構(gòu),使推理算力從“設(shè)備能力”轉(zhuǎn)化為可標準化、可規(guī)?;姆漳芰?。
據(jù)介紹,共建推理云以啟望S3為底座,通過GPU池化與彈性調(diào)度,將分散的算力資源整合為統(tǒng)一的推理算力池,并以MaaS(Model as a Service)作為核心入口,向企業(yè)提供開箱即用的大模型推理服務。企業(yè)無需關(guān)注底層硬件配置和集群運維,即可按需調(diào)用模型能力,并根據(jù)業(yè)務負載靈活擴展算力規(guī)模。
曦望董事長徐冰表示,隨著大模型進入規(guī)?;瘧秒A段,AI產(chǎn)業(yè)正從“訓練驅(qū)動”轉(zhuǎn)向“推理驅(qū)動”。相比一次性投入巨大的訓練,推理更強調(diào)長期交付能力、單位成本和系統(tǒng)穩(wěn)定性。
他指出,曦望并不希望只做一家賣芯片的公司,而是希望圍繞推理場景,構(gòu)建“芯片+系統(tǒng)+生態(tài)”的整體布局,讓推理算力真正成為可規(guī)?;?、可持續(xù)的基礎(chǔ)設(shè)施。2025年,曦望芯片交付量已突破萬片。
“誰能持續(xù)降低推理成本,誰就掌握了AI產(chǎn)業(yè)的成本曲線。”徐冰表示,曦望希望通過推理算力體系的系統(tǒng)性創(chuàng)新,助力AI應用實現(xiàn)規(guī)?;涞嘏c可持續(xù)增長。
(編輯 李家琪)
| 12:15 | 百煉智能創(chuàng)始人兼CEO馮是聰:從“... |
| 12:07 | 中國半導體行業(yè)協(xié)會理事長陳南翔:... |
| 12:06 | 迅策精準卡位AI計量新政 破解“測... |
| 12:06 | 零一汽車擬赴港上市 獲頂級資本多... |
| 12:05 | 中央企業(yè)科技成果產(chǎn)業(yè)化聯(lián)合體在京... |
| 12:05 | 石頭科技實控人提議3億元至4億元回... |
| 12:05 | 貴州天然氣管網(wǎng)公司注冊資本增至19... |
| 12:05 | 浙江榮泰企業(yè)管理有限公司成立 |
| 12:05 | 西藏三快信息科技有限公司成立 |
| 12:03 | 塔斯汀注冊資本增至3億元 |
| 12:03 | 復星漢霖(南京)生物技術(shù)有限公司... |
| 12:01 | 小米申請注冊MiMo Claw商標 |
版權(quán)所有《證券日報》社有限責任公司
互聯(lián)網(wǎng)新聞信息服務許可證 10120240020增值電信業(yè)務經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注