告別算力“整租”時(shí)代!華為云柔性智算FlexNPU,打造彈性伸縮“算力金箍棒”


中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)   時(shí)間:2026-03-23





  3月20日,華為云中小企業(yè)AI解決方案發(fā)布會(huì)上推出了一項(xiàng)算力黑科技——柔性智算操作系統(tǒng)FlexNPU,將Token消耗“吞金獸”有效控制在企業(yè)預(yù)算范圍內(nèi),打造面向Agentic時(shí)代的極致Token性價(jià)比,為企業(yè)級(jí)智能體的普及突破算力瓶頸。

  華為云中國(guó)區(qū)銷售伙伴發(fā)展部部長(zhǎng)、華為云中國(guó)區(qū)Marketing與解決方案銷售部部長(zhǎng)郭婷在致辭中表示,2026年華為云將構(gòu)建AI時(shí)代更加肥沃的“黑土地”,讓算力服務(wù)更柔性、更適配中小企業(yè)的輕量化需求,實(shí)現(xiàn)從“調(diào)度靠拍板”到“成本算到精”的轉(zhuǎn)變,解決“用不起、用不好”算力的核心難題。

1774093055180464.png

(華為云中國(guó)區(qū)銷售伙伴發(fā)展部部長(zhǎng)、華為云中國(guó)區(qū)Marketing與解決方案銷售部部長(zhǎng)郭婷)

  企業(yè)AI應(yīng)用現(xiàn)狀:一半是海水,一半是火焰

  當(dāng)下,“養(yǎng)龍蝦”成為全民熱點(diǎn)話題,為千行萬業(yè)尤其是中小企業(yè)提供了建設(shè)智能化工作流程的清晰思路。會(huì)上,華為云SMB解決方案與持續(xù)運(yùn)營(yíng)部部長(zhǎng)劉杰用“一半是海水,一半是火焰”生動(dòng)形容了目前企業(yè)智能化轉(zhuǎn)型的現(xiàn)狀:以O(shè)penClaw為代表的先進(jìn)生產(chǎn)力工具層出不窮,但AI實(shí)際應(yīng)用往往面臨著成本高山、技術(shù)壁壘、場(chǎng)景錯(cuò)位等挑戰(zhàn)。

1774093064857047.png

(華為云SMB解決方案與持續(xù)運(yùn)營(yíng)部部長(zhǎng)劉杰)

  對(duì)此,華為云發(fā)布中小企業(yè)AI解決方案,涵蓋AI基礎(chǔ)設(shè)施層、模型服務(wù)層、智能體平臺(tái)層、智能體應(yīng)用層,幫助企業(yè)打造能對(duì)接ERP、能調(diào)用API、能閉環(huán)業(yè)務(wù)流程的“數(shù)字員工”。目前,華為云已深入2600多家企業(yè)、30多個(gè)行業(yè),解決500多個(gè)AI場(chǎng)景化問題,成為企業(yè)AI創(chuàng)新路上的可靠伙伴。

  劉杰介紹,在AI基礎(chǔ)設(shè)施層,華為云提供昇騰多代系產(chǎn)品,以及自研的AI Infra OS,尤其是FlexNPU柔性智算技術(shù),一方面滿足中小企業(yè)小模型訓(xùn)練場(chǎng)景,另一方面通過彈性調(diào)度能夠大幅提升資源利用率;在模型服務(wù)層,華為云支持業(yè)界主流開源模型,讓企業(yè)既能根據(jù)業(yè)務(wù)需求靈活選擇,也能結(jié)合自有數(shù)據(jù)低成本微調(diào)專屬模型;在智能體平臺(tái)層,華為云提供易用高效的Agent開發(fā)環(huán)境,助力開發(fā)者和中小企業(yè)面向行業(yè)結(jié)合場(chǎng)景打造企業(yè)級(jí)智能體;在智能體應(yīng)用層,華為云聯(lián)合伙伴深入場(chǎng)景,覆蓋洞察分析、營(yíng)銷運(yùn)營(yíng)、協(xié)同辦公、開發(fā)運(yùn)維、內(nèi)容制作等高頻需求。

  劉杰還表示,華為云致力于提供AI解決方案,做好基礎(chǔ)設(shè)施和平臺(tái)底座,伙伴則提供AI行業(yè)解決方案、AI行業(yè)場(chǎng)景應(yīng)用、AI專業(yè)服務(wù)交付,實(shí)現(xiàn)深度共創(chuàng)。會(huì)上,華為云發(fā)布“加速智能化 企業(yè)快成長(zhǎng)行動(dòng)2026”,為中小企業(yè)、開發(fā)者提供從品牌、商業(yè)、技術(shù)等全方位的支持,共贏AI市場(chǎng),共同加速企業(yè)智能升級(jí)。

  打造算力“金箍棒”,大幅降低算力成本

  “我們的推理池平均利用率竟然不足30%,我們花費(fèi)重金建設(shè)、動(dòng)輒數(shù)萬、數(shù)十萬卡的AI硬件算力池,竟有超過一半以上的算力在‘摸魚,吃空餉’?!比A為云首席架構(gòu)師、華為公司Fellow顧炯炯在現(xiàn)場(chǎng)拋出了一組驚人數(shù)據(jù)。他指出,Agent時(shí)代企業(yè)普遍面臨算力痛點(diǎn):Agent自主規(guī)劃、多輪迭代、長(zhǎng)上下文導(dǎo)致Token消耗量呈指數(shù)級(jí)增長(zhǎng),如何有效降低Token成本,成為最核心和迫切的挑戰(zhàn)。

  為此,華為云發(fā)布了黑科技——柔性智算FlexNPU,通過構(gòu)筑強(qiáng)大而靈活的AI Infra層算力調(diào)度技術(shù),大幅提升推理池的有效算力利用率,從而以相同AI硬件算力投入,提供更大的Token吞吐輸出。

1774093071627647.png

(華為云首席架構(gòu)師、華為公司Fellow顧炯炯)

  對(duì)于柔性智算FlexNPU,顧炯炯以可大可小、變化隨心的“如意金箍棒”生動(dòng)形容,表示FlexNPU賦予NPU/GPU算力“柔性或液態(tài)化”供給與伸縮的能力,可依據(jù)任意業(yè)務(wù)需求動(dòng)態(tài)變化隨需而動(dòng),如同金箍棒一般“可大可小、變化隨心”,通過最大化AI算力投入的利用率,最終實(shí)現(xiàn)Token性價(jià)比的最優(yōu)化。

  具體而言,柔性智算FlexNPU具備極致共享、極致彈性和極致高可用3大屬性:

  大模型推理方面,F(xiàn)lexNPU通過引入基于柔性算力的PD動(dòng)態(tài)混部、在離線推理混部等創(chuàng)新技術(shù),完美解決了傳統(tǒng)PD分離架構(gòu)下Prefill和Decode集群不均衡的AI Core與顯存利用率,以及推理業(yè)務(wù)潮汐變化規(guī)律所導(dǎo)致的大量AI算力空轉(zhuǎn)浪費(fèi)難題,將帶來至少40%的Token性價(jià)比提升空間。

  小模型推理方面,F(xiàn)lexNPU通過實(shí)現(xiàn)最小粒度達(dá)1% NPU卡及128MB顯存的顆粒度的AI Core時(shí)分復(fù)用,以及顯存空分復(fù)用,為小模型提供真正完美匹配其算力訴求、量體裁衣的虛擬NPU資源,將小模型的平均算力成本降低2-3倍以上。

  推理高可用保障方面,F(xiàn)lexNPU通過軟硬解耦及Token級(jí)KV Cache的實(shí)時(shí)快照,使得上層推理框架不再需要感知底層的硬件故障,即可實(shí)現(xiàn)故障秒級(jí)快速恢復(fù)及斷點(diǎn)續(xù)推,大大減少了Agent推理會(huì)話重計(jì)算開銷,提升了用戶的推理體驗(yàn)。

  顧炯炯最后總結(jié)到,F(xiàn)lexNPU的核心價(jià)值體現(xiàn)在:無需再為大模型推理的閑置算力,以及小模型推理的獨(dú)占算力浪費(fèi)買單,更不再需要為昂貴的故障重算買單,真正實(shí)現(xiàn)了AI算力分配供給從“資源模式”到“效率模式”的范式轉(zhuǎn)變,“讓每分AI算力投入迸發(fā)最大價(jià)值,讓智能體的海量Token人人消費(fèi)得起。”

  深入千行萬業(yè),做好伙伴AI創(chuàng)新的“黑土地”

  華為云領(lǐng)先的智能化基礎(chǔ)設(shè)施,正在成為千行萬業(yè)伙伴進(jìn)行技術(shù)創(chuàng)新、產(chǎn)品研發(fā)和商業(yè)拓展的重要支撐。發(fā)布會(huì)現(xiàn)場(chǎng),華為云伙伴代表分享了多個(gè)真實(shí)案例。

  天寬科技有限公司CTO龔徐建介紹,天寬科技基于昇騰算力平臺(tái)打造制造業(yè)Agent解決方案,可實(shí)現(xiàn)智能知識(shí)問答、合同智能審核、風(fēng)險(xiǎn)識(shí)別等功能,合同審核準(zhǔn)確率達(dá)90%,審核效率提升3倍,生產(chǎn)數(shù)據(jù)查詢時(shí)間從1小時(shí)縮短到2分鐘,將企業(yè)人力從繁瑣重復(fù)的工作中解放,雙方后續(xù)將在市場(chǎng)洞察、能力共建、成單路徑等方面進(jìn)行拓展合作。

1774093078175898.png

(天寬科技有限公司CTO龔徐建)

  天津宏達(dá)瑞信科技有限公司CEO丁照祥則從零售物流行業(yè)角度,探討AI落地帶來的巨大價(jià)值,表示宏達(dá)瑞信基于華為云天籌求解能力,打造AI智能路徑規(guī)劃方案,助力商家獲得商品從倉庫到經(jīng)銷商的運(yùn)輸最優(yōu)解,并且可以根據(jù)復(fù)雜的交通條件靈活配置,排線效率提升60倍以上,減少冗余出車次數(shù)20%,物流成本降低5.8%。

1774093084576646.png

(天津宏達(dá)瑞信科技有限公司CEO丁照祥)

  人工智能底層技術(shù)發(fā)展,牽引Al Infra算力基礎(chǔ)設(shè)施、開閉源大小模型、Agent使能框架與工具等快速演進(jìn),激發(fā)更多AI創(chuàng)新。面向未來,華為云將秉持“用AI解行業(yè)難題”的理念,在應(yīng)用層、模型層、算力層耕耘AI算力黑土地,攜手伙伴共進(jìn)共贏,抓住AI時(shí)代的機(jī)遇。


  轉(zhuǎn)自:中國(guó)經(jīng)濟(jì)新聞網(wǎng)

  【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場(chǎng)。版權(quán)事宜請(qǐng)聯(lián)系:010-65363056。

延伸閱讀

?

版權(quán)所有:中國(guó)產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)京ICP備11041399號(hào)-2京公網(wǎng)安備11010502035964