Skip to content
-
Subscribe to our newsletter & never miss our best posts. Subscribe Now!
  • https://www.facebook.com/
  • https://twitter.com/
  • https://t.me/
  • https://www.instagram.com/
  • https://youtube.com/
綠野旅情
綠野旅情
  • 首頁
  • 生活
  • 一般
  • 國際
  • 即時
  • 健康
  • 社會
  • 工商
  • 財經
  • 首頁
  • 生活
  • 一般
  • 國際
  • 即時
  • 健康
  • 社會
  • 工商
  • 財經
Subscribe
Close

搜尋

工商科技財經

基於 NVIDIA BlueField-4 STX,WEKA 以更低的每 Token 成本將 Token 輸出推至極限

By terry
2026 年 3 月 18 日 2 Min Read
Comments Off on 基於 NVIDIA BlueField-4 STX,WEKA 以更低的每 Token 成本將 Token 輸出推至極限

NeuralMesh 及 Augmented Memory Grid 與 NVIDIA STX 整合,能在相同 GPU 佔用空間下,將 Token 產量提升 6.5 倍,大減 AI 驅動機構的推理成本

加州聖荷西和加州坎貝爾2026年3月18日 /美通社/ — 在 2026 年圖形處理器 (GPU) 技術大會 (GTC 2026) 上,人工智慧 (AI) 儲存與記憶體系統公司 WEKA 今日宣佈,已將其 NeuralMesh™ 軟體與 NVIDIA STX 參考架構整合。 WEKA 基於 NeuralMesh 執行的突破性 Augmented Memory Grid™ 記憶體擴充套件技術,將支援 NVIDIA STX,為代理型 AI 工廠帶來高吞吐量的情境記憶儲存,使跨會話、工具和任務的長語境推理變得無縫流暢。 基於 NVIDIA STX 的 NeuralMesh 解決方案,運用 NVIDIA Vera Rubin NVL72、NVIDIA BlueField-4 及 NVIDIA Spectrum-X 乙太網絡,預計能將情境記憶體的每秒 Token 生成量提升 4 至 10 倍,同時為 AI 工作負載提供每秒不少於 320 GB 讀取和 150 GB 寫入的吞吐量,較傳統 AI 儲存平臺的吞吐量高出逾一倍。

WEKA 與 NVIDIA 合作實現具成本效益的大規模人工智慧 (AI) 推論。
WEKA 與 NVIDIA 合作實現具成本效益的大規模人工智慧 (AI) 推論。

利用共享鍵值 (KV) 快取基礎設施解決推理成本問題
擴充套件代理型系統,尤其在軟體工程應用領域,揭示一個殘酷真相:現今 AI 的經濟效益取決於記憶體基礎設施層。 每個大規模推理叢集都會撞上記憶體牆:GPU 上有限的高頻寬記憶體 (HBM) 很快便耗盡,導致 KV 快取被逐出、情境丟失,系統被迫重複已經完成的工作。 這種架構效率低下,令推理成本急升。 解決之道在於建立共享的 KV 快取基礎設施,讓情境在代理、使用者與會話之間保持活躍。 這樣能消除重複計算、維持 Token 吞吐量,並保持效能穩定可測。 缺乏共享 KV 快取基礎設施的話,每增加一批並發使用者及代理,都會成為負累——成本上漲、體驗變差,推理叢集規模越大,營運就越難。 NVIDIA 推出專為語境記憶而設的 STX,提供一套藍圖,旨在破解核心推理瓶頸。

上下文記憶體儲存:代理型 AI 工廠的基礎
透過基於 NVIDIA STX 架構聯合設計的 WEKA 解決方案,AI 雲端、企業及 AI 模型構建者,均可部署所需基建,讓 GPU 以頂尖效能執行,維持海量 Token 生成,同時提升大規模推理的能源效益及成本效益。

領先在前的 AI 創新者及雲端供應商,例如 Firmus,已開始應用 NeuralMesh 上的 Augmented Memory Grid,重塑其推理經濟模式。

Firmus 技術總監 Daniel Kearney 表示:「現實世界的 AI 並非在實驗室執行,而是要面對電力限制、散熱限制,以及源源不絕的工作負載需求。 Firmus 正是為此而生。 與 NVIDIA AI 基礎設施雙劍合璧之下,WEKA Augmented Memory Grid 可於大規模執行時,實現每秒 Token 數提升 6.5 倍,首個 Token 生成時間 (TTFT) 加快 4 倍,證明在相同 GPU 配置下,效能可提升至更高層次。 隨著 NeuralMesh 和 Augmented Memory Grid 整合到我們與 NVIDIA 一致的 AI Factory 和 NVIDIA STX 參考架構中,就能提供最快的情境記憶體網路,實現可預測且高效的大規模推理。」

NeuralMesh 與 NVIDIA STX:專為代理型 AI 而設
NeuralMesh 是 WEKA 建基於超過 170 項專利的智慧自適應儲存系統。 這將貫穿全棧 STX 參考架構,為企業提供所需的新一代儲存方案,旨在將高效能 AI 資料服務標準化,從而加快實現代理型 AI 的價值。 WEKA 的 Augmented Memory Grid 是專為擴充套件記憶體而設的技術層,能於 GPU 記憶體以外,將 KV 快取整合成池並持久儲存。即使推理工作負載不斷增加,長情境會話依然穩定,並發量亦能維持高水平。 Augmented Memory Grid 於 GTC 2025 首次亮相,今日起正式向 NeuralMesh 客戶全面供應。該技術已在 Supermicro 平臺上,搭配 NVIDIA Grace 中央處理器 (CPU) 及 BlueField-3 資料處理單元 (DPU) 完成驗證,能帶來多項提升 AI 成本效益的優勢,包括:

  • 用戶體驗,大幅躍升:NeuralMesh 上的 Augmented Memory Grid 能將首個 Token 生成時間大幅縮短 4 至 20 倍,確保 AI 代理及應用程式在真實負載下依然反應迅速。
  • 相同硬體,收益更高:毋須增建基礎設施,每個 GPU 就能多處理 6.5 倍的 Token。
  • 規模擴張,效能恆久:隨著會話、代理及情境視窗增加,Augmented Memory Grid 依然能維持高 KV 快取命中率,避免純 DRAM 架構出現效能急跌的瓶頸。
  • GPU 原生效率:整合 BlueField-4 能將儲存資料路徑從 CPU 解除安裝,讓 GPU 全速運算,並消除輸入/輸出 (I/O) 瓶頸從此絕跡。

WEKA 聯合創始人兼行政總裁 Liran Zvibel 表示:「隨著編碼大型語言模型 (LLM) 不斷進步,軟體工程領域對代理型 AI 應用的採納程度可謂前所未見,生產力因此提升了 100 到 1000 倍。 當編碼助手反覆呼叫近乎相同的程式碼庫及提示時,WEKA 的 Augmented Memory Grid 會重複使用已快取的語境,即使語境視窗長度已發展至難以置信,亦不用強制進行冗餘的預填充。 此舉大幅縮短回應時間,亦讓同一基礎設施上支援的並發使用者數目顯著增加。 WEKA 在一年多前便率先洞悉市場對情境記憶儲存的需求,並於 GTC 2025 推出 Augmented Memory Grid。 如今,NVIDIA STX 的出現,為企業開啟大門,讓其能在最先進的 NVIDIA Vera Rubin 架構(包括 NVIDIA BlueField-4 及 NVIDIA Spectrum-X 乙太網絡)上,執行儲存及記憶體擴充套件基礎設施。 為 NVIDIA STX 在 NeuralMesh 上執行 Augmented Memory Grid,將帶來無與倫比的效能及效率,直接實現顛覆市場的 AI 成本效益。」

供應情況

WEKA 的 Augmented Memory Grid 現已隨 NeuralMesh 一併正式推出市場。

今天對記憶體高牆視而不見的企業,日後將會面對更艱難、更昂貴的擴充套件挑戰。 隨著代理型工作負載增加,情境視窗不斷擴大,純 DRAM 架構將面對成本持續疊加的問題:每新增一個並發使用者或會話,重算開銷、GPU 閒置時間及營運成本便隨之上升。 現在就為持久 KV 快取規劃架構的企業,將比那些等待觀望的對手取得結構性成本及效能優勢。

如欲進一步瞭解 NeuralMesh,請瀏覽:weka.io/NeuralMesh。
如欲進一步瞭解 Augmented Memory Grid,請瀏覽:weka.io/augmented-memory-grid。

企業可瀏覽 weka.io/nvidia 獲取更多資訊,或親臨 GTC 2026 大會 WEKA 的 #1034 展位參觀。

關於 WEKA
WEKA 正憑藉其自適應智慧網格儲存系統 NeuralMesh™ by WEKA®,徹底革新機構建立、執行和擴充套件 AI 工作流程的模式。 有別於傳統資料基礎設施會隨著工作負載擴充套件而變得緩慢不穩,NeuralMesh 在擴容時反而會變得更快速、更穩健、更高效。它能動態適應 AI 環境,為企業 AI 及代理型 AI 的創新,提供靈活穩固的基石。 NeuralMesh 備受財富 50 強中 30% 企業的信賴,致力協助頂尖企業、AI 雲端供應商及 AI 建構者,充分發揮 GPU 效能、加快 AI 擴充套件步伐,並降低創新成本。 在 www.weka.io 瞭解更多,或在 LinkedIn 及 X 與我們聯絡。

WEKA 及 W 標誌為 WekaIO, Inc. 的註冊商標。本文中出現的其他商業名稱,可能為其各自擁有者的商標。

WEKA: The Foundation for Enterprise AI
WEKA: The Foundation for Enterprise AI

 

【免責聲明】本文內容由系統自動彙整自公開新聞來源,僅供財經資訊參考,不構成任何投資、理財或財務建議,亦不代表本平台之立場。投資一定有風險,過去績效不代表未來表現,任何投資決策應由讀者自行評估並承擔風險,本平台不對依本文所為之任何投資行為負責。

原始來源:智聞捷發新聞發佈平台

網址:https://www.111.net.tw

歡迎前往新聞發佈平台發佈新聞

Tags:

AI效率GPUNVIDIAWEKA出口管制
作者

terry

Follow Me
Other Articles
Previous

快鷺科技成為香港生產力促進局 (HKPC) DDIY 技術夥伴

Next

Ingenico與Visa攜手合作,加速推動各行業統一商務解決方案的發展

搜尋

最新文章

  • 三十載光輝印記:美納里尼國際公平競技獎於佛羅倫斯五月音樂節劇院璀璨亮相 2026 年 7 月 4 日
  • 海信為歐洲家庭帶來更智能便捷的制冷體驗 拉動市場高速增長 2026 年 7 月 3 日
  • Intersolar 2026 高光集錦 | 安泰新能源發佈農光跟蹤系統解決方案,攜全場景光伏支架共築歐洲綠能未來 2026 年 7 月 3 日
  • 美納里尼國際公平競技獎:第30屆正式啟動 2026 年 7 月 2 日
  • DJI 發表全新雙主鏡頭口袋電影機Osmo Pocket 4P:靈眸成雙,遠見非凡 2026 年 7 月 1 日
  • 「健身創始之父」—-Les Mills Snr 1934 – 2026 2026 年 7 月 1 日
  • 卡西歐將推出EDIFICE自動機械腕表 光影變幻呈現多元質感 2026 年 7 月 1 日
  • 從「帶孩子度假」到「全家人的假期」 三亞艾迪遜酒店重新詮釋家庭旅行體驗 2026 年 7 月 1 日

分類

  • Homepage Ads
  • 一般
  • 人事資訊
  • 健康
  • 兩岸
  • 即時
  • 國際
  • 娛樂
  • 媒體發佈
  • 工商
  • 政治
  • 教育
  • 數位公關
  • 新聞稿發佈
  • 時尚
  • 智聞捷發
  • 生活
  • 社會
  • 科技
  • 言論
  • 財經
  • 軍事
Copyright 2026 — 綠野旅情. All rights reserved. Blogsy WordPress Theme

關於「綠野旅情」

「綠野旅情」為旅遊主題新聞網站,每日彙整國內外旅遊焦點與產業脈動,提供即時、深度的旅遊資訊。

本站由 智聞捷發新聞發佈平台 營運。

合作・提案・試發新聞

我們誠摯歡迎各行各業洽談合作與內容提案。無論品牌新聞、產品發表或產業觀點,皆可透過「智聞捷發新聞發佈平台」試發新聞稿,讓您的訊息觸及更廣大讀者。

立即洽談合作 ✉

聯絡我們

  • 營運單位智聞捷發 111.net.tw
  • 投稿合作ecoyah+36@gmail.com
  • 客服信箱ecoyah+36@gmail.com
© 2026 智聞捷發 111.net.tw・「綠野旅情」版權所有