Skip to content
-
Subscribe to our newsletter & never miss our best posts. Subscribe Now!
  • https://www.facebook.com/
  • https://twitter.com/
  • https://t.me/
  • https://www.instagram.com/
  • https://youtube.com/
綠野旅情
綠野旅情
  • 首頁
  • 生活
  • 一般
  • 國際
  • 即時
  • 健康
  • 社會
  • 工商
  • 財經
  • 首頁
  • 生活
  • 一般
  • 國際
  • 即時
  • 健康
  • 社會
  • 工商
  • 財經
Subscribe
Close

搜尋

工商科技

全球雙榜SOTA!明略科技專有大模型 Mano開啟GUI智慧操作新時代

By terry
2025 年 10 月 6 日 1 Min Read
Comments Off on 全球雙榜SOTA!明略科技專有大模型 Mano開啟GUI智慧操作新時代

北京2025年10月6日 /美通社/ — 2025年,Agent無疑是AI圈的熱詞。行業普遍認為:真正有用的Agent,必須學會使用手機和電腦,像人一樣操作GUI。

近日,中國企業級大模型與資料智慧企業——明略科技推出的專有GUI大模型 Mano在行業公認的Mind2Web和OSWorld兩大基準測試中,均取得了創紀錄的SOTA成績。透過線上強化學習和訓練資料自動採集兩大核心創新,Mano為GUI智慧體領域提供了一套可擴充套件、可持續進化的新正規化。

Mano在OSWorld-Verified榜單的Foundation E2E GUI & Specialized Model評測中取得SOTA。
Mano在OSWorld-Verified榜單的Foundation E2E GUI & Specialized Model評測中取得SOTA。

榜單連結:https://os-world.github.io/
技術報告連結:https://www.mininglamp.com/news/6394/

關鍵突破:

1.Mind2Web:Mind2Web覆蓋137個網站、2350+真實任務,旨在考察智慧體能否在複雜多變的DOM結構裡精準找到目標元素,並完成整個操作鏈。Mano展示出「看得準、做得成」的核心優勢。

技術報告顯示,Mano的元素精度 (Ele.Acc)和步驟成功率(Step SR)指標遙遙領先,在準確識別、定位介面元素,以及成功執行多步任務能力上達到新高度。Mano的操作F1 (Op.F1) 指標與此前頂尖模型持平甚至略高,能夠真正將複雜任務轉化為成功的操作序列。

2. OSWorld-Verified:更難的挑戰來自桌面端。OSWorld-Verified涵蓋了369個跨應用任務,覆蓋10類應用,包含瀏覽器,辦公軟體等多個型別,每一個操作都和真實桌面場景無縫對接。

技術報告顯示,在OSWorld-Verified榜單的Foundation E2E GUI & Specialized Model 評測中,Mano直接把成功率提升到 41.6±0.7%,超過qwen、GUI-Owl、opencua等模型。

技術創新:

亮點一:首次提出「線上強化學習」

自DeepSeek橫空出世以來,GRPO已經成為強化學習黃金正規化。現有的模型訓練大多侷限在離線強化學習的範疇,深度依賴事先收集好的資料集。但在GUI互動智慧體領域,任何操作都與真實的系統互動環境密切相關。

因此,Mano在GUI互動領域首次提出「線上強化學習」的訓練正規化,並推出訓練資料自動採集的「探索器」,讓智慧體時刻依賴最新資料進行學習,並在「嘗試新的行動以獲取資訊」和「基於已有知識採取最優行動」之間取得平衡。

為了在真實的互動環境中不斷強化以提高適應性和靈活性,明略科技建立了一個模擬環境池,包括瀏覽器環境(BUA)和桌面環境(CUA),讓模型在真實互動中採集更多樣化的環境資料,彌補了離線軌跡分佈稀疏的侷限性,最終在多樣化的Web GUI場景中展現出更強的魯棒性。

同時,採用線上取樣 + 離線過濾的創新方式:先收集軌跡,再過濾噪聲資料,動態調節任務難度分佈,有效避免了因失敗軌跡導致學習效率低下的問題。

消融實驗結果顯示,加入線上強化學習後,模型在OSWorld-Verified資料集的平均分數產生了質的飛躍,相比離線強化學習的模型結果提升了 7.9,達到 41.6。

亮點二:智慧探索,採集真實環境軌跡

儘管大模型能夠理解籠統的指令,但在多步驟操作的目標驅動型任務中,往往無法將大目標分解為具體的執行步驟。因此,研發人員需要為互動任務構建專用的模型和智慧體。在這一過程中,海量的高質量互動軌跡資料不可或缺。過去,這類資料往往需要人工構建或標注,成本高、耗時長。對此,明略科技設計了訓練資料自動採集的方法,從根本上提升了資料收集的效率和準確性,這正是Mano的第二大創新。

明略科技搭建了一個可擴充套件的虛擬環境叢集,用於模擬多種互動場景。針對每個目標應用,大模型自動生成目標清單,並對目標進行優先順序排序,過濾掉使用頻率極低的功能,為後續探索提供明確的上下文指導。

元素提取方面,明略科技為網頁環境定製了Chrome外掛「Mano-C」,全面提取網頁中的互動元素,捕捉其空間坐標與語義屬性。針對桌面環境,技術團隊則採用A11y Tree解析與 OmniParseV2協同過濾的方法,確保覆蓋更多互動元素。

資料標注方面,明略科技利用大模型為每個提取的元素生成語義標籤、功能描述,以及互動類別,形成結構化的語義對齊資料,為後續訓練提供有效監督。

為了提升資料採集的智慧程度,技術團隊設計了基於Prompt的探索模組,用於智慧選擇互動元素,並引入顯式約束,避免路徑迴圈和冗餘分支。在探索過程中,採用深度優先搜尋(DFS)策略,系統會擷取截圖並儲存帶註釋的互動資料。完成探索後,透過軌跡評估機制,篩選出高質量的互動序列。整個過程不斷迴圈,每一步都會檢查是否達到最大探索深度。

Mano的SOTA表現,得益於明略科技多年來在大模型領域的積累。2024年,明略科技的超圖多模態大語言模型(HMLLM)和Video-SME資料集在腦電圖、眼動等非標模態資料處理領域取得顯著突破,榮獲ACM MM 2024最佳論文提名。2025年,明略科技推出企業級商業資料分析可信智慧體DeepMiner,Mano作為DeepMiner的自動化執行引擎,讓智慧體真正學會了「看」與「點」,在複雜的軟體與瀏覽器環境下實現了精細化操作。展望未來,明略科技將進一步最佳化Mano在應用和端側部署能力,加速企業智慧化轉型程序。

⚠️ 重要提醒: 1. 謹防誇大宣傳,避免不實陳述。2. 重視資料安全和隱私保護,確保資料收集、處理和使用符合相關法律法規要求。3. 注意技術倫理,避免不當模仿人類能力。4. 關注廣告法規,避免違反廣告法的相關規定。

原始來源:智聞捷發新聞發佈平台

網址:https://www.111.net.tw

歡迎前往新聞發佈平台發佈新聞

Tags:

GUIManoSOTA大模型智能操作
作者

terry

Follow Me
Other Articles
Previous

Bybit上線DoubleZero (2Z),為交易者帶來由基礎設施背書的代幣,並推出550萬個2Z上線推廣活動

Next

明略科技發布大模型產品線 DeepMiner,打造商業資料分析可信智慧體

搜尋

最新文章

  • 三十載光輝印記:美納里尼國際公平競技獎於佛羅倫斯五月音樂節劇院璀璨亮相 2026 年 7 月 4 日
  • 海信為歐洲家庭帶來更智能便捷的制冷體驗 拉動市場高速增長 2026 年 7 月 3 日
  • Intersolar 2026 高光集錦 | 安泰新能源發佈農光跟蹤系統解決方案,攜全場景光伏支架共築歐洲綠能未來 2026 年 7 月 3 日
  • 美納里尼國際公平競技獎:第30屆正式啟動 2026 年 7 月 2 日
  • DJI 發表全新雙主鏡頭口袋電影機Osmo Pocket 4P:靈眸成雙,遠見非凡 2026 年 7 月 1 日
  • 「健身創始之父」—-Les Mills Snr 1934 – 2026 2026 年 7 月 1 日
  • 卡西歐將推出EDIFICE自動機械腕表 光影變幻呈現多元質感 2026 年 7 月 1 日
  • 從「帶孩子度假」到「全家人的假期」 三亞艾迪遜酒店重新詮釋家庭旅行體驗 2026 年 7 月 1 日

分類

  • Homepage Ads
  • 一般
  • 人事資訊
  • 健康
  • 兩岸
  • 即時
  • 國際
  • 娛樂
  • 媒體發佈
  • 工商
  • 政治
  • 教育
  • 數位公關
  • 新聞稿發佈
  • 時尚
  • 智聞捷發
  • 生活
  • 社會
  • 科技
  • 言論
  • 財經
  • 軍事
Copyright 2026 — 綠野旅情. All rights reserved. Blogsy WordPress Theme

關於「綠野旅情」

「綠野旅情」為旅遊主題新聞網站,每日彙整國內外旅遊焦點與產業脈動,提供即時、深度的旅遊資訊。

本站由 智聞捷發新聞發佈平台 營運。

合作・提案・試發新聞

我們誠摯歡迎各行各業洽談合作與內容提案。無論品牌新聞、產品發表或產業觀點,皆可透過「智聞捷發新聞發佈平台」試發新聞稿,讓您的訊息觸及更廣大讀者。

立即洽談合作 ✉

聯絡我們

  • 營運單位智聞捷發 111.net.tw
  • 投稿合作ecoyah+36@gmail.com
  • 客服信箱ecoyah+36@gmail.com
© 2026 智聞捷發 111.net.tw・「綠野旅情」版權所有