IBM 發佈 Granite 4.0 以混合架構打造企業級 AI 模型

BM 近日發佈最新一代企業級語言模型 Granite 4.0,以創新的 Mamba-2 與 Transformer 混合架構,在效能、成本與控制力之間取得新平衡。這款模型不僅能顯著降低內存與硬體成本,還進一步強化企業在部署 AI 應用時的安全性與靈活度。Granite 4.0 的推出,標誌 IBM 在推動開放、安全、可信 AI 發展方面邁出新一步。

Granite 4.0 現已於 IBM watsonx.ai 平台 正式上線,並同步支援 Dell Technologies、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及 Replicate 等平台。IBM 表示,未來亦會陸續支援 Amazon SageMaker JumpStart 與 Microsoft Azure AI Foundry,為企業提供更廣泛的部署選擇。新一代 Granite 採用混合架構,有效突破傳統 Transformer 模型在長文本處理中的效能瓶頸。Mamba 結構能線性擴展上下文長度,讓 Granite 4.0 在複雜任務中減少多達七成的記憶體使用,同時提升兩倍推理速度,並支援更多平價 GPU 或家用硬體。這項突破讓高效能 AI 技術不再是大型企業的專利,也能為中小企與開發者所用。

Granite 4.0 提供多種模型版本,以滿足不同場景的應用需求。當中包括適合客服自動化與多工具代理任務的中型模型,以及針對邊緣運算與地端部署的輕量版本。雖然體積精簡,但在多項基準測試中,Granite 4.0 仍展現出色表現。在 Stanford IFEval 測試中,其表現僅次於 Llama 4 Maverick;在 Berkeley Function Calling 評測中,以更低成本達致相同準確率;於多輪檢索增強生成測試中亦維持穩定表現。

為進一步推動 AI 安全研究,IBM 亦與 HackerOne 合作推出「Granite 漏洞懸賞計劃」,最高獎金達 10 萬美元,鼓勵全球開發社群參與漏洞檢測與安全強化。

Granite 4.0 支援多種硬體與推理框架,包括 AMD Instinct MI300X GPU、Qualcomm Hexagon NPU,並相容 vLLM、llama.cpp、MLX 及 NexaML 等主流系統。開發者可透過 Unsloth 進行微調,並與 Continue 等工具整合以簡化開發流程。

其他人也看