記者陳金金 / 台北報導
蘋果公司(Apple)早先罕見地在亞馬遜網路服務公司(AWS)的年度大會上站臺,表示其採用AWS Graviton AI晶片,期望為自家的雲端服務提供增能降本的解決方案,而該消息一出不僅震撼科技界,也等於同宣告於AI算力競賽中,企業正處於如何選擇晶片取得領先地位的「算力佈局」時刻。
AI領域上,各種語言模型如DeepSeek、Gork3等前仆後繼,這也不禁讓人進一步思考,晶片供應上,挾帶旗下「AI三晶(Graviton、Inferentia與 Trainium)」來勢洶洶的AWS是否也將成為算力佈局的新選擇?
站台是徵兆,選AI晶片背後其來有自
「導入AWS Graviton 與 Inferentia 已為蘋果搜尋服務提升了 40% 效率。」
蘋果機器學習與 AI 業務負責人 Benoit Dupin 在 AWS re:Invent 2024 大會上的這席話,被科技界與投資界視為罕見的超量級站台,因為在全球智慧手機平板與電腦市場中獨領風騷的蘋果公司,一直都是以自行研發晶片並享有軟硬體整合優勢而聞名,如今公開背書,指標性絕非一般。此外,Benoit Dupin 也透露在評估使用 AWS AI 訓練晶片 Trainium2,預期能為Apple Intelligence 與其他模型帶來 50% 的效率提升、降低成本,無疑是於算力佈局上再次對 AWS 自研的AI晶片投下信任票。
事實上,蘋果並非第一個採用AWS 自研AI 晶片的科技巨頭,包含 Netflix、Spotify、Epic Game…等數十家2C市場業者,早已從 Graviton收到效益,如 Netflix 在影片編碼的效能提升了20%,同時降低成本;Spotify 改善了串流服務的延遲,提升了用戶歷程;Epic Games 則有效率地優化遊戲引擎,讓玩家遊戲體驗更順暢,而在 2B 企業市場方面,也有 ARM、SIEMENS、SAP等多家產業一線企業採用,如ARM就在工作負載上節省了30% 的成本。
這些案例證明了AWS 的確有拿下一席之地的實力,並且在效能、成本、可靠度上具有相當優勢。然而,更令外界好奇的是,AWS究竟有怎樣的魅力讓這些大牌客戶搶進「上車」?專家認為答案就出在雲地兩端統合的「算力佈局」。
比 AI 晶片更關鍵:算力佈局
雲端運算構築數位生活與企業型態的基本架構,企業無法只聚焦AI晶片算力,卻不兼顧及雲端上的效能擴充、資安,甚至是永續法規,這是無論2C或2B企業都須面對的。更何況在現實中,AI 發展一日多變,今天的領先技術很可能一個月就是落後產物,這也讓有知覺又不想當冤大頭的企業開始明白,玩AI如果隨波逐流恐怕只是花大錢換來歷史遺物,如同前述考量雲地兩端的運算能力才是解決之道。
在雲端上能快速開發、有效運行,且盡可能減少導入、維護、營運成本還要有強大的資源與支援體系,已是採用雲端服務的共同趨勢,甚至也是當代資訊長或技術長被任命時的標準目標。因此,一旦評估導入 AI 時現行的雲端供應商能符合前述條件,所推出的 AI 晶片又兼具算力與成本優勢,並與雲端資源的高度整合,多數企業會將其作為首選,即便非現行用戶,也可能轉移平台,以求「算力佈局」的最佳化與一體性。
「畢竟,東拼西湊的算力並非企業所望,它始終在營運上有著維護風險與成本疊加。」他接著說。
這個說法也從蘋果與 AWS 長達十多年的合作得到印證,包含Siri、地圖、音樂等功能都架構在AWS的雲服務上,Dupin更是宣稱「Amazon 的 AI 晶片十分可靠,足以為全球蘋果用戶提供服務。」
算力佈局下,如何選擇AI 晶片的六大考量
根據 2024 年雲端服務市占,AWS 仍以30% 居於首位,領先微軟 Azure 的 21%與 Google Cloud 的12%,三家先後推出自家AI 晶片,加上市面上晶片種類繁多,專家建議可以從以下六個面向考量:
- 運算效能:AI 應用需要大量計算資源,晶片效能直接影響到 AI 模型的訓練速度和預測準確度,效能也直接電力能耗與後續費用。
- 總體成本:AI算力佈局不僅涉及硬體成本,也包含雲端運算資源的租賃費、維運費用等,是企業決策的重要指標。
- 可擴展性與彈性:AI發展瞬息萬變,靈活的AI資源有助於模型訓練、推論或資料處理,多數企業都希望能根據需求動態調整運算資源
- 生態系統:擁有完善的軟體和工具生態系統,有助輕鬆地開發和佈署 AI 應用,除了硬體本身的運算能力,企業還需評估該晶片是否能與現有的軟體工具、開發架構無縫整合。
- 能源效率:由於AI運算密集度高,能源消耗問題日益受到重視,加上ESG永續規範在節能減碳上的限制,有效帶來低能耗的晶片將逐漸成為基本要求。
- 資安與個資安全性: AI應用涉及敏感數據,企業需要有嚴格安全防護措施的算力服務,而資安與個資安全也是如DJSI在內的國際ESG評比中在公司治理上的重要項目,也在各國 AI 政策中被列為首要規範。
AWS 搶先佈局晶片先贏一步!
AWS 的 AI三晶能在「算力佈局」先勝一籌,主要是因為:第一,贏在晶片與雲服務結合的高效率:旗下 Graviton、Inferentia、Trainium 都能於雲端服務高度搭配,其中 Graviton 晶片採用 Arm 架構,在「高效能、低功耗」就搶下了分數,還能與旗下Amazon EC2 搭配應用,對於想雲端化又想AI化的企業是一舉兩得。此外,Trainium專攻深度學習訓練、Inferentia主打深度學習推論,AWS 的AI三晶定位清楚,也認為是提供高效能的關鍵。
第二,贏在定價策略帶來的低成本:企業可以依需求以量計價,選擇划算的方案,免資源浪費,幫助企業降低AI算力成本;第三,可擴展性與彈性的自由度:AWS 提供多種機制,如運用Amazon EC2 Auto Scaling 可以根據需求,調整 Graviton 執行個體的數量,以應對不同的算力處理狀態。
第四,贏在豐富完整的合作夥伴網絡: Amazon SageMaker 支援 Graviton 晶片,讓企業可以更輕鬆地訓練和部署機器學習模型,或有 AWS Neuron SDK(專為AWS Inferentia、Trainium 等AI晶片設計的軟體開發工具包),提供了豐富的工具和函式庫,方便開發人員快速構建AI應用程式。
第五,贏在資安嚴謹的安全性: AWS雲端平台具有嚴格的安全機制,包括數據加密、訪問控制和漏洞掃描等,確保企業的AI應用和數據安全無虞;第六、贏在對齊規範的永續性:在節能減碳上均有國際認證,例如,AWS 的 客戶碳足跡工具(Carbon Footprint Tool) 就追蹤、測量、檢閱和預測在 AWS 用量產生的碳排放量,方便企業導入時淨零碳排的節能計算。
AWS 的 AI晶片,也讓各公司在AI導入上有了正確觀念,從頭看見「算力佈局」的整體思維,而 AI 晶片市場中的競爭同業出現,也象徵市場坐大與蓬勃發展,真正意味AI起飛的時刻即將到來。