More  

小編的世界 優質文選 主機

無服務器框架CodeFlare,把AI 模型訓練從4 小時縮短為15 分鐘!


2021年7月18日 - 主機小編 四川人在香港 
   

四川人在香港

IT主管,科技領域創作者

IBM 於近期推出了全新無服務器的開源框架CodeFlare,幫助開發人員減少在混合雲環境中部署AI 模型所花費的時間,此框架目前已在 GitHub 上開源。

使用CodeFlare 後,減少94% 機器學習模型Pipeline 執行時長對於企業而言,訓練出一個機器學習模型從來不是主要的瓶頸— 那什麼才是呢?

在生產環境中的持續營運、構建完整的人工智能系統,達成規模化落地,而且中間沒有任何重大的斷層,這才是真正的挑戰。然而,企業為了隨時因應新需求來部署機器學習解決方案,經常只能不斷重寫實驗代碼來迭代,但這種方法是模棱兩可的,在不具備MLOps 的概念之下,成功幾率更低。

據IBM表示,用戶使用CodeFlare框架分析和優化大約100,000個用於訓練機器學習模型的pipeline時,可將 執行時長從原本的4小時大幅縮減到短短15分鐘 。

資料科學和機器學習分析,在各個垂直領域的需求正在激增,任務也變得越來越複雜。隨著數據集越來越大,涉及的系統也變多,使得AI 研究人員和開發人員得花更多時間配置在模型設定上,要創建一個機器學習模型,必須還得進行數據清洗、特征標准化、特征提取等耗時、耗力、多重的前置作業,才能進行訓練優化。

而CodeFlare 存在的目的,就是要簡化AI 迭代過程,讓數據工作流程更容易規模化進行。

CodeFlare 框架主要是建立在Ray 之上— Ray 是加州大學柏克萊分校RISE 實驗室為AI 應用程序開發的開源分布式計算系統,也是源自IBM 集團的一個項目,通過該項目也創建出了世界上第一個原型2 納米芯片。

IBM 框架CodeFlare 介面基於Python,具三大特點

IBM Research混合雲平台總監Priya Nagpurkar透露:「CodeFlare采用了簡化機器學習的概念…更進一步把每個孤立的步驟串聯起,將端到端pipeline與資料科學家熟悉的介面無縫整合—比如Python,而不是容器(container)。CodeFlare使用了統一的runtime和程序接口,有助於簡化pipeline整合和擴展的過程,展現與眾不同的效能。」

具體來說,CodeFlare 擁有以下三大特點:

1. 基於Python 的介面,可用於管理跨平台的pipeline,且pipeline 可以在大多數計算環境中共享資源、進行平行化運算。通過轉接器與其他雲原生生態系統整合和銜接,形成橫向分布式工作流程,開發人員也不必為了維護管理而去學新的語言。

2. 觸發器功能,使CodeFlare pipeline 能夠在發生某些特定事件(例如有新文件抵達)時被啟動,同時,可從任何來源載入和分割數據,讓pipeline 能夠有效去運用一系列數據源,包括文件系統、物件存儲、數據湖和分布式文件系統。

3. 可以部署在任何雲基礎架構上,通過和Red Hat OpenShift 和IBM Cloud Code Engine 的整合,實現了無服務器的體驗,並供用戶在任意平台建立工作流程,具備拓展無服務器服務的好處。

從廣泛角度來看,CodeFlare的概念類似於Amazon SageMaker Pipelines,聚焦在從雲儀表板自動化、組織機器學習pipeline的流程,而Google、微軟和Hybernet Labs則是分別在Cloud AI Platform Pipelines、Azure Machine Learning Pipelines和Galileo中提供了相似的服務。

但IBM強調,CodeFlare結合了本地和雲端基礎架構,是從本地端開始構建來支持混合雲的 。

「該框架背後的動機,是為了收攏工作流程,還有為了完美結合人工智能、機器學習、數據分析和建模」,Nagpurkar 表示,「我們看到了在runtime 之下能大幅優化管道的機會,可以有效管理和改善數據依賴性(data dependencies)、執行控制性(execution control)。」

CodeFlare 已開源,降低企業AI 部署混合雲難度

目前CodeFlare 已在 GitHub開源,IBM也提供了一系列有關其工作原理,以及開發人員入門所需的技術部落格文章。展望未來,IBM計劃繼續發展CodeFlare,來支持更複雜的pipeline和功能,例如容錯和一致性、外部資源的整合和數據管理,以及強化對視覺化管道的支持。

就目前的性能來看,CodeFlare 已經可以將執行100,000 個訓練管道的分析和優化時間,從4 小時縮短到15 分鐘。此外,IBM 正在與客戶合作,將CodeFlare 整合到他們的軟件流程中,也在IBM 自家的AI 研究中使用此框架。

「實現一致性的體驗,以將pipeline 從筆記本電腦擴展到小型集群(cluster)、再到雲,是CodeFlare 的一大關注點」,Nagpurkar 補充,「我們將CodeFlare 視為我們混合雲平台發展的關鍵下一步,對用戶的價值方面,我們必須強調,通過顯著提高效率,CodeFlare 不僅可以節省成本和時間,而且還創造了機會來解決以前由於規模或複雜度等原因、而根本不切實際的新使用情境。」

有了像CodeFlare 這種具備MLOps 優勢的框架,開發人員就不必一直重複相同的工作,也不需要徹底理解pipeline 的配置,用統一界面就可使用豐富的工具和API 一致的進行操作,把更多寶貴的時間放在研究和實際應用上,簡化配置和部署的複雜工作流程,更快速部署到混合雲,開發和部署AI 模型的過程,又會變得輕巧許多。

#機器學習#

想了解更多精彩內容,快來關注四川人在香港