小編的世界優質文選主機

無服務器框架CodeFlare，把AI 模型訓練從4 小時縮短為15 分鐘！

2021年7月18日 - 主機小編四川人在香港

四川人在香港

IT主管,科技領域創作者

IBM 於近期推出了全新無服務器的開源框架CodeFlare，幫助開發人員減少在混合雲環境中部署AI 模型所花費的時間，此框架目前已在 GitHub 上開源。

使用CodeFlare 後，減少94% 機器學習模型Pipeline 執行時長對於企業而言，訓練出一個機器學習模型從來不是主要的瓶頸— 那什麼才是呢？

在生產環境中的持續營運、構建完整的人工智能系統，達成規模化落地，而且中間沒有任何重大的斷層，這才是真正的挑戰。然而，企業為了隨時因應新需求來部署機器學習解決方案，經常只能不斷重寫實驗代碼來迭代，但這種方法是模棱兩可的，在不具備MLOps 的概念之下，成功幾率更低。

據IBM表示，用戶使用CodeFlare框架分析和優化大約100,000個用於訓練機器學習模型的pipeline時，可將執行時長從原本的4小時大幅縮減到短短15分鐘。

資料科學和機器學習分析，在各個垂直領域的需求正在激增，任務也變得越來越複雜。隨著數據集越來越大，涉及的系統也變多，使得AI 研究人員和開發人員得花更多時間配置在模型設定上，要創建一個機器學習模型，必須還得進行數據清洗、特征標准化、特征提取等耗時、耗力、多重的前置作業，才能進行訓練優化。

而CodeFlare 存在的目的，就是要簡化AI 迭代過程，讓數據工作流程更容易規模化進行。

CodeFlare 框架主要是建立在Ray 之上— Ray 是加州大學柏克萊分校RISE 實驗室為AI 應用程序開發的開源分布式計算系統，也是源自IBM 集團的一個項目，通過該項目也創建出了世界上第一個原型2 納米芯片。

IBM 框架CodeFlare 介面基於Python，具三大特點

IBM Research混合雲平台總監Priya Nagpurkar透露：「CodeFlare采用了簡化機器學習的概念…更進一步把每個孤立的步驟串聯起，將端到端pipeline與資料科學家熟悉的介面無縫整合—比如Python，而不是容器（container）。CodeFlare使用了統一的runtime和程序接口，有助於簡化pipeline整合和擴展的過程，展現與眾不同的效能。」

具體來說，CodeFlare 擁有以下三大特點：

1. 基於Python 的介面，可用於管理跨平台的pipeline，且pipeline 可以在大多數計算環境中共享資源、進行平行化運算。通過轉接器與其他雲原生生態系統整合和銜接，形成橫向分布式工作流程，開發人員也不必為了維護管理而去學新的語言。

2. 觸發器功能，使CodeFlare pipeline 能夠在發生某些特定事件（例如有新文件抵達）時被啟動，同時，可從任何來源載入和分割數據，讓pipeline 能夠有效去運用一系列數據源，包括文件系統、物件存儲、數據湖和分布式文件系統。

3. 可以部署在任何雲基礎架構上，通過和Red Hat OpenShift 和IBM Cloud Code Engine 的整合，實現了無服務器的體驗，並供用戶在任意平台建立工作流程，具備拓展無服務器服務的好處。

從廣泛角度來看，CodeFlare的概念類似於Amazon SageMaker Pipelines，聚焦在從雲儀表板自動化、組織機器學習pipeline的流程，而Google、微軟和Hybernet Labs則是分別在Cloud AI Platform Pipelines、Azure Machine Learning Pipelines和Galileo中提供了相似的服務。

但IBM強調，CodeFlare結合了本地和雲端基礎架構，是從本地端開始構建來支持混合雲的。

「該框架背後的動機，是為了收攏工作流程，還有為了完美結合人工智能、機器學習、數據分析和建模」，Nagpurkar 表示，「我們看到了在runtime 之下能大幅優化管道的機會，可以有效管理和改善數據依賴性（data dependencies）、執行控制性（execution control）。」

CodeFlare 已開源，降低企業AI 部署混合雲難度

目前CodeFlare 已在 GitHub開源，IBM也提供了一系列有關其工作原理，以及開發人員入門所需的技術部落格文章。展望未來，IBM計劃繼續發展CodeFlare，來支持更複雜的pipeline和功能，例如容錯和一致性、外部資源的整合和數據管理，以及強化對視覺化管道的支持。

就目前的性能來看，CodeFlare 已經可以將執行100,000 個訓練管道的分析和優化時間，從4 小時縮短到15 分鐘。此外，IBM 正在與客戶合作，將CodeFlare 整合到他們的軟件流程中，也在IBM 自家的AI 研究中使用此框架。

「實現一致性的體驗，以將pipeline 從筆記本電腦擴展到小型集群（cluster）、再到雲，是CodeFlare 的一大關注點」，Nagpurkar 補充，「我們將CodeFlare 視為我們混合雲平台發展的關鍵下一步，對用戶的價值方面，我們必須強調，通過顯著提高效率，CodeFlare 不僅可以節省成本和時間，而且還創造了機會來解決以前由於規模或複雜度等原因、而根本不切實際的新使用情境。」

有了像CodeFlare 這種具備MLOps 優勢的框架，開發人員就不必一直重複相同的工作，也不需要徹底理解pipeline 的配置，用統一界面就可使用豐富的工具和API 一致的進行操作，把更多寶貴的時間放在研究和實際應用上，簡化配置和部署的複雜工作流程，更快速部署到混合雲，開發和部署AI 模型的過程，又會變得輕巧許多。

#機器學習#

想了解更多精彩內容，快來關注四川人在香港