新技術實現智能邊緣設備上AI模型的訓練

通過尚塔爾Polsonetti

類別:
收購或合夥

微控製器是數十億連接設備的基礎,從物聯網(IoT)設備到汽車傳感器。但廉價、低功耗的微控製器內存極其有限,而且沒有操作係統,這使得在獨立於中央計算資源的邊緣設備上訓練人工智能模型具有挑戰性。

在智能邊緣設備上訓練機器學習模型,使其能夠適應新的數據並做出智能邊緣設備更好的預測。例如,在智能鍵盤上訓練一個模型可以使鍵盤不斷地從用戶的書寫中學習。然而,訓練過程需要大量的內存,因此在將模型部署到設備上之前,通常使用功能強大的數據中心計算機或雲計算來完成。這樣做成本更高,而且會引發隱私問題,因為用戶數據必須發送到中央服務器。

為了解決這個問題,麻省理工學院和MIT- ibm沃森人工智能實驗室的研究人員開發了一種新技術,可以使用不到四分之一兆字節的內存進行設備上訓練。為連接設備設計的其他培訓解決方案可以使用超過500兆的內存,大大超過大多數微控製器的256千字節的容量。

研究人員開發的智能算法和框架減少了訓練模型所需的計算量,這使得過程更快,內存效率更高。他們的技術可以在幾分鍾內在微控製器上訓練一個機器學習模型。

這種技術還通過將數據保存在設備上來保護隱私,這對敏感數據尤其有利。它還可以根據用戶的需求進行模型定製。此外,與其他訓練方法相比,該框架保持或提高了模型的準確性。

這項研究聲稱,物聯網設備不僅可以進行推理,還可以根據新收集的數據不斷更新AI模型,為終生在設備上學習鋪平道路。低資源利用率使得深度學習更容易獲得,可以有更廣泛的覆蓋範圍,特別是對於低功耗的邊緣設備。

輕量級的訓練

神經網絡是一種常見的機器學習模型。這些模型鬆散地以人腦為基礎,包含層層相互連接的節點或神經元,處理數據以完成任務,例如在照片中識別人。首先必須訓練模型,這包括向它展示數百萬個例子,以便它學習任務。在學習過程中,模型會增加或減少神經元之間的連接強度,這被稱為權重。

模型在學習過程中可能經曆數百次更新,並且中間激活必須在每一輪中存儲。在神經網絡中,激活是中間層的中間結果。因為可能有數百萬的權重和激活,訓練一個模型比運行一個預先訓練的模型需要更多的內存。

研究人員開發了一個被稱為微型訓練引擎的係統,它可以在一個沒有操作係統的簡單微控製器上運行算法創新。該係統改變了訓練過程中步驟的順序,因此在模型部署到邊緣設備之前,更多的工作在編譯階段完成。

成功的加速

該研究優化隻需要157千字節的內存來訓練微控製器上的機器學習模型,而其他為輕量級訓練設計的技術仍然需要300到600兆字節的內存。他們通過訓練計算機視覺模型來檢測圖像中的人,從而測試了他們的框架。僅僅經過10分鍾的訓練,它就學會了成功地完成任務。他們的方法訓練模型的速度比其他方法快20倍以上。

這項工作由國家科學基金會、MIT- ibm沃森人工智能實驗室、MIT人工智能硬件項目、亞馬遜、英特爾、高通、福特汽車公司和穀歌資助。

與ARC谘詢小組保持聯係

Baidu
map