【資料圖】
去年,麻省理工學(xué)院開發(fā)了一種人工智能/ML算法,能夠在工作中學(xué)習(xí)和適應(yīng)新的信息,而不僅僅是在其最初的訓(xùn)練階段。這些 "液體 "神經(jīng)網(wǎng)絡(luò)(在李小龍的意義上)簡直就是在下4D棋--它們的模型需要時間序列數(shù)據(jù)來運(yùn)行--這使它們成為用于時間敏感任務(wù)的理想選擇,如心臟起搏器監(jiān)測、天氣預(yù)報、投資預(yù)測或自主車輛導(dǎo)航。但是,問題是,數(shù)據(jù)吞吐量已經(jīng)成為一個瓶頸,從計(jì)算上來說,擴(kuò)展這些系統(tǒng)已經(jīng)變得非常昂貴。
周二,麻省理工學(xué)院的研究人員宣布,他們已經(jīng)為這一限制設(shè)計(jì)了一個解決方案,不是通過拓寬數(shù)據(jù)管道,而是通過解決一個自1907年以來一直困擾數(shù)學(xué)家的微分方程。具體來說,該團(tuán)隊(duì)解決了 "兩個神經(jīng)元通過突觸相互作用背后的微分方程......以解鎖一種新型的快速和高效的人工智能算法。"
"麻省理工學(xué)院教授和CSAIL主任丹妮拉-魯斯(Daniela Rus)在周二的一份新聞聲明中說:"我們稱之為"CfC"[閉式連續(xù)時間]的新機(jī)器學(xué)習(xí)模型用閉式近似代替了定義神經(jīng)元計(jì)算的微分方程,保留了液體網(wǎng)絡(luò)的美麗特性,而不需要進(jìn)行數(shù)字整合。"CfC模型是有因果關(guān)系的,緊湊的,可解釋的,并能有效地訓(xùn)練和預(yù)測。它們?yōu)榘踩P(guān)鍵型應(yīng)用開辟了值得信賴的機(jī)器學(xué)習(xí)之路"。
因此,對于我們這些沒有真正的硬數(shù)學(xué)博士學(xué)位的人來說,微分方程是可以描述一個系統(tǒng)在整個過程中各個離散點(diǎn)或步驟的狀態(tài)的公式。例如,如果你有一個機(jī)器人手臂從A點(diǎn)移動到B點(diǎn),你可以使用微分方程來知道它在整個過程中的任何給定步驟中處于空間的兩點(diǎn)之間。然而,為每一步解決這些方程很快也會變得計(jì)算昂貴。麻省理工學(xué)院的 "封閉式 "解決方案通過在單一計(jì)算步驟中對系統(tǒng)的整個描述進(jìn)行功能建模來解決這個問題。麻省理工學(xué)院的團(tuán)隊(duì)解釋說。
想象一下,如果你有一個端到端的神經(jīng)網(wǎng)絡(luò),從安裝在汽車上的攝像頭接收駕駛輸入。該網(wǎng)絡(luò)被訓(xùn)練來產(chǎn)生輸出,如汽車的轉(zhuǎn)向角。2020年,該團(tuán)隊(duì)通過使用具有19個節(jié)點(diǎn)的液體神經(jīng)網(wǎng)絡(luò)來解決這個問題,因此19個神經(jīng)元加上一個小型感知模塊可以驅(qū)動一輛汽車。一個微分方程描述了該系統(tǒng)的每個節(jié)點(diǎn)。有了閉合式解決方案,如果你在這個網(wǎng)絡(luò)里面替換它,它就會給你準(zhǔn)確的行為,因?yàn)樗窍到y(tǒng)實(shí)際動態(tài)的良好近似。因此,他們可以用更少的神經(jīng)元數(shù)量來解決這個問題,這意味著它將更快,計(jì)算成本更低。
通過在神經(jīng)元水平上解決這個方程,該團(tuán)隊(duì)希望他們能夠構(gòu)建以數(shù)百萬神經(jīng)連接為單位的人腦模型,這在今天是不可能的。該團(tuán)隊(duì)還指出,這種CfC模型可能能夠?qū)⑺谝粋€環(huán)境中學(xué)習(xí)到的視覺訓(xùn)練應(yīng)用到一個全新的環(huán)境中,而不需要額外的工作,這就是所謂的分布外泛化。這不是目前的模型所能做到的,這將被證明是向未來的通用人工智能系統(tǒng)邁出的重要一步。