美國加州大學(xué)洛杉磯分校研究團(tuán)隊(duì)在新一期《自然》雜志刊發(fā)論文稱,他們研制出一種新型圖像生成器。與標(biāo)準(zhǔn)人工智能(AI)工具相比,該設(shè)備生成一幅圖像的能耗可降低至十萬分之一,僅幾毫焦耳。
目前大多數(shù)AI模型基于文本生成圖像,AI先學(xué)習(xí)大量圖像,掌握如何用統(tǒng)計(jì)噪聲逐步破壞它們,再將這類變化模式編碼為一套規(guī)則。接收到新的含噪聲圖像時(shí),AI可依據(jù)這些規(guī)則反向操作,經(jīng)過多步處理,最終生成與文本指令相匹配的連貫圖像。
生成高分辨率逼真圖像需要執(zhí)行大量擴(kuò)散步驟,對算力要求極高,能耗巨大。新型光學(xué)AI圖像生成器或能緩解能耗巨大這一難題。研究團(tuán)隊(duì)表示,該系統(tǒng)首先使用基于公開圖像數(shù)據(jù)集訓(xùn)練的數(shù)字編碼器,生成可轉(zhuǎn)化為圖像的靜態(tài)編碼。隨后,借助名為“空間光調(diào)制器(SLM)”的液晶屏幕,將該編碼以物理方式印刻在激光束中。當(dāng)激光穿過第二個(gè)用作解碼的SLM時(shí),便會在相機(jī)記錄的屏幕上瞬間呈現(xiàn)目標(biāo)圖像。
在測試中,團(tuán)隊(duì)利用新系統(tǒng)生成了黑白數(shù)字(1至9)、基礎(chǔ)服裝等簡單圖像,以及梵高風(fēng)格的全彩畫作。結(jié)果顯示,生成效果與傳統(tǒng)圖像生成器大致相當(dāng)。在繪制梵高風(fēng)格圖像時(shí),新系統(tǒng)每幅僅消耗約幾毫焦耳能量,而傳統(tǒng)擴(kuò)散模型則需耗費(fèi)數(shù)百甚至數(shù)千焦耳。(科技日報(bào) 劉霞)
評論