deepmind|單個圖像“轉換”為視頻！谷歌的DeepMind人工智能團隊發布新功能！

2022-08-26 Google deepmind

文章圖片

上周，谷歌高級深度思維神經網絡背后的團隊公開發布了一項新功能，稱為Transframer ，這項功能允許人工智能從單個圖像輸入中生成一段30秒的視頻。乍一看，這是一個華而不實的小把戲，但其實際的含義遠遠大于一個有趣的.GIF文件。

Transframer可以從一個圖像中想象周圍的環境
Transframer是一個通用生成框架，可以在概率設置中處理許多圖像和視頻任務。新的研究表明，它在視頻預測和視圖合成方面表現出色，可以從單個圖像生成30秒的視頻。谷歌高級深度思維神經網絡團隊透漏稱。

google
“Transframer在各種視頻生成基準上都是最先進的，并且……可以從單個圖像生成連貫的30秒視頻，而無需任何明確的幾何信息， ”DeepMind研究團隊解釋道。基本上， Transframer只需要一張照片，然后分析和識別照片的框架，即桌子、走廊或街道等線索。在使用這些“背景圖像”預測受試者的周圍環境后，它從各個角度設想（并隨后顯示）該目標的外觀。 DeepMind的團隊用椅子、筆記本電腦、一杯水，甚至一本GRE教科書等目標來說明這個過程。

谷歌的DeepMind AI可以將單個圖像“轉換”為視頻
“給定一組具有相關注釋（時間戳、攝像機視點等）的背景圖像和一個查詢注釋，任務是預測目標圖像上的概率分布， ”該團隊繼續說道。該框架支持一系列視覺預測任務，包括視頻建模、新穎視圖合成和多任務視覺。

AI
正如未來主義者所指出的， Transframer有朝一日可以通過利用機器學習來構建數字環境，而不是依賴更耗時的渲染方法，為視頻游戲行業提供一條全新的途徑。隨著技術的進步， DeepMind的Transframer培訓可以為藝術、科學分析和人工智能的進一步發展開辟全新的途徑。

人工智能
此外，一位Twitter用戶設想在Transframer程序的基礎上利用OpenAI的DALL-E圖片來創建堆疊的人工智能作品，就好像這些圖像無法變得更超現實一樣。 OpenAI的DALL-E技術就是通過將文字描述轉換為圖片的技術，通過這個程序，每個人都可以通過描述原創圖片，更多DALL-E的介紹可以看我前面的文章人均藝術家！文本轉換為圖像， DALL-E程序創造新世界！TikTok日前也添加了這項功能，可以看我前幾天的文章了解更多TikTok提供了一個基本的文本到圖像的AI生成器，壓力來到了抖音！? 。

OpenAI
【deepmind|單個圖像“轉換”為視頻！谷歌的DeepMind人工智能團隊發布新功能！】今天，關于谷歌人工智能團隊發布的圖像轉視頻的新功能的介紹就到這里了，更多科技資訊請關注科技譯站！，我是蟹家之寶樹，歡迎大家評論區留言討論！

相關經驗推薦

上一篇：TCL|TCL T7G對比索尼X90K，大法這次真的不香了

下一篇：顯卡|ColorOS 13升級力度有多大？這幾大新功能有趣又實用，期待值拉滿