AIGC,可能是下個10年最重要的投資機遇之一( 三 )


然而,有趣的是,這些公司也可能從AIGC的大熱中受益,因為 投資者經常把它們納入AIGC的范疇 。但除非它們創新其基礎技術,否則不太可能在大模型的時代收獲技術革命創造的價值 。
技術趨勢: 局限性、對技術的誤解...生成式 AI 到底會有多好使?
在生成式 AI 的新興領域, 底層技術決定了應用層可以做出哪些產品 。
兩年前 GPT-3 的發布促成了一系列文本生成的初創公司,例如Jasper.ai 和 copy.ai 。現在,圖像和代碼生成模型的發布為新的營銷、設計和編程應用程序奠定了基礎 。繼AI頭像app Lensa.ai爆火之后,新一波初創公司正在構建AI圖像生成的應用程序 。
但不同應用的底層技術到底有多好?接下來的這一部分,我們會給大家提供模型層的概述 。

AIGC,可能是下個10年最重要的投資機遇之一

文章插圖


來源:紅杉資本,生成式AI:充滿創造力的新世界(2022)
AIGC,可能是下個10年最重要的投資機遇之一

文章插圖


來源:紅杉資本 , 生成式AI:充滿創造力的新世界(2022)
文本模型是AIGC模型中最成熟的一類 , 也是最早開發的模型 。與任何其他類型的AIGC模型相比 , 文本模型的數量更多,并且有更多可用的API和開源模型 。除了OpenAI和DeepMind等知名實驗室外,不少創業公司也在為AI語言模型基礎設施層做貢獻,包括以色列的AI實驗室AI21和加拿大的初創公司Cohere 。
我們在這里把2018年以來發布的所有大型大型語言模型 (LLM) 做了一個可視化分析(模型很多?。?。顯而易見,這些模型的參數量在以指數級的速度增長 , 算力和數據需求也越來越高 。大模型的“縮放定律”(“scaling law”)預測模型 能力將隨著模型參數規模的增加而提高 。
AIGC,可能是下個10年最重要的投資機遇之一

文章插圖


文本模型可視化分析
在圖像生成領域,DALLE-2、Stable Diffusion和Midjourney這種大火的模型使圖像生成AI首次出圈 。我們已經習慣了AI生成的驚艷的技術作品,比如DALLE-2經典的宇航員騎馬圖,還有Midjourney細致入微的繪畫 。
AIGC,可能是下個10年最重要的投資機遇之一

文章插圖


“一名騎馬的宇航員,寫實風格” 。由 DALLE-2 生成
AIGC,可能是下個10年最重要的投資機遇之一

文章插圖


Jenn Mishra作品 。由Midjourney生成
然而,我們在網上看到的精美圖像并不能代表所有AI生成的圖像 。圖像生成AI模型仍然存在可控性問題,很多時候不會響應使用者的指令,或者會漏掉指令中的關鍵信息 。這為更廣泛的商業應用造成了技術障礙 。
我們可以用三個頂尖的AI圖像生成模型做一個有趣的小實驗 。
每個指令生成的第一張圖像被選為示例 。我們可以看到DALLE-2和Stable Diffusion 2.0生成的效果類似,對指令的響應能力也差不多 。它們可以生成寫實的小貓還有西班牙畫家薩爾瓦多·達利風格的柯基犬 。作為在專業的藝術數據集上訓練的小模型,Midjourney在創建藝術圖像方很厲害,但往往完全忽略語言指令 。它生成的貓并不真實,生成的小柯基也不像是達利的畫風 。并且三個模型沒有一個對“使用披薩大小的硬幣去買硬幣大小的披薩”做出很好的反應 。這個指令正是要測試模型的語言理解能力 。有兩個模型生成的人手手指看起來很奇怪 。
AIGC,可能是下個10年最重要的投資機遇之一

文章插圖


DALLE-2、Stable Diffusion 2.0、Midjourney三個AI圖像生成模型產出的圖像對比

相關經驗推薦