衡宇 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
DDIM之父宋佳銘(Jiaming Song),在領(lǐng)英上發(fā)布了自己從Luma AI離職的消息。
DDIM全稱Denoising Diffusion Implicit Models。
如果你用過(guò)任何基于擴(kuò)散模型的圖像生成工具,背后幾乎都離不開(kāi)DDIM帶來(lái)的采樣加速技術(shù)。
這位推動(dòng)擴(kuò)散模型工業(yè)化落地的關(guān)鍵人物出走,正值 Luma AI憑Dream Machine、Uni-1.1等產(chǎn)品躋身全球多模態(tài)第一梯隊(duì)的關(guān)鍵期。
![]()
走完Luma AI三年風(fēng)口迭代路,社交平臺(tái)確認(rèn)“已離職”
時(shí)間拉回2023年。
彼時(shí)在英偉達(dá)擔(dān)任高級(jí)研究科學(xué)家的宋佳銘,選擇跳出大廠體系,加盟風(fēng)頭正盛的初創(chuàng)企業(yè)Luma AI,出任首席科學(xué)家。
他在動(dòng)態(tài)中提到,加入Luma的幾年里,他參與推動(dòng)了幾次關(guān)鍵技術(shù)轉(zhuǎn)向,從3D生成到視頻生成,再到最近的多模態(tài)基礎(chǔ)模型。
2023年,AI 3D生成賽道全面爆發(fā),行業(yè)爭(zhēng)相探索NeRF、文生3D技術(shù)落地場(chǎng)景,Luma AI憑借Genie系列模型站穩(wěn)腳跟。
2024年,文生視頻成為行業(yè)新風(fēng)口,OpenAI Sora問(wèn)世帶動(dòng)全網(wǎng)視頻AI競(jìng)賽,Luma AI順勢(shì)推出Dream Machine,憑極致的畫(huà)面一致性、電影級(jí)運(yùn)鏡能力出圈。
2025年至今,單一模態(tài)模型逐漸遇頂,多模態(tài)大一統(tǒng)、AI世界模型成為行業(yè)新敘事,Luma AI又快速迭代出Uni-1.1多模態(tài)模型,完成技術(shù)賽道的再度升級(jí)。
Luma的轉(zhuǎn)型軌跡,幾乎就是AI生成賽道過(guò)去三年的縮影。
宋佳銘加入LumaAI的節(jié)點(diǎn),正好是這家公司從3D生成產(chǎn)品向多模態(tài)基礎(chǔ)模型加速轉(zhuǎn)型的時(shí)候。
彼時(shí)LumaAI剛拿到a16z領(lǐng)投的B輪融資,一邊發(fā)布Genie1.0繼續(xù)押注文生3D,一邊把融資用途指向基礎(chǔ)模型算力、數(shù)據(jù)和團(tuán)隊(duì)擴(kuò)張。
![]()
宋佳銘感慨道,在Luma工作期間,他有機(jī)會(huì)和一群出色研究者一起工作,并幫助搭建了一些很多人原本認(rèn)為不可能由這樣規(guī)模公司完成的系統(tǒng)。
不過(guò)在與這家公司并肩作戰(zhàn)接近三年后,宋佳銘決心離開(kāi)。
目前,宋佳銘的LinkedIn職業(yè)信息已更新,他已于本月離職。
但尚未未標(biāo)注其新任職公司或任何創(chuàng)業(yè)計(jì)劃。
宋佳銘
宋佳銘的核心標(biāo)簽,是擴(kuò)散模型落地時(shí)代的開(kāi)創(chuàng)者。
最重要的工作是他2020年作為一作提出的DDIM。
這篇論文與DDPM共同奠定了擴(kuò)散模型在圖像生成領(lǐng)域的理論基礎(chǔ),直接影響了后來(lái)Stable Diffusion、DALL-E、Midjourney等產(chǎn)品的技術(shù)路線。
可以這樣說(shuō),沒(méi)有DDIM,生成式AI的爆發(fā)可能要晚很多。
除DDIM外,宋佳銘也參與了SDEdit等早期擴(kuò)散模型代表性工作。
![]()
時(shí)間線往前拉,宋佳銘的履歷也一直沿著機(jī)器學(xué)習(xí)和生成模型展開(kāi)。
宋佳銘生于1994年。
2012年至2016年,宋佳銘就讀于清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系。
本科畢業(yè)時(shí)獲得OutstandingHonor,排名Top1%。
在清華期間,他曾與清華教授朱軍、杜克大學(xué)教授Lawrence Carin合作。
本科畢業(yè)后,宋佳銘進(jìn)入斯坦福大學(xué)計(jì)算機(jī)系攻讀碩士和博士,導(dǎo)師為Stefano Ermon,專攻生成模型、概率建模與計(jì)算機(jī)視覺(jué)方向。
在正式進(jìn)入工業(yè)界之前,宋佳銘已有多段研究經(jīng)歷。
2016年,他在曠視實(shí)習(xí);2017年,他曾OpenAI擔(dān)任研究實(shí)習(xí)生;2018年,他又在Meta FAIR實(shí)習(xí)過(guò)。
2021年至2022年,他在斯坦福大學(xué)計(jì)算機(jī)系做博士后研究。
2022年,他加入英偉達(dá)擔(dān)任研究科學(xué)家,后升任高級(jí)研究科學(xué)家,期間參與了英偉達(dá)的人工智能基礎(chǔ)研究工作,特別是“Picasso”項(xiàng)目。
2023年,宋佳銘跳槽到Luma AI,擔(dān)任首席科學(xué)家。
![]()
宋佳銘參與過(guò)的工作,一路從DDIM、SDEdit,走到了今天的多模態(tài)基礎(chǔ)模型。
讓人不禁感慨,AI行業(yè)這幾年變化快得有點(diǎn)不真實(shí)。
前一年大家還在討論文生3D,下一年視頻生成突然爆發(fā),再過(guò)一年,多模態(tài)和世界模型又成了新的方向。很多曾經(jīng)炙手可熱的概念,很快就被下一輪技術(shù)浪潮推著往前走。
方向在變,公司在變,技術(shù)工作者也在不斷學(xué)習(xí)、不斷流動(dòng)。
有時(shí)候甚至?xí)X(jué)得,整個(gè)行業(yè)像一列始終沒(méi)有減速的高速列車(chē)。人們一邊追趕新的模型、新的參數(shù)、新的敘事,一邊又不斷和上一輪熱點(diǎn)告別。
很多曾經(jīng)具體而鮮活的名字,沒(méi)過(guò)多久,就會(huì)變成上一輪AI浪潮里的注腳。
而新的浪潮,還在繼續(xù)往前推。
參考鏈接:
https://www.linkedin.com/in/jiamings/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.