ChatGPT里的清華元素
* d; H8 g: `$ U- S
OpenAI旗下大語言模型ChatGPT的成功讓人眼前一亮,更讓外界意想不到的是,這個產(chǎn)品不是出自擁有數(shù)千名人工智能團隊的谷歌或者Facebook,而是僅成立8年只有三百多人的OpenAI。 6 s8 _5 J/ } u7 o# d3 \, o
來自全球各地的頂尖人才為OpenAI和ChatGPT的成功奠定了基礎(chǔ)。今年1月,OpenAI創(chuàng)始人及CEO奧特曼透露公司員工人數(shù)為375人 ,與谷歌和臉書等科技巨頭從事人工智能工作的數(shù)千名員工相比,這是一個很小的數(shù)字?!拔抑牢也粦?yīng)該吹噓OpenAI,我們要感謝我們所有的外包公司為訓練模型提供了必不可少的數(shù)據(jù)?!?/font>
6 ^& {+ ~1 L- s/ _ F7 ]2 |: K4 u
而真正在ChatGPT項目中做出貢獻的人員,據(jù)OpenAI官網(wǎng)顯示,共有87人。ChatGPT只是OpenAI其中的一個項目,比如OpenAI之前發(fā)布的文本生成圖像的大模型DALL-E,兩個半月注冊人數(shù)突破100萬,也在人工智能領(lǐng)域備受關(guān)注。
$ Y& W- K% S j9 G/ I
在最近一份由智譜研究聯(lián)合AMiner發(fā)布的《ChatGPT團隊背景研究報告》中,這群人的顯著特征被歸納為了“年紀很輕”、“背景豪華”、“聚焦技術(shù)”、“積累深厚”、“崇尚創(chuàng)業(yè)”和“華人搶眼”幾個方面。
( V* i; C: Z% F0 X2 }
智譜研究發(fā)布的報告顯示,該團隊平均年齡為32歲,“90后”是主力軍。作為全球人工智能頂尖研發(fā)團隊,其成員絕大多數(shù)擁有名校學歷,但也并非“清一色”研究生學歷,而是本、碩、博人數(shù)相對均衡。同時,其成員大多具有全球知名企業(yè)工作經(jīng)歷,其中,從谷歌跳槽而來的有10人,是為其貢獻最多人才的外部企業(yè)(ChatGPT基于的也是谷歌提出的Transformer模型)。作為應(yīng)屆生直接加入ChatGPT 團隊的也有11人,但不論是來自其他企業(yè),還是作為應(yīng)屆生加入的人員,背景都相當“豪華”。
% A- u+ A+ y4 u+ Q( o& F( y
而在技術(shù)上,該團隊共有包括OpenAI 聯(lián)合創(chuàng)始人Wojciech Zaremba在內(nèi)的5人入選了今年“AI 2000 全球人工智能學者”名單。該名單由AMiner 每年推出,評選出全球人工智能 20個細分領(lǐng)域前 100 名最具影響力學者。這意味著,在 ChatGPT 不足百人的團隊中,就有 5 人屬于全球人工智能各領(lǐng)域頂尖學者,技術(shù)積累深厚。
+ D0 P/ _$ U% _+ Q, |3 A5 s& D: z* x
此外,最值得一提的是,華人成為了該團隊中一支重要的科技創(chuàng)新力量,共9人,占團隊總?cè)藬?shù)的比例超10%。華人學者歐陽龍更是參與了與 ChatGPT 相關(guān)的 7 大技術(shù)項目中的 4 大項目的研發(fā),是InstructGPT 論文的第一作者,也是RLHF 論文的第二作者。“可見他是這兩個關(guān)鍵技術(shù)項目的核心人員。”智譜研究分析稱。 _) z& F q* t) t: @# R1 i2 {
在華人團隊中,有5人本科就讀于中國內(nèi)地高校,其中3人(翁家翌、趙盛佳、袁啟明)均來自于清華大學,并各有1人本科畢業(yè)于華中科技大學、北京大學/香港大學。不過,這5人后續(xù)均在海外高校繼續(xù)深造。 ' i. x+ O4 q7 d7 x! ?% K
其中,翁家翌是ChatGPT團隊里最年輕的研發(fā)工程師之一。他于2020年從清華大學計算機系本科畢業(yè),進入卡內(nèi)基梅隆大學攻讀碩士學位。在清華期間,翁家翌曾加入清華大學人工智能研究院基礎(chǔ)理論研究中心主任朱軍領(lǐng)導的TSAIL實驗室,并在大三暑假加入加拿大圖靈獎獲得者 Yoshua Bengio 的實驗室,深入開展RL和NLP的研究。其更是一度以本科生身份,成為基于 PyTorch 的強化學習算法庫 Tianshou(天授)的第一作者。
$ J2 p) O% ?+ [ D2 O. p0 i
清華大學也以3名成員的數(shù)量,與卡內(nèi)基梅隆大學一起,并列ChatGPT團隊畢業(yè)院校的第7名。排在他們之前的分別是斯坦福大學(14 人)、加州大學伯克利分校(10 人)、麻省理工學院(7 人)、劍橋大學(5 人)、哈佛大學(4 人)和佐治亞理工學院(4 人)。 * \6 W1 L$ _! T
, A9 E3 K" \ M+ g " e7 O$ H# Q4 H5 j9 q! E/ [8 z' x
清華走出的人工智能大牛
# j& O8 x. }% j. H) w1 \9 ]" J- {
ChatGPT團隊中出現(xiàn)不少的華人力量和清華元素令人意外。但實際上,華人尤其是清華系,早已成為全球人工智能領(lǐng)域中的一個中堅力量。 % q& y, N- `& V3 {1 }
2021年,AMiner曾根據(jù)AI2000人工智能全球最具影響力學者榜單,結(jié)合學者H-指數(shù)、論文數(shù)和影響因子,并經(jīng)過去重處理后發(fā)現(xiàn),過去十年,全球為AI發(fā)展貢獻了力量的高層次學者共有1833位。這些人工智能領(lǐng)域的技術(shù)大牛共覆蓋了37個國家,其中,美國1244人,占比62.2%,中國以196名位列第二,遠超以113名排在第三的德國。
1 X9 _% }4 }! H6 |3 w
而在這196名華人學者中,無論是本碩博畢業(yè)院校,清華大學都排在最前列。如本科畢業(yè)于清華的有41位,排在其后的分別是中國科技大學(21位)、北京大學(19位);碩士階段畢業(yè)院校中,國外的麻省理工和伊利諾伊大學進入前十;到博士階段,排名前十的院校中,國外高校整體數(shù)量則進一步增加到一半占比。 4 y: }6 I$ B+ J
類似的情形依然還在上演。在最新的“AI2000全球人工智能學者”名單人工智能細分板塊下,以“在某個領(lǐng)域的頂級期刊和會議上發(fā)表的論文的總引文數(shù)”作為排序標準的榜單前100學者中,共有19名華人,占比約為兩成,前10榜單中,華人學者占比更是達到了四成。 ) T3 n. j/ x, X# m
其中,位列第一的何凱明,本科就讀于清華大學,博士畢業(yè)于香港中文大學多媒體實驗室,并在2011年加入微軟亞洲研究院(MSRA),主要從事計算機視覺和深度學習研究,后來又在2016年,加入Facebook AI Research(FAIR)擔任研究科學家。
: ~; X0 ~0 S0 |' H7 ~4 z
" U% n) x9 h+ R t M3 j }% ]* P: \
國內(nèi)人工智能的創(chuàng)業(yè)公司里也有不少清華的身影。
& F( \) n t! c* M
被稱為“AI四小龍”的曠視科技,其CEO印奇、CTO唐文斌和高級副總裁楊沐均畢業(yè)于清華大學計算機科學實驗班,也即傳言中“狀元擠破頭都進不去”的“姚班”,師從2000年圖靈獎獲得者,同時也是唯一一個獲得該獎項的中國人——姚期智。而當他們在2011年創(chuàng)業(yè)時,印奇才不過23歲,唐文斌24歲,楊沐22歲。 % q o e: K$ e! d$ c6 Z2 B
同屬于“AI四小龍”的商湯科技,雖然創(chuàng)始人湯曉鷗并非出自“清華系”,而是在中科大完成本科學業(yè)后外出留學,但聯(lián)合創(chuàng)始人之一的楊帆卻先后在清華大學獲得了電子工程學學士學位及碩士學位,001號員工徐持衡則是在高二通過奧賽保送至了清華,并在2013年大學畢業(yè)后加入湯曉鷗的實驗室,后來成為商湯科技的聯(lián)合創(chuàng)始人、001 號員工。而在去年從商湯執(zhí)行研究總監(jiān)崗位上離職回到母校任職的代季峰,同樣來自于清華,并在清華一路攻讀到博士以后,一度進入微軟亞洲研究院工作5年之久。
( d+ h. F* ^) }- g9 |7 H
不過,無論是商湯還是曠視主攻的方向是機器視覺,而不是自然語言處理。而這兩家企業(yè)也遇到了人工智能技術(shù)不好落地和商業(yè)變現(xiàn)難的窘境,一直以來虧損比較嚴重。 - S, Q2 z# }7 r" r, w9 L
在此之外,據(jù)不完全統(tǒng)計,包括同是“姚班”學生的小馬智行聯(lián)合創(chuàng)始人兼CTO樓天城、英語流利說創(chuàng)始人兼CEO王翌、地平線聯(lián)合創(chuàng)始人兼CTO黃暢、兆易創(chuàng)新創(chuàng)始人兼CEO朱一明、被賽靈思收購的深鑒科技創(chuàng)始團隊姚頌、汪玉、韓松、單羿等諸多人工智能領(lǐng)域創(chuàng)業(yè)公司的創(chuàng)始人和聯(lián)合創(chuàng)始人均畢業(yè)于清華。而在更早之前的搜狗創(chuàng)始人王小川也是畢業(yè)于清華大學計算機系。
; K! M+ m% {% d% M" W+ p
各大廠的AI業(yè)務(wù)線同樣有不少來自清華的大牛。如華為云人工智能領(lǐng)域首席科學家田奇,阿里巴巴平頭哥首席科學家、達摩院高級研究員謝源,京東集團副總裁兼京東人工智能研究院常務(wù)副院長、深度學習及語音和語言實驗室負責人何曉冬等。 |