熱門測算
八字精批 紫微鬥數 八字合婚 終生運勢

道家八字的博客

解夢佬

“上海恐怕是世界上唯一會有人在街頭攔住我并索要我的簽名的城市,在美國只有電影明星才有這種待遇,科學家是沒那麼多人追捧的。這種熱情令人難以置信。”

近日,談及中國粉絲對于自己的喜愛,楊立昆(Yann LeCun)在接受 DeepTech 采訪時表示。

道家八字的博客

圖 | 楊立昆接受 DeepTech 專訪(來源:DeepTech)

最早在 2009 年,楊立昆曾應邀前往北京大學進行演講。隨后十多年間,他曾多次造訪北京、上海等城市,熱情的學生紛紛與他合影并索要簽名。

近年來,中國學者開始在人工智能(AI)領域嶄露頭角,各大計算機頂會上都能見到國內作者發表的高質量學術論文。楊立昆也注意到了這一點,并給予高度評價。

他認為世界上還沒有一個地方像中國那樣,讓機器深度學習成為國家級優先項目,并成為公眾矚目的焦點。更重要的是,中國年輕人對科學和工程的濃厚興趣,讓他印象深刻。

自幼喜歡科技,長大后與辛頓 “雙劍合璧”

在計算機從業者群體中,楊立昆這個名字幾乎人人皆知。作為 2018 年的圖靈獎得主之一,他與杰弗里・辛頓(Geoffrey Hinton)、約書亞・本吉奧(Yoshua Bengio)一起被譽為 “深度學習三巨頭”。

當今,許多 AI 應用都離不開 “三巨頭” 構建的深度學習理論基礎和指導框架。而楊立昆的主要貢獻是大幅完善了卷積神經網絡(CNN),并將其用于計算機視覺領域,極大地拓寬了應用范圍。

近年來,神經網絡紅極一時。但在 20 多年前,計算機學界和產業界都對它完全提不起興趣,甚至是嗤之以鼻。

在長達快 15 年的神經網絡 “寒冬” 里,學術會議多次拒收神經網絡論文,也沒人愿意公開支持、甚至不愿公開談論有關神經網絡的話題,這讓卷積網絡一度成為大家口中的笑話。

至于具體原因,楊立昆自己也說不清楚,他說:“這是一個謎,我認為科學史學家和社會學家有責任解開這個謎團。”

道家八字的博客

圖 | “深度學習三巨頭”:楊立昆,辛頓和本吉奧(來源:Facebook、Google、Botler AI)

從自己做研究、到成為 “技術布道家”,楊立昆雖是中年成名,但其根源可追溯到童年。

1960 年,楊立昆出生在法國巴黎附近的郊區,父親是一名航空工程師,酷愛 DIY 遙控汽車和遙控飛機等電子產品,同時他父母也都是科幻小說迷。這讓他在童年時就對科技、太空和計算機充滿了好奇和熱情。

18 歲,他進入巴黎高等電子與電工技術工程師學院(ESIEE)。大學五年,沒有課的時候他就泡在圖書館里,從人類的語言機制,到大腦的工作原理,再到系統理論(控制理論)、自組織、自動化等一系列晦澀深奧的內容,他都悉數吸收。

當時,“人工智能”“機器學習” 和 “神經網絡” 這些概念都已出現。他認定,如果想讓計算機變得更聰明,模擬人類大腦運作方式的神經網絡將是可行的方向。

1982 年前后,大四的楊立昆構想出一種可在網絡中實現從后向前傳遞信號的算法,并將其命名為 HLM 算法(多層線性模型),今天廣泛使用的 “梯度反向傳播算法” 就是在 HLM 基礎上發展而來。

不過彼時 “神經網絡” 研究在法國幾乎處于停滯,這讓楊立昆頗為苦惱。機緣巧合之下,他在一場國際會議上見到了杰弗里・辛頓(Geoffrey Hinton),兩人很快意識到,盡管他們此前從未謀面,但卻有著相同的興趣和研究思路。

“雙劍” 很快 “合璧”,博士畢業的楊立昆受辛頓之邀前往加拿大多倫多,共同研究神經網絡和反向傳播。同一時期,在加拿大蒙特利爾,楊立昆認識了當時還在讀研的約書亞・本吉奧(Yoshua Bengio),后者對神經網絡的了解讓楊立昆十分佩服,日后的 “三巨頭” 終于相互見面。

道家八字的博客

圖 | 1990 年,楊立昆在 AT&T 貝爾實驗室發表的用神經網絡識別手寫字符的論文(來源:資料圖)

從 1985 到 1995 年,神經網絡經歷了相對繁榮的十年。對于楊立昆來說,他的科研生涯也在美國貝爾實驗室迎來了小高潮:入職僅兩個月就開發出擁有 6.4 萬個連接的 LeNet 卷積神經網絡,主要用于識別手寫字符。

最終,LeNet 的升級版 LeNet5 擁有 34 萬個連接,被部署到一個銀行支票數字讀取系統中,應用于美國和法國的許多自動取款機中。

這是卷積網絡的首次商業應用,直到 20 世紀 90 年代末,美國所有支票的 10%-20% 都是由它處理的。

可惜高光時刻未能延續太久,隨著貝爾實驗室隸屬的 AT&T 公司拆分,混亂的管理和權力分劃讓人無暇顧及這個渺小的、不能賺大錢的系統。

中年被裁,經歷十五年的 “神經網絡寒冬”

隨后,“神經網絡寒冬” 降臨,從 1995 年開始,持續了近 15 年。

“有五年多的時間,我們幾乎沒有再涉足機器學習的研究,只是發表了幾篇整理性質的論文,” 楊立昆回憶稱,“于我而言,這些論文就像是天鵝臨死前的最后哀鳴。”

當時,他先是被 AT&T 裁掉,之后在日本 NEC 公司的普林斯頓研究中心也承受著研究快速落地和變現的壓力,并不能潛下心來做科研。

于是在 2003 年,他決定應聘紐約大學的教授職位,這樣至少可以安穩地做研究。

由于業界對神經網絡不夠重視,從 2004 到 2006 年,楊立昆、辛頓和本吉奧的論文幾乎被所有機器學習領域的重要會議拒收,比如 NIPS 和 ICML,而 CVPR 和 ICCV 這樣的偏應用領域的大會也不太歡迎神經網絡。

“寒冬” 中三人抱團取暖,他們還借鑒 “深層政府(deep state)” 這樣的陰謀論,自嘲為 “深度學習陰謀” 小組。

熟悉楊立昆的人都知道,他是個性非常鮮明,說話直言不諱的人,對自己的想法堅信不疑。此前,他在推特上與各路網友爭論并連發數十條推文,甚至一度表示要 “徹底告別推特”。

這種特立獨行的性格孕育他逆行的勇氣,使他在無人看好神經網絡的年代里,仍然全身心投入其中。

道家八字的博客

圖 | 2005 年,楊立昆等人將神經網絡技術用于無人車避障(來源:資料圖)

2006 年,有關深度學習、神經網絡等概念的論文逐漸被機器學習大型會議接受,雖仍有不小阻力,但至少不再像以前那麼排斥。這離不開他們仨多年來的奔走疾呼,以及默默耕耘出來的研究成果。

自 2003 到 2013 年的十年間,楊立昆一直在紐約大學實驗室里默默地擴展卷積網絡的應用范圍。

物體識別、面部檢測、人臉識別、機器車的主動避障和自動駕駛、生物和自然物體圖像的語義分割,這些即便在今天都很 “新鮮” 的技術,其實早在 10-20 年前就已被他挨個實現。

2013 年前后,隨著計算機硬件的進步(尤其是業界對 GPU 的應用)、以及數據量的爆炸式增加,楊立昆等人終于迎來春天。

后面的故事我們都知道了,由神經網絡驅動的模型開始橫掃各種比賽,以超出傳統方法數倍、甚至數十倍的表現成為了計算機科學界的 “新寵”。

“我想人們更了解 AI”

2019 年底,楊立昆將自己的科研生涯、人工智能技術的底層原理、以及自己對人工智能現狀和未來的思考著成法語版《科學之路:人,機器與未來》一書。如今,中文版先于英文版問世。

道家八字的博客

圖 | 楊立昆的書(來源:中信出版集團)

“我想讓人們更加了解深度學習和人工智能是什麼,而且毫不掩飾其中的復雜性,” 楊立昆解釋自己著書的初衷,“人工智能已經在影響人們的生活,在未來可能會帶來更大的影響,因此人們需要了解它是如何工作的。這本書兼具自傳和科普屬性,可以讓喜歡敘事與喜歡科學邏輯推理的人同時享受深入機器的科學之旅。”

從最基礎的學習機和感知器,到監督式學習,再到深度網絡和和卷積神經網絡,最后到無監督學習,這幾乎是數十年來最引人注目的機器學習技術的進化過程,包括反向傳播、CNN、ResNet、GAN 在內的一系列經典算法和模型悉數出現。

乍看之下,這些內容背后充滿數學模型和函數運算,令人望而生畏。但通過簡單易懂的案例,帶有注釋的偽代碼,以及環環相扣的推導,楊立昆希望讓不同背景的讀者都能明白人工智能的實現過程。

在許多理論和術語第一次出現時,楊立昆就給出了通俗的解釋,連一元一次方程都有解釋,細致程度堪比教科書。他告訴 DeepTech:“我的目標是,如果你有高中數學水平,那麼理解書中的數學概念就不在話下。即使跳過數學,也不影響對內容的理解。”

例如在理解自動駕駛的原理時,即使 “向量”“梯度”“維度” 之類的概念看得似懂非懂,也可以借助 “車輛壓到左側白線,因此要向右調整” 等通俗直白的解釋搞清楚原理。

當然,現實情況比理論復雜的多,瞬息萬變的路況、各國不同的交通法規、以及不守交規的情況都會打破人工智能模型所熟悉的 “完美的世界”。因此,只有了解技術背后的原理,才能知道它的極限所在。

道家八字的博客

(來源:Pixabay)

過去五年,許多人對自動駕駛和無人駕駛的普及充滿了樂觀,按照一些媒體和企業 2015 年的預測,2020 年就應該有數千臺無人駕駛汽車(L4 以上)行駛在路上,但現實并非如此,連 L2、L3 級別的輔助駕駛都時常出現問題。

其實,自動駕駛本質上是一個 AI 完備問題,不能單靠計算機技術來解決,而是必須有人類介入。

“AI 需要人類的常識(common sense)才能解決這類問題,” 楊立昆表示,“知道了這一點,才能明白為什麼無人駕駛不會普及得那麼快。”

他還表示:“我認為如果你想在 AI 領域創造價值,計算機知識固然重要,但量子力學、運籌學和信息學的知識更加重要,尤其是它們背后的數學。”

楊立昆:自我監督學習模型是目前最有前景的 AI

對于大多數人而言,最好奇的問題可能是人工智能的未來是什麼樣子?何時才能實現?

楊立昆告訴 DeepTech:“我們希望 AI 具備接近人類的智能,那麼它就需要具備常識,才能讓所有期待成為可能。”

所謂常識,就是人類在與物理世界交互的過程中自然而然形成的觀念和認知。比如兩個月左右的嬰兒就已經知道物體之間可以相互遮擋,被擋住的物體仍然存在,而非憑空消失;九個月大的嬰兒,就已經知曉了重力和慣性等物理概念的存在。

如果有違背普遍規律的事情出現,不會說話的嬰兒會睜大眼睛,做出一副不可思議的表情。

人類大腦的這種學習能力,是楊立昆等 AI 科學家想要復刻的。但目前在機器學習領域,無論是監督學習還是強化學習,都存在一定局限性,這給人工智能的進步設置了無形的天花板,結果就是人工智能對世界只有一個膚淺的理解,而不具備常識。

楊立昆認為,目前最有前景的實現方法是一種被稱為 “自我監督學習(Self-supervised Learning)” 的模型。這是他近幾年大力支持且深度參與的研究方向,多次將其稱為 “智能世界的暗物質”。

道家八字的博客

圖 | 2021 年 3 月,楊立昆在 Facebook AI 官方博客撰文介紹自我監督學習(來源:資料圖)

該模型的核心是在不提供標注數據的前提下,訓練 AI 的預測能力,可用于填補文本、圖像或視頻中的空白。

模型的背后,結合了感知模塊、世界模型和評判體系三大模塊:通過感知模塊獲得周圍環境的狀態信息,借助世界模型(函數)預測接下來可能出現的多種狀態,再交給評判體系(成本函數)預測目標未來的平均值,表示某個狀態對于世界狀態的發展是有利還是不利。

這套復雜的、具有預測能力的自主智能框架誕生的時間并不長,但已受到廣泛關注,在自然語言處理領域大放異彩的谷歌 BERT 模型,其背后原理(Transformer 架構)與自我監督學習一脈相承。

另一方面,訓練機器學習模型需要用到海量的數據,但楊立昆指出,無論你在媒體上讀到了什麼,大公司對自己的數據都有 “極強的保護欲”。無論是出于 “保護用戶隱私”,還是出于 “鞏固競爭優勢” 的目的,總之它們是不會隨便分享自己的數據的。

而自我監督學習模型可以有效減少對數據的依賴,幫助解決這個人工智能領域亟待攻破的挑戰之一。

開放的精神讓 AI 技術實現飛躍

至于何時 AI 才能具備常識,許多人認為,從 “沒有智能” 到 “擁有智能” 或許就在一瞬之間,比如某個顛覆性技術橫空出世,或者一覺起來,AI 機器人突然就完成了自我覺醒。

楊立昆坦言自己也無法回答這個問題,但可以肯定的是,這一過程絕不會是 “一夜之間出現的”。

他對 DeepTech 表示,“顛覆性技術是無法預測的,你永遠不知道什麼時候會出現。但我們搞懂 AI 的過程一定是循序漸進的。幾年后,我們或許能做出一個跟貓的智商差不多的 AI。至于跟人類智能相當的水平,可能要幾十年以后了。”

聽起來似乎有些悲觀,但其實許多媒體和企業通過營銷噱頭在一定程度上神化了 AI 的進展,使后者在公眾心中變得過分樂觀,甚至出現了對 AI 的恐懼和末日論。

作為一個堅守立場并已度過 “AI 寒冬” 的科學家,楊立昆毫無疑問對神經網絡和人工智能持積極態度,其評價也更客觀。

他表示自己很欣慰能看到 “日益開放的研究氛圍”,因為只有整個行業持續保持開放的精神,才能涌現出越來越多的優秀成果。

我們看到的開源和開放精神,也就是最近七、八年流行起來的,十多年前并不是這樣的。就算是現在,許多在 AI 研究上投入巨大的公司也更喜歡保密,然后開發基于人工智能的消費產品,以獲得競爭優勢。

但楊立昆認為這并不代表巨頭就能形成壟斷,因為 “創新的想法可以誕生在任何開放的環境中”,小企業也可以憑借優秀的研究成果謀得一席之地。

“這本質上是公司文化決定的,需要全球性的努力,” 他補充稱,“好消息是,我們看到越來越多的公司在推進開放精神,有歐美公司,也有中國公司。”

楊立昆由衷希望這個趨勢能繼續下去,只有這樣,才能激發更多科學家去發掘人類智能的奧秘。

本文來自:解夢佬,原地址:https://www.jiemenglao.com/suanming/418271.html