【SmartM解讀】「卷積神經網路之父」楊立昆在AI領域成就斐然,30年前研究如今成為自駕車核心,並開發臉書重要搜尋技術「DeepFace」,對AI的未來想像,楊立昆相較科技大老顯得謹慎。
臉書人工智慧研究院院長楊立昆首度來台,掀起全台產官學界朝聖熱潮,也照映出台灣投入AI戰場的焦慮與熱度;究竟,想跟上AI熱,台灣的能與不能是什麼?楊立昆30多年前的構想,讓筆跡辨識、影像辨識甚至自駕車成為可能。這位堪比大神的人工智慧學者點出,下一個人工智慧突破口,就在「常識」。台灣掌理AI發展政策的舵手之一、科技會報辦公室執祕及資策會董事長郭耀煌則說,形塑生態系、導入各領域的應用,甚至統整型研發服務公司等,都有台灣的機會在其中。
「這是我的中文名字,楊立昆。」秀出三個龍飛鳳舞的書法大字,6月29日,臉書人工智慧研究院(FAIR)院長楊立昆(Yann
LeCun)在台大舉行演講。這是他上任以來,第一次在台灣的公開行程,原本預計僅1場公開演講,擴大到3場,除了台大外,在交大及成大也開講,報名人數超過1000,直播影片瀏覽率超過7萬。短短4天,在學界造成一股旋風。
演講會後,學生爭相合照,不少人捧著楊立昆多年前發表的一疊論文,請他簽名;甚至有慕名而來的學生南北三場跑透透,就為了能問上一個問題。
楊立昆來台的這個盛夏,也正好是台灣人工智慧(AI)最蒸騰的時候。除了PTT創辦人杜奕瑾回台創業,政府科技政策的相關場合,更是三句不離AI,楊立昆自然成為各界爭相請益的對象。
除了演講,他馬不停蹄,接連拜會了科技部及資策會,多年前曾與楊立昆共事的科技部部長陳良基,更特別希望他能促成臉書與台灣的合作。
祖克柏點名,90人神祕研究單位,強攻影像辨識
面對官員與學子的焦急熱切,楊立昆也樂於提出建言,「未來每支手機裡,可能都有AI晶片。」一再提到台灣半導體將扮演AI重要角色。這個想法,讓資策會董事長,同時也是行政院科技會報辦公室執行祕書的郭耀煌很贊同,但他也強調軟硬整合,「台灣必須建構自己的AI生態系。」
這股堪比搖滾巨星的追星熱,不只因為楊立昆在臉書任職的光環,更因為他在人工智慧領域宛若「大神」的成就——深度學習重大模型「卷積神經網路」(CNN)之父。
2013年,臉書執行長馬克.祖克柏請來任教紐約大學的楊立昆,從3個科學家、7個工程師開始,組織FAIR,如今人數已經破90人,是臉書最神祕的研究單位。
「前天(6月27日),臉書用戶達到20億人。」演講一開始,楊立昆帶著微笑宣布社群帝國的最新疆土範圍。這些用戶每天上傳到臉書的照片高達10至15億張。而影像辨識,也正是臉書在人工智慧熱戰中,需要楊立昆助陣的關鍵。
在演講場合,楊立昆無一例外會播放一段有點年歲的影片。鏡頭前年輕的他微笑著,將一排手寫數字放在電腦一旁的鏡頭下,電腦運作數秒後,準確地辨識出影像中的數字,一個個顯示於下排,沒有一個數字失手。那是1993年,卷積神經網路首次出現的實際應用。
卷積神經網路是人腦神經網路相仿的深度學習架構,會將圖片分解成細至像素的微小區塊,擷取其中特徵並加以組合,比對有多少特徵與其他圖片相符,因為篩選條件可以重複使用,同理在聲波及筆跡中也適用。這套平行篩選機制,大大簡化了神經網路的訓練過程。
卷積神經網路也是楊立昆在深度學習領域初試啼聲的開始。他於1990年代任職於美國最大電信商AT&T的貝爾實驗室,那是發明電晶體與行動電話等20世紀重大科技的殿堂,可說是美國腦力密度最高的機構之一。
想法太超前,30年前心血,如今成自駕車核心
在這裡,楊立昆發表了卷積神經網路的基本架構,剛開始應用於手寫辨識,銀行而後採用他的技術,讓自動提款機可以辨識支票內容,這是第一次,卷積神經網路走出實驗室大門,在人類的生活中實現。
但是這一項發明,並沒有讓他聲名鵲起。2002年,AT&T因內部的矛盾,終止楊立昆的研究計畫,並解散他的團隊。加上技術趕不上想法,能使這套模型實現的電腦以及資料規模並不存在,很多學者並不能理解卷積神經網路的運作機制,而質疑楊立昆的研究,當時,他甚至被數個重要學會以及期刊擋在門外,拒絕他發表論文。
學術的孤獨對楊立昆來說不是新鮮事。1980年代他在巴黎讀書時,法國沒有人研究神經網路,美國也鮮有聽聞。「我只能自己做研究,連指導教授都找不到。」最後好不容易找到可以幫忙論文署名的教授,甚至看不懂他的研究。「我畢業後,那個教授反而開始研究神經網路。」楊立昆笑說。
面對各方不看好的懷疑論者,楊立昆選擇和以前一樣埋頭苦幹。他到了紐約大學任教,並創辦紐大的資料科學中心。時至今日,由於運算科技及資料的突飛猛進,楊立昆30多年前的心血重新獲得重視,被視為辨識語言及影像的重要技術架構。尤其2012年,當ImageNet視覺識別挑戰競賽中,卷積神經網路寫下圖片辨識率達85%的歷史紀錄,在兩年內錯誤率從28%大幅降低至15%,讓楊立昆頓時炙手可熱。
楊立昆博士後的指導教授、也是人工智慧教父級人物的多倫多大學教授辛頓(Geoffrey
Hinton),形容楊立昆是「舉著火炬度過黑暗時代」。從早期的支票辨識,到谷歌旗下安卓手機作業系統的辨識語音功能、百度的影像搜尋系統等,卷積神經網路的身影無處不在,都有賴楊立昆的奠基。
更讓人振奮的應用,當屬自駕車。
輝達的自駕車計畫,以及英特爾以153億美元購併的以色列新創MobilEye,都是利用卷積神經網路辨識道路影像。「之後進一步拓展到更多領域,也許未來在醫療上,放射科影像可以交由電腦來判讀了!」技術一步步發光發熱,楊立昆看到的人工智慧疆土,比20億臉書人口還要廣袤。
「當祖克柏說:『我相信你可以成立一個全世界最好的AI研究所。』我覺得這是很有趣的挑戰。」祖克柏承諾了龐大的企業資源,雖然FAIR成立目的在於探究人工智慧領域所有的問題,但楊立昆很快就讓臉書這個巨大的人際網路機器,開始學會如何聰明地思考。
「DeepFace」技術,一張照片,只要2秒就能識別人臉
楊立昆走馬上任半年,2014年6月,FAIR發表了一篇文章,講述「DeepFace」技術可讓人臉辨識精準度達97%。如今,DeepFace已經是臉書照片標記功能的重要引擎,每一張照片在2秒鐘內會通過兩層卷積神經網路,檢測物件並識別人臉。
對走過業界及學界的楊立昆來說,沒有比坐擁龐大用戶資料的臉書更讓人興奮的試驗場域。「如果我們有一個可行的想法,在一個月之內這個想法就會在15億人面前化為真實。」他在先前接受外媒訪問時提到,「我們要看著遠方地平線的目標前進,但途中也可以開發很多短期能夠實現的應用。」
人類還在遙望的地平線,是人工智慧的「常識」。「常識」是人類的直覺,卻是AI的盲區。目前AI可以認知,但推理與規劃能力卻不盡成熟,無法做出準確的預測並行動。
「現在即使是最聰明的AI,都還很笨拙。」楊立昆舉例,「如果說『這個行李箱裝不下獎盃,因為它太大/太小了。』人類可以知道,『太大』的『它』是指獎盃,『太小』的『它』是指行李箱,但是AI無法憑單一文句辨識。」
AI要如何才能具備常識?或許第一步就是脫離人類的監督。舉例來說,目前AI學習型態大多為監督式學習,由千張圖片去得出特徵;或者是加強式學習,AI一次次接受資訊做出判斷,並藉由判斷的是非之中形塑認知。
這兩種訓練方式若非人類給予AI資訊,就是AI必須給出回饋,更需要標籤並分類資訊才能進行。「未來幾年的挑戰,是讓AI學會從原始資料中學習,就像人類學習的方式。」
團結力量大,公開研究原始碼,促進人工智慧發展
而要走到遠方的AI地平線,楊立昆認為必須團結前行。FAIR在他主掌之下,在開源社群GitHub公開不少研究的原始碼。「這是我們這個時代最大且最複雜的科學挑戰,不是任何一個組織、單位,或是一家大公司就可以單獨解決。必須是所有研發單位的集體努力才有可能達成。」
此趟來台,眾人莫不想請大神描繪出未來藍圖。但曾歷經AI寒冬的楊立昆,對於未來的想像,反而不像科技大老一樣豪邁,他寧可謹慎一點。
「科技產業經常高估了短期發展,低估了長期發展。AI的革命時間點很難預測,當我們承諾得太高,(大眾)就會出現反彈。」畢生研究如何讓機器思考,但站在AI研究巔峰,楊立昆看到的,仍舊是人的不可預測。
[IMG::14538,624,313::IMG]
[IMG::14541,624,971::IMG][IMG::14539,624,313::IMG][IMG::14537,624,217::IMG][IMG::14540,624,313::IMG]
延伸閱讀
黃仁勳:人工智慧終極目標—機器人
原文出處
今周刊
↧