專訪comma.ai創辦人George Hotz:聯發科,請給我好的晶片!

本篇作者賽芭(Saber),本名黃紹博。曾任職於明基電通數位媒體事業群業務部門,仁寶電腦全球客服部門,保誠人壽業務主任,富邦金控外匯交易員。對經濟運作與金融活動有很大的興趣,以投資理財為個人志業,相信透過總體經濟的觀察與認知,可以在資產配置與資金控管上創造更高品質的財務決策。創辦台灣 openpilot 同樂會,推廣開源自動駕駛系統 openpilot。

兩個星期之前,我永遠都不會相信,我們竟然能夠有與 George Hotz 共餐的機會。Hotz 在國際資訊軟體領域一直以 Geohot 享有盛名,除了他 17 歲青少年時期就獨自破解 iPhone 這樣的傳奇事蹟,他還在 2016 年就成立 comma.ai 而跨入 AI 領域,開發自動駕駛系統。你可能更不會相信他擁有自己的 Hip hop 專輯。他也是一個崇尚自由主義,反對財團壟斷的思想家,是一個多才多藝屬於神人級的國際才子。

我在台灣成立 openpilot 同樂會到現在已經有三年的時間,openpilot 是一個開源自動駕駛與 AI 機器人的解決方案。當我一接觸到它,就深深被它吸引。俗話說「好東西要跟好朋友分享」,我從車友群開始推薦,一路到現在認識了各領域對 openpilot 有興趣的車友,與那些開始研究 openpilot 的工程師們。因為我們經常協助車友向 comma.ai 代購產品,這使得我可以跟他們保持聯絡。

一天,在與 comma.ai 尋常往來的出貨追蹤信件中,我們看到了當中一小段卻異常閃亮的文字「George 九月底會在台灣,他或許可以跟你們見面打聲招呼。」跟我一起合作的雲大 CloudJ 也看到,我們兩人差點都要尖叫出來。雲大很快的想跟他的群組講,但我阻止了他,如此重量級的人物來到台灣,行程一定是低調又保密。我們滿心期待的跟 comma.ai 小心確認,直到約訪日的前幾日,時間才被確認下來。

廣告

身為地主,能宴請國際嘉賓十分榮幸,我們向他提議了圓山飯店、山海樓或是備案鼎泰豐。他很快的就回答說他喜歡當地平民食物,他不喜歡太精緻的餐飲,而且他很喜歡鼎泰豐,comma.ai 的據點聖地牙哥也有鼎泰豐。我同時邀訪幾個都有使用 openpilot,而且對同樂會社群有幫助的成員一起參與。

約訪當晚,我刻意穿著 comma.ai 商店的品牌形象服裝,在餐廳門口,像小孩子一樣引領盼望。遠遠的我看到傳說中的 George Hotz 了。他穿著黑色全素的T恤,墨藍色的休閒褲,帶著 comma.ai 的帽子,他有著一般外國人高挺,留著很日常打扮的鬍鬚。他就是一點也不鋪張、不奢華,沒有鎂光燈照耀時,他就像你我一樣的平民百姓。

George 跟大家打聲招呼,你看得到他一開始害羞的樣子,他曾經在自己影片說過他不擅長跟人打交道。其實他非常聰明,又喜歡閱讀,腦袋的內容太多,要解釋他的想法給對方理解,對他來說肯定過於勞累,聽的人也是無法快速跟上。但是我們身邊的工程師與教授只要跟他討論有關 AI 的技術問題時,他的眼睛就開始閃閃發亮,變了一個人,他可以非常有邏輯又切中觀點的跟你對答,這時候他彷彿化身成科技殿堂的巨人,面對各種問題他都能很快地給你適切的答案。

我們一邊用餐一邊自我介紹與聊天,他說:「我騎單車環島。」這時才知道,他來台灣環島與旅遊。台灣各地都有他騎行的蹤跡。知道這種科技巨頭來台低調旅行,一方面感到榮幸,一方面也感受到 Hotz 他經常訴求積極對抗財團在技術上的壟斷,主張開源與分享,一方面他私下生活又如此親民,完全是高度反差的形象。

用餐之後我提議向他採訪,他也欣然答應。我問他要不要先看過採訪提綱,他說:「不,我不需要先看題目,那會影響我思考,我喜歡直接回答。」這真是感人,我曾經有一些採訪經驗,採訪最怕就是做作,如果一切都先套好招,那就變成是演戲而不是採訪。像他這種提問一個問題,可以立即回答你 10 個答案的受訪者,困難的會是採訪者,而不是 George。以下就是我們的對話。

Saber:George,我有一個關於 C3X 的問題。我們都知道 comma.ai 在上個月推出了新的硬體 C3X。您能否介紹 C3X 關鍵的特點與創新?

George:正如你所提到的,首先它背面外觀上有波浪曲線。但是 C3X 上的大多數創新都無法從外部一言而見。大多數創新涉及到三個基本要素:簡化、成本和可靠性。就是將 Comma 3 變得更簡單、更便宜和更可靠。事實證明,同時實現這三個目標是可達成的。

George Hotz與C3X
George Hotz與C3X

通常,這三者存在著權衡的牽制因素,比如快、便宜和好,只能選擇其中兩個。但這些因素實際上都緊密關聯,與我們的理念很符合。我們從 Comma 3 開始,不斷問自己:「哪些部分是我們不需要的?」然後,我們去掉了所有不必要的部分,結果就變成了 C3X。此外,它還具有 Can FD(次世代的車用通訊規格),這是一個顯著的改進。

註:C3X 實際上就是美國現在科技業所謂的第一性原理的實踐,在我們這邊叫做大破大立的砍掉重練。

Saber:Tesla 的 FSD 每年都跳票,你們認為 comma 版本可與 FSD 匹敵的 Navigation of Openpilot 何時能克服挑戰,達到你們的預期?

George:我們已經在 openpilot 上推出了點到點導航功能(OP0.9.4),目前叫做實驗模式(experimental mode),很快就會改到輕鬆模式(chill mode)。有一點要注意,只有在打開實驗模式時,縱向功能才能有效運作,因為它需要以 E2E 的方式控制油門、剎車和方向盤(會有紅綠燈辨識、靜止車辨識、過彎減速等縱向等控制行為)。

所以,更精確的問法,應該是實驗模式何時能夠變得更加出色。是的,有兩個因素制約著實驗模式,就是訓練和推理。目前,我們使用模擬器進行 E2E 的訓練。但模擬器仍然具有一些手工編碼的特性,我們稱之為小偏移模擬器,它使用投影幾何學來重建道路。但是投影幾何學在許多方面都是錯誤的,你會需要深度訊息。

我們正在轉向一種看起來像 GPT 的架構,在一個完全由機器學習產生的模擬環境中駕駛。實際上,我們在 2016 年發表了一篇名為《Learning a Driving Simulator》的論文,該論文闡述了這種架構,7 年後我們才開始使其運作。一旦我們做到了這一點,我們就可以在這個新的模擬器中進行訓練。

另外,我還有一個論點,認為目前這些設備上的計算能力不足。因此,我們即將推出的產品,基本上就是購買任何遊戲筆記本電腦。所有的 Comma 3 和 C3X 都有一個擴展 USB 接口。是的,你只需將電腦連接到擴展 USB,將其放在座位下面,就可以足夠的算力,來運行一個比特斯拉 FSD 自動駕駛更出色的大型模型。

Saber:我們知道特斯拉開發了 Dojo 超級電腦,還有大約 1 萬片 H100,專門用來做 AI 訓練。相比之下,comma.ai 在算力的投資和基礎設施方面,面臨著什麽樣的挑戰?

George:我們可能有 100 片 H100 等效的計算能力,因此我們的計算能力比特斯拉少了 100 倍。但是我們在其他方面具有優勢。特斯拉在像素標記這樣的問題上,做出了我認為完全錯誤的選擇。特斯拉的神經網絡可以為每個像素輸出一個標籤,而我們並沒有類似的東西。我們迅速放棄了任何看起來像視覺空間本身的東西。儘管我們可能以後要重建,但是在不嘗試像素精確重建的情況下,我們需要的計算能力會遠遠少於特斯拉。

想想看,你的大腦並不會這樣做。一旦這些視覺訊號離開你的眼睛,就不再有類似圖片的東西了。尤其是經過幾層大腦的視覺皮層之後,你的大腦任何神經節點,都無法重建出像素精確的世界圖像。重建像素這個概念幾乎沒有意義。因此,這是我們在計算效率上勝過特斯拉的一種方式。

另一種方式是,他們似乎非常熱衷於在多鏡頭上使用非常高解析度的神經網絡。我們進行了實驗,我們只使用不到一半的解析度。Geohot 手指著 C3X 望遠鏡頭繼續說,這個相機的解析度非常高。是的,我們使用的解析度甚至不到相機解析度的四分之一,而且這只是活動區域的解析度。我們嘗試將解析度加倍,結果沒有任何區別。

我們還嘗試了一個實驗,將計算能力和神經網絡加倍,這的確有所幫助。所以,我們在計算能力方面受到的限制高過於鏡頭解析度,但是大幅度增加解析度會大大增加訓練的時間。你需要下載所有這些內容,你需要反向傳播到大型圖像。所以,再一次,通過使用相對低解析度的圖像,我們在效率方面獲得了另一個優勢。

我認為真正的問題是,「更多」總是更好的嗎?這並不總是正確的。Jonathan Blow 在他的演講中說,軟體就像氣體,軟體會擴展、填滿你放在其中的任何空間。如果你購買了 10,000 個 H100,你猜你需要多少個 H100 呢?這是否意味著你的軟體會更好呢?這不清楚。如果你曾經在 react 中編寫過任何東西,你就會看到它需要 100 毫秒來計算這個按鈕的按下。這只是因為你的軟體很糟糕。關鍵是軟體的效率,以及意識到很多這些問題都是尚未完全解決的研究問題。因為它們是研究問題,所以擴大規模沒有意義。

Saber:除了消費市場之外,comma 看到台灣在自動駕駛和人工智慧產業的軟體和硬體上,可以扮演什麽角色嗎?

George:我知道 S845 是一款韓國晶片,但我們所有的訓練晶片肯定都來自台灣,實際上我們想要購買的所有晶片都來自台灣。C3X 是一款 Snapdragon 845,它是在三星的 10 納米工藝上製造的。但是高通的所有領先產品,我們真正想要的新晶片是高通的 4 奈米晶片。顯然,TSMC 有 60 億次運算能力。但是你知道,很遺憾,與高通合作很令人討厭。所以我們希望有台灣的替代晶片,我們喜歡聯發科,應該把他們的天璣 9200 賣給我,不要說它只是專為亞洲的特定 5G 市場。

聽著,聯發科!是的,就是你聯發科。請給我好的晶片,我會讓你的軟體也變得更好。

Saber:我聽說你在 2015 年訪問了台灣,過了這麽多年,您有沒有特別難忘的旅行經歷或台灣文化的印象?

喬治:是的,我認為我們今晚也捕捉到一些進步的印象。我剛剛經歷了一個為期 9 天的環島自行車之旅。在台灣並沒有太大的困難和逆境,當你醒來,很快就有一條不錯的自行車道,還有很容易入住的酒店。是的,食物也很棒。各種方便之類的便利。我是說便利,甚至像便利商店,7-11 和 Family Mart 和 OK Mart 都遍布每個角落。順便說一下,你可以去那裡喝啤酒,你可以買一瓶 7-11 的啤酒,坐在 7-11 喝啤酒。像美國社會絕對無法做到這一點。

Saber:謝謝,我問完了所有問題。很高興見到你。

訪問之後,我們繼續跟 George 閒聊,他覺得台灣從北到南形成一個從設計到生產與封測的完整晶片聚落,是很不可思議的事情,他聽到我們描述台灣產業只重視硬體,對於軟體技術能力的培養卻乏善可陳,感到不可思議。

我們 openpilot 同樂會希望在台灣介紹更詳細的 openpilot 訊息。如果在台灣的晶片基礎之上,再加上 AI 軟體實力,就國家戰略來說,那無疑是如虎添翼。我這裡給各界高層的建議是,發展 AI 要有寬廣的胸襟,你若不擁抱開源,你成就不了大事,國際上對於 openpilot 已經有越來越多學術研究與開發。

台灣openpilot同樂會與George Hotz
台灣openpilot同樂會與George Hotz

我向 George 詢問是否有設立海外據點的可能,他喝了兩口 18 天台灣生啤酒對我說:「日本、南韓、馬來西亞跟新加坡都有可能,台灣也是選項之一。」我想起了他以前說過:「如果特斯拉的 FSD 是自動駕駛的 iOS,那 comma.ai 的 openpilot 就會是自動駕駛的 Android。」

現在,在我眼前的這位不是 17 歲破解 iPhone 的天才少年駭客。32 歲的 George Hotz,是自動駕駛與超高效能 AI 引擎 comma.ai 與 Tinycorp 兩家公司的負責人,我們將見證他改變世界的努力不懈。

核稿編輯:湯皓茹

《商益》主張「商業是最大的公益」,報導專注於讓讀者理解資本力量、商業本質以及財經語言。歡迎加入 Discord 社群,並免費註冊訂閱商益電子報

延伸閱讀:

Dojo給特斯拉一對翅膀!大摩看好超級電腦加快自駕開發,上調目標價至400美元
Tesla新款Model 3漲價策略:降價衝刺FSD+擴大中國電動車市佔
加州無人計程車解禁上路!自駕軟體技術已成下一個市場破壞者?
「全自動輔助駕駛」開放授權?分析:FSD 軟體可為Tesla帶來年營收200億