OpenAI 是 CloseAI?尹相志:任何強迫別人開源的都是耍流氓

尹相志為數據決策公司(DataDecison.ai,前身為亞洲資採)的技術長,在大數據領域和人工智慧技術上已經鑽研數十年,並且早早就提出在深度學習的時代不要再做斷詞,已預見如今大型語言模型將顛覆技術。《商益》專訪到尹相志,請他分享該如何正確理解 AIGC 的技術?以及將會帶來的產業衝擊。

圖片生成(Image generation)技術的兩大突破

尹相志提到圖片的生成技術其實早就有了,只是早期的技術能做到風格移轉,自己 2019 年也在上海參加過競賽和畫展,所以對於 AIGC(人工智慧生成內容,Artificial Intelligence Generated Content)的底層技術不陌生。此外,自然語言的研究和發展也一直都有,有了深度學習的技術,尹相志好幾年前早就提倡不要做斷詞,因為不夠聰明,幫助也不大。

不過當上述兩個技術結合在一起,如今像是 Midjourney 可以基於 Prompt(對 AI 下文字指令)以文生圖,這樣的發展仍然太超乎尹相志原本的想像和預測。回想早期的視覺呈現,就算只是風格移轉,每一次都要建模跟調整,高技術門檻也造成了推廣的困難。

如今透過自然語言的 Prompt,首先是可以控制的顆粒度夠細了,再來是玩家可以完全不需要涉及任何模型的修改,讓門檻大幅下降,所有的人使用一個基礎模型出發,再透過 Prompt 進行微調(fine-tune)。

以文生圖(Text to Image)技術的未來發展

當然,如何寫 Prompt 仍然是許多使用者目前在學習的「技術」,感覺還是有點門檻在,尹相志認為未來 AIGC 的技術還會怎麼發展呢?

廣告

尹相志提到,基礎模型雖然夠用,但應該會有一些更有效率的方式,來加入和維護特定領域的知識,例如某些公司的私有內部數據或特定罕見案例,要讓使用者可以基於向量的概念去提供這些知識。此外,像是 Stable Diffusion 雖然有一個主模型,但可以讓使用者去開發像是 LORA 這樣的小模型去把特定需求的知識保留下來。

那麼 Midjourney 和 Stable Diffusion 兩個以文生圖的主要工具,哪一個比較有發展性呢?

尹相志認為 Midjourney 目前走一條跟 ChatGPT 相反的回頭路。人類被 Google 訓練成要使用關鍵字當成指令去做查詢,但是 ChatGPT 卻讓我們可以用一般說話的方式去操作,也就是恢復成我們大腦所習慣的語言。

但 Midjourney 還是有大量的指令,不只是要記憶指令,還必須要很工程化的腦袋才有辦法熟悉,這就相當於在 Google 搜尋的時候,要下很正確的關鍵字才能產生預期的東西,所以尹相志認為 Midjourney 應該要能接受更自然的語言才對。

Stable Diffusion 的問題則在於開源,開源的概念很好,但如果沒有辦法保障商業利益的話,整個發展是會受限的。不過目前還在發展初期,像是 Stable Diffusion 需要算力,其實各家都在對模型做許多優化,尹相志預期對於算力的需求將來會降下來。

ChatGPT 帶來了能力的重新分配

相較於圖片生成技術還有很長一段路要走,尹相志認為現在的 ChatGPT 已經非常強大了,而且足以帶來能力的重新分配。

過去不會寫程式的人,現在可以透過 ChatGPT 來寫程式賦能自己,而尹相志也開始做一些實驗,希望能讓一些非技術者掌握到技術的細節,讓 ChatGPT 的能力可以再放大。同時,尹相志也笑說現在的演講邀約很多,不想都講一樣的內容,所以每一個演講,都讓自己做一個新的挑戰,做一些實驗性的嘗試,並且分享給大家。

例如 ChatGPT 既然是一個語言模型,那麼該如何利用來進行情感偵測、意圖識別呢?或是 ChatGPT 要如何用來命令系出同源的 DALL-E(皆為 OpenAI 所開發)去畫出想要的平面設計?總之,就是實驗各種新的表達方式,讓過去那些不會寫程式的非技術者,能聽懂並且更深入理解如何使用 ChatGPT。

技術專家對企業導入 AIGC 的建議

過去長期擔任大數據顧問,尹相志表示對企業來說,技術的落地有兩種意義,一個是增進效率,另一個則是增加收益。企業要先清楚當下自己的主要目的是什麼,才知道採用什麼技術,以及如何評估是否達成。

身為技術長的尹相志,提醒所有的企業不要為了某個技術的出現,就硬要去導入,而是應該先從使用者的場景來觀察,其中特別要了解是 B2B 或 B2C 的應用?以 B2C 來說,可能微軟等科技大廠會很快把以文生圖的工具做到很成熟,就不用太花時間在上面了。但是在內部流程,可能會有不少的應用,像是電玩產業的視覺設計,以及電商的服裝模特兒,都可能很快就會被取代了。

但也要小心過度樂觀,像是元宇宙或 3D 的 AIGC,都還距離可以直接使用有一段距離,而 RoomGPT 有許多人認為可以生成室內設計,但裡面的細節可能不符合物理原則,或是畫得出來卻做不出來,也沒有考慮承重、結構,離實際在產業應用與落地還有不少可以改進的地方。

尹相志還提到,對於大多數的企業來說,最直接面臨的問題就是不太可能讓每位員工自己花 20 美元以個人帳號去使用 ChatGPT,因為無法管理,所以 OpenAI 或 Microsoft 應該會很快整合出企業版的服務,讓企業可以做內部管理,在提升效率的同時,也避免資安疑慮。

尹相志特別強調,現階段企業要禁止員工使用目前如雨後春筍般出現的第三方 ChatGPT 外掛程式(Plugin),那些服務會是安全上的最大隱憂,至少等 OpenAI 官方認可的外掛程式,會比較有保障。

AIGC 大爆發,有什麼創業機會?

新的技術帶來新的可能,除了企業導入讓營運流程更有效率以外,有沒有什麼創業紅利呢?尹相志提到兩個可能性。

首先,過去許多企業看不上眼的一人公司或微型企業,其實很需要企業級的服務,只是過去開發者並不在乎這個市場,但是 AIGC 的技術可以用來服務這一群人,他們花的雖是小錢,但是這些小企業的數量很大,加起來營收也很可觀,所以新市場可能會出現在小型客戶。

再來,就像是 Stable Diffusion 加上 RoomGPT 就可以進行室內設計的提案,ChatGPT 也可以加上一個法律的功能,就可以提供訂閱式的法務服務。大企業有法務部門,未必需要這樣的服務,但是微型企業付不起太多錢,所以基於 ChatGPT 模型的基礎,把開發成本大幅降低,就可以提供便宜但卻有很多需求的服務。不過機會有限,看誰速度比較快。

判別式 AI 和生成式 AI 的發展

談到過去幾年的發展,判別式 AI 才是主流,現在則輪到了生成式 AI。尹相志認為,前者就像是在做選擇題,後者則是申論題,而新的 AI 技術可以讓判別式 AI 更有實用性。怎麼說呢?

例如一個智慧商店,透過鏡頭辨識商品而做自動化結帳,得為每一個商品拍照,然後訓練和調整模型,多一個商品就得重新訓練,因此導致維護成本高到難以想像。這就是為什麼只有那些品項少又不變的店家,比較有可能採用。

可是 Meta AI 最近推出了 Segment Anything,可以做到弱標注,不需要事先訓練,就可以透過物體的輪廓做到更精準的判斷,再去跟資料庫有的東西做比對,把商品上架的成本可能就因此降低。這些應用當然都還有一段路要發展,但是過去卡關的智慧零售、自動駕駛,都可能因此而有新的突破,可能性和想像空間很大。

尹相志提醒,要學著相信隨機的力量。過去人類都想要很精準的判斷和學習,但讓機器可以隨機大量生成可能性,再從裡面去收割可用的創意,反而是尹相志現在想要推廣的概念。

他舉例,以前都是人類拿著棋譜教機器,後來發現機器隨機嘗試反而可以找出人類不曾想過的可能性,現在反過來是人類跟機器學下棋。所以 AI 是可以啟發我們的,這種啟發對人類來說就是一種強化,可以讓我們的眼界變得更寬廣。

人類要被取代不容易,但工作內容會轉換,需要的人會變少

說到智慧零售,先前很多人也都認為超商店員會被取代掉,但是這個情況並沒有發生。AIGC 也一樣,現在需要人畫圖,未來可能 AI 畫圖,但是尹相志認為還需要人去做微調、修改和監督,像是 AI 無法判斷什麼畫面人會喜歡,但是人就具備這樣的鑑賞能力,所以職業不會被取代,還是需要這些美術人員,但是工作內容會有所調整。

不過尹相志也提到,未來除非你很喜歡這個領域,不然發展的機會的確有限,最好要在短時間內找到新的價值點,知道未來自己可以在什麼工作上創造價值。

同樣的事情也會發生在客服工作上,大多數簡單的客服工作都會被 AI 所解決,但是那些困難的問題,甚至是情緒勞動,則只有人能解決,所以難道所有的客服都會消失嗎?現在即便是電話語音,也還有很多最後得轉到真人客服才能處理。尹相志認為許多工作,像是行政文書和行銷企劃,會面臨縮編的壓力,因為 ChatGPT 會讓這些工作變得極有效率,不再需要那麼多人。

任何強迫別人開源的都是耍流氓

問到 OpenAI 被說成是 CloseAI,尹相志表示,強迫別人開源,都是佔便宜又不想付錢的人,任何一個技術沒有資本的投入,就很難被發展出來,所以當別人投入了大量資金,獲得了成就,卻一直喊:你應該要開源,這樣合理嗎?他有自己的商業利益要保障,才會有更多資金可以運用,並且繼續投入,繼續發展。

要不要開源,是每家公司自己的決策,尹相志不認同只是因為名字叫做 OpenAI,就被情緒勒索要開源。尹相志也認為,GPT-4 訓練完成後,OpenAI 又花了半年處理安全性問題,是夠負責任的做法了,而現在基於安全,很多訓練細節沒有說明,也沒有開源,是可以理解的。

想知道更多 ChatGPT 創作的破解技術?

ChatGPT 的語言能力眾所皆知,利用它來寫情節簡單的繪本故事也時有所聞,但是它能勝任來協助完成連續殺人事件的偵探小說嗎?尹相志接下來想挑戰,ChatGPT 因為有安全性的考量,「連續殺人」這種主題該如何繞過限制?以及 ChatGPT 生成有字數限制,又該怎麼完成小說的撰寫?

尹相志是即將於 5/6-5/7 舉行的「2023 Generative AI 年會」的講者,在演講中,將與大家分享他的嘗試,並探討可能的解法和路徑。想掌握最新的 Generative AI 應用方式、跟現場來自各行各業的 Generative AI 實踐者一同合作,可點擊以下報名網址

核稿編輯:陳涵書

《商益》主張「商業是最大的公益」,報導專注於讓讀者理解資本力量、商業本質以及財經語言。歡迎加入 Discord 社群,並免費註冊訂閱商益電子報

延伸閱讀:
李慕約:AIGC 需要培養的四種能力與精進技巧的三種方法
侯宜秀:ChatGPT可能有菜鳥律師程度,卻不是能負責的法律顧問