李怡志:有了生成式 AI,大多數人都可以表達自我
李怡志是政大新聞系助理教授,有 25 年的網路內容相關經歷,曾任 Yahoo!奇摩內容企畫總監,目前也擔任中央社董事。在 AIGC (生成式人工智慧)的社群上,可以一直看到李怡志每天持續不斷在「練習」各種圖片生成,而新聞媒體又是受到生成式 AI 衝擊最嚴重的產業之一。《商益》採訪李怡志,請他分享自己的研究與創作過程,以及如何思考 AIGC 對產業的影響?
雖然在社群上分享了許多相當讓人驚艷的作品,李怡志謙虛地說,不覺得自己有什麼功力,而是把 AIGC 當成娛樂。自己不是設計師,所以格外明顯的感受到,
這些 AI 工具可以很輕易的讓非設計背景的人,從 0 分的狀態輕易假裝自己有 60 分了,但是也看得出來有沒有「美術底」的差異還是非常大,有底子的人可以瞬間就到 90 分甚至 100 分,這個差異來自於更好的判斷力,以及對表現法與技法的熟悉度。
生成藝術的一開始,是在學英文與藝術
李怡志表示,社群上能看到的圖都是經過自己挑選之後的就果,100 張圖挑出 1 張真正好的,所以判斷力很重要。此外,非設計背景的人在使用 Midjourney 的時候,一開始基本上都在學英文、學各種藝術跟設計的情境、風格、情緒,以及各種對於細節的描述、顏色的描述。
李怡志就分享,經過一段時間之後,看到藝術品,就會發現自己用英文描述藝術作品的能力變好了,因為你學會了這個東西是什麼。
所以學習的過程就是先理解各種的藝術描述,然後想辦法下 Prompt (指令)去生成想要的畫面,你會同時看到很多人在做這件事情,大家也都會貼出自己認為好的作品,你就可以不斷看到別人認為好的是什麼?
過去只有去美術館才能看到大量作品,但現在每個人都在嘗試做自己的藝術,一邊看別人的產出,一邊自己也在生成,鑑賞能力就會進步。
李怡志認為,這樣的生成工具在教育上很有幫助,比起過去可能教科書上用三到五個例子,試著讓學生知道什麼是文藝復興,但總是有距離,現在甚至可以讓學生用文藝復興的風格去生成跟自己有連結的畫面,這麼一來,原本複雜的概念就變清晰了。
說到教學,李怡志在資訊圖表的領域有很深的研究,特別是精密的新聞用 Infographics,如今也漸漸調整教學,過去要求學生用 Excel 做練習,會有大量的手工調整、測試和判斷,但這學期改用 Power BI,讓 AI 去做判斷,主要的目的是學生會用這樣的工具,並且有敘事能力,然後開始接受 AI 一起做事。目前看下來,學生作業的水準比以前要整齊,
AIGC 會怎麼影響新聞產業?
身為新聞系的教授,李怡志認為 AI 有個很大的好處,就是可以無窮無盡的生成,以前也有自動化工具,但受限於指令,如果一篇稿件要改成十種方式,就得寫十種複雜的指令。
但是現在可以讓媒體針對不同的受眾,內容的資訊不變,但把一篇稿件改成不同的風格,讓讀者以自己喜歡的方式接收資訊,真正做到個人化,畢竟不同讀者有不同的生活型態、教育背景。
第二個影響則是過去媒體要寫出完整的文件,一個一小時的採訪,逐字稿可能有一萬多字,但最後只刊出精挑細選寫出來的一千字,剩下的全部丟掉。
但現在任何東西都可以丟進資料庫,無論是完整採訪錄音、甚至一開始的訪綱、找資料過程中的參考文件、片段的資訊,然後讓 AI 生成你可能從來沒有想像過的作品出來。
簡單來說,以前媒體最小的檔案單位就是一篇稿件,現在最小單位可能就是一句話。不過這樣的改變,會出現在媒體企業的系統端。
至於記者個人,李怡志認為新聞系的訓練對於活用 ChatGPT 很有幫助,像是「內容分析」的技術,以往拿到一篇稿子,例如總統府的新聞稿,要去分析情緒是什麼?意圖是什麼?最常用的關鍵字有哪些?
過去這些都要花很大的力氣去做分析,但現在 ChatGPT 就可以做了,甚至可以進一步做分類、分群,只是目前工具的發展太快,今天教的可能明天就過時,但大家的共識就是盡快讓學生知道怎麼用。
ChatGPT、Midjourney 都可以應用傳播理論
李怡志舉例,ChatGPT 既然是一個大型語言模型,而在傳播理論上有很多不同的語言模型,最簡單的像是 SMCR 模型,S 代表資訊源(source),M 代表訊息(message), C 代表管道(channel),R 代表接受者(receiver)。
那麼當一個受過正規訓練的人,把 ChatGPT 當一位助理溝通的時候,能不能把這樣的模型當架構?例如你要它幫你寫稿,你要提供哪些資訊源給它?你打算怎麼控制它生成什麼樣態、帶有什麼情緒的內容?而分發管道不同,像是法律文件和推特發文就不一樣,最後則是接受者又是誰?
在「溝通」這件事情上,李怡志認為原本學界的理解已經相當完整而成熟了,有著太多模型存在,像是你可以請 ChatGPT 分析一個問題背後的問題,這就是一種專業而成熟的問法。此外,你也可以問問 ChatGPT 某件事情的平行概念是什麼?上層概念又是什麼?透過它去擴展認知與理解:我知道這兩個概念,你能不能再跟我多講一點相關的概念?
李怡志已經寫了一百多個 Prompt 的教學範例,認為接下來應該是讓學生知道如何下 Prompt 去讓 ChatGPT 寫 HTML、CSS 或 Javascript,就像標準差、IRR 都可以用電腦算,而不是手算。
ChatGPT 可以有理論依據,那麼 Midjourney 呢?李怡志也分享,在開放了「/describe」來做圖片的逆向工程後,可以丟一張圖給 Midjourney,會生成四組 Prompt,而那四組 Prompt 可以丟到 ChatGPT 去做簡單的內容分析,像是把裡面最常出現的字找出來,或是找出相關的字,甚至請 ChatGPT 把四組 Prompt 濃縮成一組新的 Prompt,這在學術理論上叫做高熵值的創意亂數。
有了生成式 AI,大多數人都可以表達自我
李怡志認為現在的創作門檻大幅降低,以前學繪畫可能兩年掌握一種技巧或風格,一輩子掌握了二十種,就結束了。但是現在可以一天掌握一種風格,這讓許多人過去沒辦法透過創作這些藝術來表達自己的情感,但是現在可以了。
你有想法,也有工具,可以幫你表達情緒、進行溝通,甚至以前畫一幅畫要兩個月,現在可能只要兩秒鐘。如果沒有明確目的,就算有工具有不會去用,但只要你有想法要表達,過去沒能力呈現,現在可以開始創作了,這些工具非常有用。
不過李怡志也坦言很多專業可能會消失,例如寫書法,現在可以印刷,寫字就會變成陶冶、休閒,很多人年紀到了,抄寫心經不是當工作或職業,而是他就喜歡、也想做這個。李怡志說,自己用 Midjourney 生成各種作品,也是這樣的心態。
李怡志是即將於 5/6-5/7 舉行的「2023 Generative AI年會」講者。他將分享人工智慧的技術如何變成創意的輔助工具,過去很多創意視覺化的想像做不出來,但是現在門檻降低很多了,所以經歷過將近一年許多行動研究的結果,李怡志會分析生成技術在創作上跟傳統創作本質上的差異。
想掌握最新的 Generative AI 應用方式、跟現場來自各行各業的 Generative AI 實踐者一同合作,可點擊以下報名網址。
核稿編輯:陳涵書
《商益》主張「商業是最大的公益」,報導專注於讓讀者理解資本力量、商業本質以及財經語言。歡迎加入 Discord 社群,並免費註冊訂閱商益電子報。
延伸閱讀:
侯宜秀:ChatGPT可能有菜鳥律師程度,卻不是能負責的法律顧問
李慕約:AIGC 需要培養的四種能力與精進技巧的三種方法
OpenAI 是 CloseAI?尹相志:任何強迫別人開源的都是耍流氓
NVIDIA:扮演好軍火商角色,Omniverse和AI Foundations協助企業升級AI-First