【觀點】Netflix最怕你睡著!注意力競爭聽覺更勝視覺,聲音經濟的演化變得如何?
生成式AI的腳步在3月悄然跨足到音樂,目前只12人的新創公司Suno正在破解AI音樂密碼,生成音樂與生成文字、圖像及影片不同,音樂是連續訊號的波,而不是離散單詞,但現在用一行文字提示(prompt)創作一首藍調歌曲已經實現了。Suno的年輕創辦人Mickey Shulman是哈佛物理學博士,也是音樂家,他認為當前音樂聽眾遠多於音樂創作者的事實是不平衡(lopsided)的,這個供需平衡的改變顯然將擾動尚在演化中的聲音經濟。
聲音是從聲源開始的空氣分子振動,透過氣體密度與壓力變化產生聲波,語言出現後,這個波可傳遞資訊與知識,然後因聲波可呈現響度、時值、振動頻率等變化,所以有了音樂。從演化來看,人類活動凡分布很廣且歷史悠久,便是有助物種生存,音樂活動顯然是其中一個。音樂除自我認同建構與求偶功能外,更重要是能將人們凝聚在一起,而一群有向心力的人存活機會較高,這是演化論的視角。對數位時代下以Podcast、Spotify平台為首的聲音經濟浪潮,也可以這視角來看。
讓耳朵找事做!「用聽的」解放螢幕轟炸
為什麼會出現聲音經濟(Why)?可能有4個驅動原因。
第1是聲音的易接受性,演化上我們與資訊最初的接觸點就是聲音,且人對聽覺資訊的反應速度比視覺快2倍(像賽跑的鳴槍),過去因軟硬體介面內容的限制,而屈就於紙張與螢幕的接觸點,直到科技釋放了人類想更輕鬆獲取資訊的慾望,語音便是回到演化起點的終極內容形式。疫情期間的Zoom視訊疲勞像最後稻草,只有聲音能讓我們從長年被螢幕綁架的生活中解放,而且這次的變革沒有人落隊,像當年高齡族群被螢幕接觸點的革命拋棄一般。
第2個原因是聲音的可處分彈性,獲取聲音資訊常不需犧牲其他生活,這是他種內容活動做不到的,相較眼睛,我們的耳朵在一天中常是閒置的,聲音經濟大幅增加了耳朵的可處分時間,如常見的通勤與家事時間,科技文明總朝降低生活犧牲度的方向演進。
這樣的使用情境也誕生許多跨感官的知覺行銷效果,例如我們在做菜時耳朵聽到醬油廣告,與看電視時眼睛看到醬油廣告,知覺衝擊是完全不同的。從注意力經濟的角度來看,聲音在注意力競爭中是大家的好朋友,著名的媒體傳播注意力光譜圖中,橫軸是需付出注意力的強度,縱軸是活動的重要程度,右上角兩者皆高的活動有閱讀、通電話等活動(也許要再加上Netflix),左下角兩者皆低的活動則是串流音樂,你完全可搭配其他活動任務同步進行(但同時也在付費)。注意力經濟中,Netflix是所有內容的敵人,串流音樂卻是所有內容的朋友,難怪Netflix執行長要說他的最大競爭對手是睡眠。
走向平民化,素人發聲打破天花板
第3個原因是聲音的個人化親近感,聲音與音樂是人們建立自我認同的過程,如同大家所說,唱片收藏決定你是什麼樣的人,書籍收藏則決定你真正想成為的人。你決定聽什麼就是你現在想聽什麼或改變什麼,不是未來目標,這是最個人化接觸與現在進行式的資訊交換,比閱讀更親密。這是人本時代的媒體潮流,我們都與聲音傳播者在瞬間交換彼此的個性、風格、生活哲學與溫度感受,這種親密感也來自物理因素,如果我們戴上耳機,收聽內容便成為2人間的封閉私密對話。
第4個原因是聲音內容的平民化,這是訊息傳播的大眾化革命,因為語音是最能降低傳播門檻的媒介。從歷史來看,1877年愛迪生發明留聲機前,只有極少數觀眾可欣賞到聲音表演工作者演出,留聲機開始紀錄傳播人聲後,所有聽眾都受惠了,第二流的聲音表演者卻失業了。
但今日的數位聲音內容打破這種贏者全拿的超級明星經濟,業餘工作者也能產出聲音內容,並且有受眾,因為你是素人但說話內容也可能很有趣,或者我們很想聽遠洋漁船的故事,但水手不會有時間與專業去產出文字影片素材,而聲音內容的創作準備時間與產出成品時間幾乎是1:1,這是內容創作的平民化。像科技史學家凱文.凱利(Kevin Kelly)說的,200年前便有許多農家在後院創作雕刻,但他們卻無法與全球連線找到世上僅有的1,000位點讚知音者。
聲音經濟接下來會怎麼演進(How)?除了AI生成音樂外,至少有3件過去數年已發生的事。
第1是跨感官整合知覺(cross modal perception)的趨勢,聲音已成為一種設計元素,例如食物設計中的聲音調味(sonic seasoning),如何以聲音緩和飛機餐用餐過程的機艙白噪音,改變食物口味體驗;例如牙醫診所用聲音地景(sound scape)設計來降低焦慮,或日本茶道儀式強調的聲景款待等;零售業也有許多聲音促發效果(sound priming)的行銷應用,行銷研究證實了賣場播放音樂對不同商品銷售的影響(如鄉村音樂讓人多添購日用品),這些發展嘗試的終極版本便是品牌聲音識別(sonic branding),法律體系提供了聲音商標的申請保護選項,愈來愈多品牌開始投入這樣的保護樣態(台灣自2003年開始開放聲音商標的申請)。
音樂歌舞青春,大數據緊跟世代命題
第2個趨勢是使用者的區隔與創新,這波數位平台帶動的聲音經濟特色是使用者數據,不論後台大數據或更強調使用者情緒故事的厚數據,都讓客群分眾變得可能,傳統的聲音內容沒這麼多客製化與娛樂化走向,但今天我們擁有最好的使用者資料,因唱片收藏就決定你是什麼樣的人。
這些精準行銷也包含世代對象的差異,許多音樂社會心理學或懷舊效應(reminiscence effect)研究均指出,音樂是我們在青春期自我定義的工具,流行音樂黃金年代就是自己20歲的年代,然後便走下坡(Spotify數據顯示多數人33歲後就不再聽新音樂),不同世代有不同的聲音市場,然後當然也包含居家長照的寂寞市場,這時我們需學習聲音的高齡研究,如聽力閾值與可聽度(audibility)對認知障礙的影響,如何延緩聽覺老化既是健康老化的社會政策也是銀髮商機。
就設計師而言,使用者經驗(UX)的知識開始被用在聲音使用者介面(Voice User Interface,VUI)上,不同使用者想要的聲音體驗可能是不同的,什麼叫好的聲音,包括聲音內容是否符合需要(desirable)、可相信(credible)、易辨識(findable)、後續可運用(usable)、實用(useful)、具價值(valuable)、易取得(accessible)等設計準則,都是因人而異的,如果這介面是AI聲音介面,則需更多人機互動(HCI)的聲音專業投入。最後是硬體,這種個人化設計浪潮也會擴及到智慧喇叭、無線耳機等聲音裝置配件的不同需求。
第3個趨勢是聲音經濟的新商業模式,聲音經濟的生態系已然成形,付費給內容的知識共享文化也逐步建立,如何建立好商業模式將是新課題,數位時代要打敗免費,只能用其他方式創造比免費更好的價值。
Spotify首席經濟學家威爾.佩奇(Will Page)談音樂產業轉型的書《泰山經濟學》(Tarzan Economics)說,音樂產業是最先受數位破壞性創新襲擊的產業,也是第一個克服阻礙重生的產業,所有產業都可向音樂產業學習。這本書用商品是否具排他性(excludable)與獨享性(rivalrous)畫了一個象限圖,早期的唱片是私有財,既有排他性也有獨享性,購買才能聽,但數位音樂既沒有排他性也沒有獨享性,音樂產業需要轉型成更精緻的數位音樂平台(有排他性沒有獨享性)與演唱會(有獨享性沒有排他性)來賺錢,才能重生。
從聲音經濟的演進脈絡看AI生成音樂,我們似乎可預見未來。最早的聲音知識與音樂僅能在特定空間對特定人傳播收費,留聲機出現後,地理邊界消失了,但聲音內容提供者只剩菁英;然後是數位平台革命,菁英界線消失了,聲音知識的創作傳播不再有門檻,僅剩音樂創作還是塊聖地;最後,AI讓人人開始生成音樂,聲音經濟再沒任何界線,我們需要新的遊戲規則。大衛.鮑伊(David Bowie)在2002年便對數位時代預言,他說音樂將像自來水或電力,隨處可得而不再令人期待。
很快我們便需討論,未來究竟會有更多好音樂,還是好音樂被大量普通音樂淹沒?這可能是個重要問題,類似《大腦這樣聽》(Of Sound Mind)這本書說的「聲音意識」(sound mind),我們一生中接觸的聲音,塑造了我們現在的大腦,我們現在的大腦,又會決定我們如何塑造未來聲音。我們對聲音的選擇將成為聲音世界的未來,這是聲音的傳承,關於如何把真正的良好音樂傳承給下一代。
一首歌各自表述,瑪丹娜也可能爆冷門
但什麼是好音樂好聲音也是有爭議的,研究六度分隔小世界而知名的科學家鄧肯.華茲(Duncan Watts),曾在2006年Science期刊發表一個音樂實驗,將7,000位受測者區分在8個各自獨立的線上平台,聽48首新歌評分,6周後這8個音樂平行宇宙的排名都不一樣,有些冠軍單曲在別的宇宙只排到40名。他說,在所有初始條件都相同的情況下,瑪丹娜在另一宇宙也可能是被音樂圈淘汰的人,也許好音樂與好聲音都是場美麗的意外。
Suno創辦人Mickey Shulman在最近滾石雜誌的訪談說,他們其實是想讓10億人更加投入音樂品味,而不是要取代藝術家,就像Suno的新辦公室裡有間錄音室,他們都是音樂家,也想常常不靠AI親身製作音樂。如果是如此,那麼或許生成式AI並不只打開新世界,也可帶領我們回到舊世界,像小說家卡爾維諾針對五感的最後作品《在美洲虎太陽下》(Sotto il sole giaguaro)(他只寫完嗅覺、味覺、聽覺便去世了)前言說的,數百年來閱讀習慣將智人(Homo sapiens)轉變為閱讀人(Homo legens),但這不意味閱讀人比智人更有智慧,不閱讀的智人能夠看見與聽見許多東西,而我們今日已不再具備這些感知能力。
責任編輯:蘇柔瑋