立場新聞 Stand News

媽啊好亂!究竟錄音在說哪一個名字?

2018/5/17 — 11:10

網上日前又出現大爭論,網友 在 Instagram 上傳一段錄音,問到聲音中的是屬於哪一個英文名。兩個名雖然的拼音看起來似乎風馬牛不相及,但聽到這兩個名字的人數竟各佔一半。

為了盡量不影響你的判斷,上段文字完全沒有提及哪兩個名字,先聽一聽錄音:

廣告

我最初聽到的是兩個讀音混合而成,情況類似:「Yanrel」,事前看到友網編輯 Kayue 的博文。今早自己再聽多一次,就只聽到 Laurel 了。再找來伴侶一齊傾聽,她卻聽到 Yanny 。我再嘗試以身邊不同工具嘗試辨識錄識字句,YouTube 自動製作字幕工具辨識錄音為「Yeah」,而手提電話上的 Google Assist 則分別辨別到錄音為「Terry」和「Very」。[1]

那究竟是 Yanny 還是 Laurel 呢?聲音學家 Brad Story 為錄音製作聲紋圖,再與他說 Yanny 和 Laurel 時,兩個聲紋比較。聲紋圖發現兩個讀音其實均與原錄音有點相似。他認為錯覺產生是源自原錄音錄得不夠清晰,令腦部分析聲音時,聆聽到不同字眼(也就是之前博客們鬧得熱烘烘的聲音和聲波問題)。YouTube 科普頻道 AsapScience 指出,我們聆聽錄音的設備均會有影響。但如果同一設備又會如何?他們則認為這可能與年齡有關。年紀大的會較易聽到 Laurel ,年輕的則會聽到 Yanny。網友 Steve Pomeroy 在 Twitter 分享,如果將音高 (Pitch) 稍為提升或下降,用家則會聽到 Laurel 或 Yanny。

廣告

故然音高會有所影響,會令不同人「偏向」聽到其中一個名字,但這仍未足以解釋到為甚麼人可以在不同時間都聽到 Laurel 和 Yanny,甚至同時聽到兩者。我認為情況或許與著名的「兔子—鴨子錯覺 (Rabbit-Duck ilusion) 」相似。下圖你會見到的是兔子還是鴨子?

Wikipedia

Wikipedia

答案是兩者均可存在,視乎你的注意力集中於哪兒。當然可以質疑,這屬於視覺錯覺,而非聲音錯覺——兩者機制未必相同。但其實兩者都有些共通點:一,客觀上大家都是聽到和看到同一幅圖片;二,大家都有機會分別聽到和看到兩個截然不同的聲音或影象,有助理解錯覺形成的原因。

假設你在看到「兔子—鴨子錯覺」影像前,你看到的大多是「兔子」圖案,那就會對於腦部形成促發 (priming),令你無意識地偏向圖片是兔子。類似現象也在其他聲音研究中可觀察到。在這個情況下,若我們在日常生活,或聽錄音前剛好有人提到類似 Yanny 的讀音,都可能會令你偏向聲音是 Yanny,反之亦然。聲音學者 Douglas Beck 接受《國家地理雜誌》訪問時亦指出,以日本人為例,他們的發音較為有 L 音,所以也會較少注意到字眼中的 L 音,可能會聽到更多 Yanny 讀法(這方面或要實驗查證一下)。他也提出,工作記憶 (working memory) 、期望、語言能力、認知能力、聽力、音樂技術、訓練和注意力等,都會影響到我們聽到的是 Yanny 還是 Laurel。

另外,視覺也可能會同時影響到你對這段聲音的判斷。以自己為例,當我在聆聽錄音時,而同時又看到 YouTube 字幕上的「Yeah」 的話,就較易會聽到 Yanny。相反,當自己在聽錄音時,將注意力集中在影片標題的 Laurel 上 ,則會聽到更易聽到 Laurel 。類似現象也可從 McGruk 效應觀察到。參加者傾聽同一段錄音時,講者的口形可以影響他們聽到的聲音。Brad Story 指出,類似的視覺或聽覺促發,都會使人早已選擇偏向自己聽到的會是 Yanny 還是 Leural。去年一度引起爭議的藍金裙子圖片,則與此錯覺有點不同。藍金裙子相信是由色彩恆常性 (color constancy) 引起。視乎觀察者假設房間光線是藍光,還是白光;前者會令人以為裙子是白金色,後者則會令人以為裙子是藍黑色。

這些現象不單有趣,更是不少認知科學家和哲學家嘗試理解和量度人類意識 (consciousness) 的重要一環。部份科學家提出,人類由看到「兔子」,變成看到「鴨子」、又或者是聲音詮釋改變的那一瞬間的腦部活動變異,有機會可反映到感官訊息怎樣「進入」意識之中,甚至從而找出處理意識的神經元(或迴路)(即是引致意識的神經 — Neural Correlate of Consciousness ) 。有科學家就利用利用雙目競爭 (binocular rivalry) 或雙耳競爭 (biaural rivalry) ,分別在參加者的左右耳或眼睛播放不同聲音或影像。參加者一般只會偏向「看到」或「聽到」一個影像或聲音的詮釋;與此同時,腦海兩個聲源或影像則會互相角力,爭取成為「意識」可觀察到的圖案或聲音詮釋。角力期間的神經活動改變,正好反映到人怎樣「挑選」自身對訊號的詮釋。

回到 Yanny 和 Laurel ,除了客觀上,聽力上的音高可能會影響判斷,其實身邊聲音、影像,甚至是生活經驗中,也有機會影響判斷。這些因素,即使你在閉上雙眼聆聽也會帶來一定影響。那究竟原聲音是 Laurel 還是 Yanny 呢?據 Wired 報道,錄音是由中學生 Katie Hazel 在 Vocabulary.com 尋找「Laurel」的讀法時發現,再在 Instgram Story 分享。她的師兄 Fernando Castro 再在 Instagram Story 作投票,繼而一石擊起千重浪,引發討論。

換言之,正確答案就是:Laurel 。但不知道你讀完文章後,聽到的又會是 Yanny 還是 Laurel 呢——還是沒有改變呢?這現象又有沒有其他解釋? 不妨在《腦人家》專頁留言告知。

不過如果想知道未聽過錄音朋友覺得字眼是 Laurel 還是 Yanny ,都是在不要給予任何視覺聽覺提示下,直接給他們聽取錄音。結果可能會更公正和有趣。

註:
[1] 這一點較少人討論,類似問題會不會也會考起 AI 呢? 

參考資料:
Mashable, The original audio from the 'Yanny/Laurel' debate has been found, 16 May 2018
AsapSCIENCE, Do You Hear "Yanny" or "Laurel"? (SOLVED with SCIENCE), 16 May 2018

作者 Facebook 專頁

發表意見