3月1日下午,由人文與社會科學學院心理學系主辦的心理學前沿論壇第十期正式開講。中國科學技術大學語言科學交叉研究中心袁家宏教授應邀做題為《基于深度學習的語音學研究》的精彩講座。講座通過騰訊會議同步在線分享,科大師生及科大訊飛的技術專家線下線上參加。心理學系執行主任孔燕教授致開場詞,對袁家宏教授的學科背景、研究領域進行了介紹,并對相關學科師生的到來表示歡迎。
從我國現代語言學起步之初,語音學就是最能體現現代科學精神的一個分支,一直注重技術手段與傳統語音分析方法相結合,發揮語音學研究的應用價值。20世紀50年代語圖儀的問世、70年代計算機的應用推動語音學領域發生了兩次革命。現今,大數據和深度學習技術的發展正在促進語音學的第三次革命。
袁家宏教授一直注重開展面向社會和現實需求的語音學研究。講座中,他以音位識別、阿爾茲海默癥識別和連續變調的研究為例,結合各類語音樣本、分析圖表、實際案例,詳細地講解了深度學習模型在這三個方面的應用與優化過程,論述了語音知識可以幫助提高端到端模型的性能以及理解和解釋端到端模型的表現,和利用深度模型語音表征進行語音分析的巨大潛力,為應用與基礎研究的融合發展提供了一個范例。其中,袁教授通過中國科學技術大學東區食堂疫情防控期間的語音提示這一生活案例,區分“戴好(二聲)口罩”與“戴好(三聲)口罩”,讓現場的師生們直觀地理解了“三聲連續變調”及其在語言中的廣泛使用,并認識到三聲連續變調識別的復雜性。
袁家宏教授詳實且精彩的分享讓現場師生們受益匪淺,深度學習模型的遷移能力與可解釋性、普通人與阿爾茲海默癥患者在停頓填充詞“然后”的使用上的顯著性差異等話題也激起了熱烈討論。對于阿爾茲海默癥患者在圖片描述中很少使用“然后”一詞,各位老師同袁教授從阿爾茲海默癥患者腦區的認知損傷、語音數據采集過程中的不連續性、詞匯的語音形式和語義功能等角度進行了分析與討論。
近兩個小時的講座及討論,激發了大家對基于深度學習的語音學研究的強烈興趣及深入思考。語音學、心理語言學、腦科學、人工智能等如何交叉,如何服務于百姓的迫切需要,師生們期待下一步可以在項目申報、交叉學科探討等方面互相借力,共同推進。
講座最后,孔燕教授代表心理學系全體師生對袁教授的精彩講座再次表示感謝,并贈送紀念品。
心理學前沿論壇,作為心理學系三大品牌論壇之一,旨在通過和國內外知名學者的互動,分享心理學前沿研究熱點,以及心理學科在社會關切問題上的應用,積極促進具有科大特色心理學科的構建。
(心理學系 供稿)