[翻譯]可以靠檢測大腦活動翻譯任何語言的最新AI登場

原文網址:


(圖:Unsplash)

翻譯

    未來的翻譯或許只要靠檢測大腦活動就可以完成。

    美國「Meta AI」公司最近發表,他們新開發的AI只要靠腦磁場及腦波檢測大腦的活動,就能夠辨識出人類聽到或說出來的聲音及單字。

    如果這個技術繼續發展的話,未來的翻譯就有可能不再受到語言侷限。

    並且將來可以藉由讀取大腦活動,將獲得的數據轉換成聲音後,提供因癱瘓無法進行言語溝通的病人們一種新的交流方式。

    大腦活動與聲音的連結也被認為是一種可行的腦機介面的實現方法,因此備受關注。

    詳細的研究內容於2022年8月25日公開在論文預印本伺服器『arXiv』上。

不在腦中插入電極 以「對身體無害的方式」讀取大腦活動


    我們的大腦是一種巨大的生物電機,各種資訊的處理都是藉由腦中神經網路中傳遞的電流完成。

    尤其當人類在使用或接收語言時,可以觀察到腦中的電流活動變得更加地活躍。

    因此從以前開始就有科學家嘗試藉由觀測大腦活動,來辨識人類聽到或者說出的單字。

    然而至今為止將大腦活動轉換為語言的技術大多都需要將電極插入腦中,需要承受外科手術的風險。

    例如想要測量聽到「老鼠」這個單字時的腦波,將電極插入腦中就能獲得十分正確的數據。

    相對地,想要利用腦波及腦磁場,從頭部外圍觀測大腦活動時雖然不需要進行危險的手術,但卻會因為干擾太多,只能取得不甚精確的數據。

    而這次「Meta AI」的研究人員們利用AI技術克服干擾,進而在不對身體造成負擔的狀況下,成功利用腦波及腦磁場讀取大腦活動狀態,並解讀出單字。

(※腦波是測量腦中的電流,而腦磁場則是測量與電流同時產生的磁場。兩者都不需要切開頭部,只要將感測器覆蓋在頭上就能夠測量)

    為了開發這個AI,研究人員採集了受試者在聽到特定單字時的大腦活動數據。總共採集了53個語言,5萬6000個小時的數據。

    數據採集完畢後,研究人員利用這些資料,重複讓AI(神經網路)學習受試者聽見的聲音與當下大腦活動狀態的相關性。

    上圖就顯示了大腦在聽到「Once upon a time(很久很久以前)」時的反應,以及AI如何學習大腦活動與聲音對應關係的過程。

    神經網路是在電腦中的虛擬空間中建立類似大腦的神經元,並經由重複學習來獲得與真實人類大腦相似的正確判斷能力。

    藉由大量的重複學習神經網路會成長得更加優秀,在其拿手的領域上甚至可以擁有遠超人類的判斷力。

    而這次交給AI的困難工作就是,將大量的腦波與腦磁場資料連結到人類的聲音。

    究竟AI是否能夠從混亂的數據中找出與人類說話聲音的關聯性呢。

用「愛麗絲夢遊仙境」與「老人與海」測試AI


    AI成功將大腦活動與聲音連結起來了嗎?

    為了調查AI學習的結果,研究人員決定出一些題目來考考AI的性能。

    總共169名的受試者會聽到諸如「愛麗絲夢遊仙境」與「老人與海」等故事或文章,並同時測量他們大腦1000個位置每秒的活動(腦波與腦磁場)。

    這個考試和人類的英文單字考試有點像。

    在測驗中,AI會得到從試者3秒間的大腦活動數據,並需要從選項(793個單字)中舉出數個可能性較高的答案。

(※793字覆蓋了一天之中會用到的大部分單字)

    測驗的結果顯示,AI在利用腦磁場的數據時,提出的前10個答案中含有正確單字的機率高達73%。

    另一個研究人員隨後也指出,AI所推測最有可能的答案和正確答案相同的機率有44%。

(※但利用腦波數據時,在AI提出的前10個答案猜中正解的機率就未滿30%)

    也就是說,AI在讀取大腦活動後,某種程度上確實能夠正確地將數據轉換成聲音。

將能與被封閉在自己腦中的人交流


    這次的研究證實了,AI能夠藉由測量大腦活動的數據,進而推測出人們聽到的聲音是什麼。

    並且因為並不會傷害到人體,所以無須擔心身體健康上的危害,能夠讓更多人投身這個技術的實踐中。

    此外在後來追加的研究中也發現,如果增加AI學習「教材」的多樣性,那麼判斷的正確率還能夠進一步提高。

    研究人員提到,如果能夠有更大量的大腦活動與聲音資料,那麼就能夠讓AI的判斷更加精準。

    另外,如果有將大腦活動直接轉換為聲音的技術,那麼不動口寫文章或者寄送電子郵件等,和心電感應一樣的交流方式就會成為現實。

    研究者指出,利用這個技術,未來因為癱瘓身體和大腦的連結被切斷的人們,就有可能再次與其他人進行交流。

難譯字

とりとめがない                混亂

後記與雜感

    這篇文章其實行文有點...微妙。前後語句邏輯有點亂之外,標題寫任何語言的部分也沒有詳細提到。翻譯的同時感覺也像在幫原作者重新潤一次稿(潤完好像還是蠻亂的)。本來有點懶得翻但是因為主題還蠻有興趣的就勉為其難的翻完了。

    不過用讀取腦波或磁場來判斷人聽到什麼字,進而翻譯真的蠻有趣的。假設某人一直覺得「海市蜃樓」是一種建築工法的意思,那他聽到這個字的時候會和其他人的反應一樣嗎? 在アンミカ說「白」的時候,我們可以靠讀取他的大腦來讓一般人知道他說的白是什麼白嗎? 如果在日本人說木漏れ日的時候,利用腦波分析,我們是不是可以像說明メイドインアビスなれはて語一樣,分析這個字分別有什麼成分,各種成分各占多少比例,然後在從其他語言中選出一個和它最接近的詞彙呢?

    除了語言學方面之外,或許也可以用來解答一個心理上的難題「語言先於思考,還是思考先於語言」,這個技術真的是光想就覺得很有意思。

留言

這個網誌中的熱門文章

《マーシャル・マキシマイザー》 歌詞翻譯 + 文本分析

[翻譯]下周中起關東甲信與東北猛暑 本周末後關東~九州可能出梅

[翻譯]發現讓漢堡肉排最快煮熟的翻面次數!