摘要
【百萬小學堂】、【金頭腦】這類的益智節目,在台灣也風靡一時。
而電腦是否能在節目上超越人腦,也一直是人們茶餘飯後討論的話題。
在 2011 年的益智問答節目 Jeopardy 中,IBM 的華生電腦(Watson)擊敗兩位世界紀錄保持人並贏得 100 萬美元,造成不小轟動。本次 talk,將介紹如何自製一個答題機器人。
目前,電腦對於自然語言的理解依然有限,舉例來說: 要讓電腦知道『蘋果』是什麼? 就是個困難的問題。
因為蘋果在一句話中可能是指水果、手機或是喜歡的人 (流行音樂中的小蘋果)。為了克服這個難題,文字探勘(text mining) 中有個子領域叫做知識圖譜(Ontoloty),目的就是希望將人類所有的知識以及規則儲存成結構化的資料。
如此,在解析文字時,就會知道蘋果是水果 or 電腦、知道周杰倫是歌手。對益智節目、聊天機器人等應用都會產生莫大的助益。
本 talk 將會介紹知識圖譜的應用、目前的做法與瓶頸、如何使用 Wikipedia 自動建立支援各國語言的知識圖譜,最後 Demo 一下答題機器人的智商到底行不行。