【演講主題:AGI】
AItlas 透過 Articut NLP AI 系統的處理技術,建構了一個具有「核心知識」以及「語境經驗」的雙層知識圖譜。這個知識圖譜的特性在於:
- 模型自動透過閱讀文本產生,不需人類進行知識分類標記。
- 模型內容的資料格式和編碼是「人類可讀」的,且通透的程式邏輯特性,讓 AI 的運作變得可被驗証,可重覆驗証,且可進行證偽操作。
在實際應用上,核心知識由原廠釋出,而語境知識則隨使用場景以及和這個 AI 的互動持續累積。如此一來,這個 AI 在知道世界的基本運作原則之餘,也能保有在特定條件下,和特定人類的互動方式的獨特性。兩層架構都沒有傳上雲端的必要,因此能為使用者保有最大的隱私。
知識圖譜是藉由統計學、圖論、電腦技術等方法,將大量文獻以可視化的方式來展示科學體系的內在結構。例如「拉拉山」屬於「自然景觀」、也屬於「人類活動範圍」、也屬於「桃園」、也屬於…種種的分類和知識層級關係,需要領域專家介入,進行編寫和確認。知識圖譜被視為 AI 系統要進入下一個世代前必須突破的技術門檻之一。
卓騰語言科技提出的 AItlas 知識圖譜系統採用 Hybrid AI 的方式,一方面透過語法規則解析文獻內容,另一方面透過自動學習的方式,將文本中的各種實體關係爬梳出來。其不需要專家介入的設計,是基於「預留高階節點的句法結構」的特性,但同時又保有了人類介入的可能性。
比如說,系統在一開始的文本訓練中學習到「一隻狗」是屬於「動物」的知識以後,自行遇到了「一隻貓」的句子。因為「一隻貓」的結構和「一隻狗」一致,因此即便沒有領域專家介入編寫「貓」也屬於「動物」的百科分類知識,它也會在「動物」這一個層級中,將「貓」視為一個自行學會的可操作節點,且在沒有學會其它條件以前,會將「貓」的操作方式同於「狗」。
這些圖譜節點的關係,將以「人類可讀寫」的資料結構儲存,並且具有清楚透明的語意邏輯關係在內。如果出了任何錯誤,人類都可以隨時反查到是哪一個環節出了錯,並加以修正。我們相信,只有可以經由和人一樣的邏輯論證,且被清楚查知是哪一個認知環節出錯的 AI 系統,才是更有智慧且可被人類信賴的人工智慧系統。
About PeterWolf
- 卓騰語言科技創辦人
- NLP/NLU 應用開發者
- 1/2 以上的人生都在處理自然語言問題的辣個男人