Loki 全名為 Linguistic Oriented Keyword Interface,和其它基於西方語言的機器學習 NLU 引擎不同。Loki 是專為中文設計的 NLU 意圖分析引擎。在語言學中,合作原則 (cooperative principle) 描述了人類在各種情境中實現有效對話的特徵。基於前述原理,Loki 將 NLU 任務分級成「場景 > 意圖 > 句型」三個等級。
Loki 語言模型的「通透 (transparency)」特性,讓開發者藉由正規表式示即能一目瞭然,任何句子在模型和程式邏輯中的每一個處理過程。當然,這也帶來了更靈活方便的模型調整以及更少訓練資料量的需求。
聊天機器人已出現許久,但許多在西方語系中被証明為十分有效的方法,進到中文以後卻往往施展不開。幾年下來,「聊天機器人」已從原本的 “chatbot” 變成了只是在文字聊天軟體的介面中提供各種「點擊」功能的 “clickbot”。「聊天」的功能幾乎盪然無存!即便不是 “clickbot” 的應用,也多半是採用「關鍵字觸發」的固定回應。
卓騰語言科技鑑於這樣的技術發展方向,並不會促使真正具有「理解人類意圖,加以分析重點以後,計算合理回應」的聊天機器人的產生,我們利用 Articut NLP AI 系統的 POS/NER 輸出,從頭打造了一個基於句型分析以及將 NLU 分成「場景 > 意圖 > 句型」的三級處理架構。
我們持續將寫好的「各個場景、該場景下的意圖、該意圖下的句型」語言模型以及範例程式原始碼放在於公司的 Github Repository 中,並且以 MIT 授權釋出。(見 https://github.com/Droidtown/ArticutAPI)。此外,也錄製程式說明的短片釋出於 Youtube 中。
我們企圖藉由開源、共享、回饋、再開發的四個階段,促進真正能表現出人類智慧的聊天機器人應用服務的發生。
About PeterWolf
- 卓騰語言科技創辦人
- NLP/NLU 應用開發者
- 1/2 以上的人生都在處理自然語言問題的辣個男人