在此演講中,講者將分享使用開源套件 Snorkel 進行文字資料處理的心得分享。Snorkel 是一個處理文字資料的套件庫,可以進行弱監督的資料標記並且進行資料增幅。內容將穿插資料處理觀念、論文重點導讀、與 Snorkel 實作案例,期待你能夠在聽完後能理解資料增幅的優勢與限制,並知道要如何運用 Snorkel 在自己的 NLP 專案中進行資料集的創建與增幅。
About EasonC13
本名陳怡升,名字的含義是「怡」然自得的提「升」自己,希望能帶著快樂的心成長向上。
現於臺師大學習科學學士班讀四年級,並且在新創 Cohart 擔任研發工程師。感興趣的領域為區塊鏈、AI、人機互動的研究,擅長快速學習並實作新技術。更多關於 Eason 請見 https://eason.best