關於這門課
本課程將涵蓋挖掘和分析文字數據以發現有趣的模式、選取有用的知識和支持決策的主要科技,重點是統計方法,這些方法通常可以應用於任何自然語言中的任意文字數據,而無需或最少的人力。對文字數據的詳細分析需要理解自然語言文字,這是電腦的一項艱巨任務。然而,許多統計方法已經被證明可以很好地用於文字數據的“淺層”但健壯的分析,以用於模式發現和知識發現。您將學習文字挖掘的基本概念、原理和主要算灋及其潜在應用。
30%
完成這些課程後開始了新的職業生涯
38%
從這門課程中獲得了實實在在的職業利益
12%
加薪或升職
100%線上
立即開始,按照自己的時間表學習。
靈活的截止日期
根據你的時間表重新設定最後期限。
大約19小時完成
英語
字幕:英語、韓語
你將獲得的技能
數據聚類演算法MSTEXT最小概率模型預測分析
30%
完成這些課程後開始了新的職業生涯
38%
從這門課程中獲得了實實在在的職業利益
12%
加薪或升職
100%線上
立即開始,按照自己的時間表學習。
靈活的截止日期
根據你的時間表重新設定最後期限。
大約19小時完成
英語
字幕:英語、韓語
教學大綱-你將從本課程中學到什麼
第一周
方向
你將熟悉課程、同學和我們的學習環境。培訓還將幫助您獲得課程所需的科技技能。
2個視頻(總共15分鐘),5次閱讀,2次測驗
第一周
在本模塊中,您將學習總體課程設計、自然語言處理科技和文字表示的概述,這些是各種文字挖掘應用程序的基礎,以及單詞關聯挖掘,特別關注挖掘單詞關聯的兩種基本形式之一(即範例關係)。
9個視頻(總共109分鐘),1次閱讀,2次測驗
第2周
第2周
在本模塊中,您將學習有關單詞關聯挖掘的更多內容,特別是挖掘單詞關聯的其他基本形式(即組合關係),並開始學習主題分析,重點是從文字中挖掘一個主題的科技。
10個視頻(總共116分鐘),1次閱讀,2次測驗
第3周
第3周
在本模塊中,您將深入學習主題分析,包括混合模型及其工作原理、期望最大化(EM)算灋以及如何使用它來估計混合模型的參數、基本主題模型、概率潜在語義分析(PLSA)以及潜在Dirichlet分配(LDA)如何擴展PLSA。
10個視頻(總共103分鐘),2次閱讀,3次測驗
第4周
第4周
在本模塊中,您將學習文字聚類,包括基本概念、主要的聚類科技,包括概率方法和基於相似度的方法,以及如何評估文字聚類。您還將開始學習文字分類,它與文字聚類相關,但具有可被視為預定義聚類的預定義類別。
9個視頻(總共141分鐘),1次閱讀,2次測驗
來自文字挖掘和分析的頂級評論
滿天星滿天星滿天星滿天星滿天星
滿天星滿天星滿天星滿天星滿天星
截止日期:2018年3月25日
教練
開始攻讀碩士學位
本課程是伊利諾伊大學香檳分校計算機科學100%線上碩士課程的一部分。如果你被正式錄取,你的課程將計入你的學位學習。
關於資料挖掘專業化
資料挖掘專業為符合明確定義的模式的結構化數據和以自然語言文字形式存在的非結構化數據傳授資料挖掘科技。具體的課程主題包括模式發現、聚類、文字檢索、文字挖掘和分析以及數據視覺化。“頂點”項目的任務是使用Yelp提供的餐廳評論數据集解决現實世界中的資料挖掘挑戰。該專業的課程2-5構成了數據科學計算機科學碩士線上課程的授課組成部分。你可以在開始專業化之前或之後申請學位。。。。
- 我什麼時候能拿到講課和工作?
我什麼時候能拿到講課和工作?
- 如果我訂閱這個專業,我會得到什麼?
如果我訂閱這個專業,我會得到什麼?
- 退款政策是什麼?
退款政策是什麼?
- 有經濟援助嗎?
有經濟援助嗎?
還有問題嗎?訪問學習者幫助中心。