機器學習-線性回歸分析(linear regression)

七月 16, 2018 Python機器學習

Introduction 數據集的目標值(target)是一個連續型的值，便是一個回歸問題回歸問題應用於房價分析、銷售額預測、貸款額度回歸：在具有線性關係的點中，尋找一種能預測的趨勢回歸演算法為迭代演算法(訓練結果會使預測結果越來越好) 訓練時會產生誤差且知道誤差，在訓練的過程中不斷地減少誤差

Continue Reading →

機器學習-演算法-隨機森林(random forest)

七月 14, 2018 Python機器學習

隨機森林(random forest)在機器學習中，隨機森林是一個包含多個決策樹的分類器，並且其輸出的類別是由個別樹輸出的類別的眾數而定如果訓練了五個樹其中有四個樹的結果為True，一個的結果為False，那麼最終的結果為True(投票決定)

Continue Reading →

機器學習-演算法-決策樹(decision tree)

七月 14, 2018 Python機器學習

Introduction程序設計中的條件分支結構就是if-else結構，最早的決策樹就是利用這類結構分割數據的一種分類學習方法去找到高效的決策順序特徵的先後順序

Continue Reading →

機器學習-模型的選擇與調校參數

七月 10, 2018 Python機器學習

交叉驗證(cross validation) 目的：為了讓被評估的模型更加準確可信觀察模型穩定性的一種方法交叉驗證通常搭配網格搜索一起使用將訓練數據分成n等分，以下圖為例：讓其中一等分當作驗證集其他則為訓練集，總共驗證5次(組)，每次更換不同的驗證集，得到5組模型的結果，求出準確率的平均值作為最終結果，又稱5折交叉驗證

Continue Reading →

機器學習-分類模型評估

七月 9, 2018 Python機器學習

Introduction 前面對兩種分類模型皆調用score()方法查看準確率，其就是一種對模型的評估，返回預測結果正確的百分比 sklearn還存在許多對預測模型評估的方法皆收錄在sklearn.metrics中這一章節只著重在對分類模型的評估還有其他對分類模型評估的指標包括精確率(precision) 與召回率(recall)

Continue Reading →