[ML筆記] Coursera 機器學習基石(上) Week2

Coursera 機器學習基石(上) Week2 筆記

使用機器學習來做是非題的問題

延續上次提到的信用卡同意評估系統

這次我們要探討 H 定義的內容

Perceptron：感知器

定義很多評估條件，乘上 weight 加總

有的條件是正面影響，有的是負面影響，最後加權加總後，檢調門檻值，去看最後的總分是正的還是負的，正的就核卡，負的就不核卡

把剛剛的式子符號簡化為 wTx

h(x) 在幾何上是一條線，把空間分割成兩個區域

當我們知道 H 在幾何上是一條線之後，H 裡面有無限多條線的可能，下一個問題就是，我們如何得到一條好線，可以成功地把不同的資料點區分出來，這條線就是 g

想法：先從一條現有的線出發，不斷地修正學習，讓他越來越好

一開始的線我們叫它 w0

PLA 演算法：

從一開始的 w 出發，遇到正確的點，就把方向修正近一點

遇到犯錯的點，就把方向修正遠一點，以此方式計算修正的方向，不斷修正直到都沒有犯錯為止，最後得到的 w 稱為 wPLA。

依序看所有的點，去計算更新方向

Perceptron Learning Algorithm (PLA)

	一開始從原點 (中心點)，隨機找一個點 x1 畫出一條線，我們找到的點剛好是對的，預設分類成對的(藍色區塊)，下一回合畫出的線就以原點到 x1 當作法向量。
如圖，目前我們的線大致都對，但是 x9 是圈圈被誤判到了，所以我們把目前的法向量跟原點到 x9 向量相加，得到紫色線，當作下一回合新分割線的法向量	這次的分割線所分割的兩區域中，仍然有許多誤判，隨機挑一個誤判點，假設我們挑到 x14 這個點，因為他是叉叉被誤判到藍色區了，所以這次我們法向量的更新策略，要與原點到x14 向量的反方向做相加

以 PLA algorithm 持續更新我們的分割線，直到沒有錯誤為止經過了若干回合的修正後，當我們的分割線不再有任何誤判情形時，演算法就可以停下來，得到我們在目前的資料集當中，最好的一條分割線