Ansforce

文章內容

機器學習(ML：Machine Learning)

Hightech 2017-09-24 A20170924001

點閱 6016

評論 16

基礎

請自行調高解析度

❐ 大腦的學習與判斷
要了解機器學習，就先回頭看看人類學習的過程，人類是如何學會辨識一隻貓的？大致上可以分為「訓練(Training)」與「預測(Predict)」兩個步驟：
➤訓練(Training)：又稱為「學習(Learning)」，小時候父母帶著我們看標註了動物名字的圖片，我們看到一隻小動物有四肢腳、尖耳朵、長鬍子等，對照圖片上的文字就知道這是貓，如果我們不小心把老虎當成貓，父母會糾正我們，因此我們就自然地學會辨識貓了，這就是我們「學習(Learning)」的過程，也可以說是父母在「訓練(Training)」我們。
➤推論(Inference)：又稱為「預測(Predict)」，等我們學會了辨識貓，下回去動物園看到一隻具有四肢腳、尖耳朵、長鬍子的小動物，我們就知道這是貓，如果我們不小心又把老虎當成貓，父母會再次糾正我們，或者我們自己反覆比較發現其實老虎和貓是不同的，即使父母沒有告訴我們，這個是我們判斷的過程，也可以說是我們在「預測(Predict)」事物。知識力www.ansforce.com。

❐ 機器的訓練與預測
要讓機器(電腦)像人類一樣具有學習與判斷的能力，就要把人類大腦學習與判斷的流程轉移到機器(電腦)，基本上就是運用數據進行「訓練(Training)」與「預測(Predict)」，包括下列四個步驟：
➤獲取數據：人類的大腦經由眼耳鼻舌皮膚收集大量的數據，才能進行分析與處理，機器學習也必須先收集大量的數據進行訓練。知識力www.ansforce.com。
➤分析數據：人類的大腦分析收集到的數據找出可能的規則，例如：下雨之後某個溫度與濕度下會出現彩虹，彩虹出現在與太陽相反的方向等。
➤建立模型：人類的大腦找出可能的規則後，會利用這個規則來建立「模型(Model)」，例如：下雨之後某個溫度與濕度、與太陽相反的方向等，就是大腦經由學習而來的經驗，機器學習裡的「模型(Model)」有點類似我們所謂的「經驗(Experience)」。
➤預測未來：等學習完成了，再將新的數據輸入模型就可以預測未來，例如：以後只要下雨，溫度與濕度達到標準，就可以預測與太陽相反的方向就可能會看到彩虹。

❐ 機器學習的分類
機器學習和人類學習的過程類似，要先進行「分類(Classification)」，才能分析理解並且進行判斷，最後才能採取行動，分類的過程其實就是一種「是非題(Yes或No)」，例如：這一張照片「是(Yes)」貓或「非(No)」貓。機器學習是由電腦執行程式自行學習，一邊處理大量資料，一邊自動學會分類方式，就如同人類在學習一樣，因此機器學習就是在進行資料處理，有許多不同的形式與名稱，包括：資料科學(Data science)、資料探勘(Data mining)、統計建模(Statistical modeling)、預測建模(Predictive modeling)、預測分析(Predictive analytics)、知識發現(Knowledge discovery)、圖形辨識(Pattern recognition)、自我調適系統(Adaptive systems)、自我組織系統(Self-organizing systems)等，都是機器學習的一種。

❐ 機器學習的種類

機器學習依照學習方式與過程的不同，可以分為下列四大類：

➤監督式學習(Supervised learning)：所有資料都有標準答案，可以提供機器學習在輸出時判斷誤差使用，預測時比較精準，就好像摸擬考有提供答案，學生考後可以比對誤差，這樣聯考時成績會比較好。例如：我們任意選出100張照片並且「標註(Label)」那些是貓那些是狗，輸入電腦後讓電腦學習認識貓與狗的外觀，因為照片已經標註了，因此電腦只要把照片內的「特徵(Feature)」取出來，將來在做預測時只要尋找這個特徵(四肢腳、尖耳朵、長鬍子)就可以辨識貓了！這種方法等於是人工「分類(Classification)」，對電腦而言最簡單，但是對人類來說最辛苦。
➤非監督式學習(Un-supervised learning)：所有資料都沒有標準答案，無法提供機器學習輸出時判斷誤差使用，機器必須自己尋找答案，預測時比較不準，就好像摸擬考沒有提供答案，學生考後無法比對誤差，這樣聯考時成績會比較差。例如：我們任意選出100張照片但是沒有標註，輸入電腦後讓電腦學習認識貓與狗的外觀，因為照片沒有標註，因此電腦必須自己嘗試把照片內的「特徵(Feature)」取出來，同時自己進行「分類(Classification)」，將來在做預測時只要尋找這個特徵(四肢腳、尖耳朵、長鬍子)就可以辨識是「那一類動物」了！這種方法不必人工分類，對人類來說最簡單，但是對電腦來說最辛苦，而且判斷誤差比較大。
➤半監督式學習(Semi-supervised learning)：少部分資料有標準答案，可提供機器學習輸出時判斷誤差使用；大部分資料沒有標準答案，機器必須自己尋找答案，等於是結合監督式與非監督式學習的優點。例如：我們任意選出100張照片，其中10張「標註(Label)」那些是貓那些是狗，輸入電腦後讓電腦學習認識貓與狗的外觀，電腦只要把照片內的「特徵(Feature)」取出來，再自己嘗試把另外90張照片內的「特徵(Feature)」取出來，同時自己進行「分類(Classification)」。這種方法只需要少量的人工分類，又可以讓預測時比較精準，是目前最常使用的一種方式。
➤增強式學習(Reinforcement learning)：機器自己嘗試錯誤並且找出最佳答案，可以視為一種「非監督式學習」。前面介紹的三種學習方式，都必須有明確的答案，也有明確的決策，例如：這封信是不是垃圾郵件？這張照片是不是貓？如果遇到必須做出連續決策的時候，就必須一步步修正答案與決策，例如：進行圍棋遊戲時，必須依照對手的每一步棋來修正下一步要怎麼走，或是自動駕駛車，必須依照路況的變化來修正下一步要怎麼走等，就是屬於增強式學習。知識力www.ansforce.com。

❐ 馬可夫決策過程(MDP：Markov Decision Process)
馬可夫決策過程的概念是「事件未來的情況只和現在有關，和過去無關」，主要在討論一個隨機動態系統的最佳決策過程。機器學習裡的增「強式學習」，每進行一步就檢查是距離目標更近或更遠，如果更接近目標則給予「正向回饋(Positive feedback)」，如果更遠離目標則給予「負向回饋(Negative feedback)」，這樣最後的決策就會愈來愈接近正確的答案。

很多人以為人工智慧只是應用在圍棋AlphaGo打敗世界棋王，或是電影裡的智慧機器人，似乎和我們沒有立即的關係，其實前面介紹的這些機器學習相關的資料處理演算法，早就應用在我們日常生活裡了！當瀏覽器收集了我們上線瀏覽網頁的資料，演算法就開始分析我們的行為並且預測我們會對什麼東西有興趣，於是許多相關的廣告就顯示在瀏覽器旁邊，由於瀏覽器的空間有限只能先選擇已知過去的資料分析出我們可能最有興趣的廣告，再依照我們現在點擊的情況修正未來投放的廣告內容，其實這就是利用馬可夫決策過程(MDP)的一種增強式學習，包括：Google廣告決定投放什麼內容、Facebook把我們最可能有興趣的文章放在前面等都是利用這個技術。知識力www.ansforce.com。

【請注意】上述內容經過適當簡化以適合大眾閱讀，與產業現狀可能會有差異，若您是這個領域的專家想要提供意見，請自行聯絡作者；若有產業與技術問題請參與社群討論。