機器學習與深度學習之間有何區別?
機器學習 (ML) 是培訓電腦程式或系統在不需要由人類輸入精確指令的情況下執行任務的科學。電腦系統使用 ML 演算法來處理大量資料、識別資料模式,並預測未知或新案例的準確結果。深度學習是 ML 的一個子集,它使用以人類大腦為模型的特定演算法結構,稱為神經網路。深度學習方法會嘗試將通常需要人類智慧的更複雜任務自動化。例如,您可以使用深度學習來描述影像、翻譯文件或將聲音檔案轉錄為文字。
機器學習與深度學習之間有何相似之處?
您可以同時使用機器學習 (ML) 和深度學習,來識別資料中的模式。兩者都依賴於資料集來訓練以複雜數學模型為基礎的演算法。在訓練期間,演算法會發現已知輸出與輸入之間的關聯性。模型隨後可根據未知輸入自動產生或預測輸出。與傳統的程式設計不同,學習程式也是自動的,只需最低限度的人為介入。
以下是 ML 與深度學習之間的其他相似之處。
人工智慧技術
ML 和深度學習都是資料科學和人工智慧 (AI) 的子集。它們都能完成複雜的運算任務,否則透過傳統的程式設計技術,需要花費大量的時間和資源才能實現。
統計基礎
深度學習與 ML 都使用統計方法來訓練其演算法和資料集。這些技術涉及迴歸分析、決策樹、線性代數和微積分。ML 專家和深度學習專家都很了解統計學。
大型資料集
ML 和深度學習都需要大量優質訓練資料,才能做出更準確的預測。例如,ML 模型每個功能需要大約 50–100 個資料點,而深度學習模型每個功能至少需要數千個資料點。
廣泛而多樣的應用
深度學習和 ML 解決方案可解決所有產業和應用程式中的複雜問題。如果您使用傳統的程式設計和統計方法,這些類型的問題將需要更多時間來解決或最佳化。
運算能力要求
訓練和執行機器學習演算法需要大量運算能力,而深度學習由於複雜性增加,其運算需求甚至更高。由於運算能力和雲端資源的最新進展,現在人員可同時使用兩者。
逐步改善
隨著 ML 和深度學習解決方案擷取更多資料,它們在模式識別方面變得更加準確。當輸入新增至系統時,系統透過將其用作訓練資料點來做出改善。
機器學習的哪些限制引起向深度學習的演進?
傳統的機器學習 (ML) 需要透過特徵工程進行大量人機互動,才能產生結果。例如,如果您正在訓練 ML 模型來對貓和狗的影像進行分類,則必須手動設定以識別眼睛形狀、尾巴形狀、耳朵形狀、鼻子輪廓等特徵。
由於 ML 的目標是減少人為介入的需求,因此深度學習技術不需要人類在每個步驟中標記資料。
儘管深度學習已經存在數十年,但 2000 年代初期,Yann LeCun、Yoshua Bengio 和 Geoffrey Hinton 等科學家更詳細地探索了該領域。雖然科學家發展了深度學習,但在此期間,大型和複雜的資料集卻受到限制,而且訓練模型所需的處理能力也非常昂貴。在過去 20 年間,這些情況有所改善,並且深度學習現在已具有商業利益。
主要差異:機器學習與深度學習
深度學習是機器學習 (ML) 的子集。您可以將其視為先進 ML 技術。兩者都具有廣泛的應用。然而,深度學習解決方案需要更多的資源,包括更大型的資料集、基礎設施要求和後續成本。
以下是 ML 和深度學習之間的其他差異。
預期使用案例
決定使用 ML 或深度學習取決於您需要處理的資料類型。ML 可識別結構化資料中的模式,例如分類和建議系統。例如,公司可以使用 ML,根據之前的客戶流失資料來預測客戶何時會取消訂閱。
另一方面,深度學習解決方案更適合非結構化資料,其中需要高層級抽象來擷取功能。深度學習任務包括影像分類和自然語言處理,這些任務需要識別資料物件之間的複雜關係。例如,深度學習解決方案可以分析社交媒體提及的內容,以判斷使用者情緒。
解決問題的方法
傳統的 ML 通常需要特徵工程,人們可以從原始資料中手動選取並擷取特徵,並為其指派權重。相反地,深度學習解決方案會以最少的人為介入來執行特徵工程。
深度學習的神經網路架構在設計上更為複雜。深度學習解決方案的學習方式以人類大腦的運作方式為模型,並以節點代表神經元。深度神經網路包括三層或以上節點,包括輸入和輸出層節點。
在深度學習中,神經網路中的每個節點都會自動為每個功能指派權重。資訊從輸入到輸出的向前方向透過網路流動。然後計算預測輸出與實際輸出之間的差異。而且會透過網路反向傳播此錯誤,以調整神經元的權重。
由於自動加權程序、架構層級的深度以及所採用的技術,因此需要一個模型才能解決深度學習中比 ML 更多的操作。
訓練方法
ML 具有四種主要的訓練方法:監督式學習、非監督式學習、半監督式學習和強化學習。其他訓練方法包括轉移學習和自我監督式學習。
相較之下,深度學習演算法會使用多種較為複雜的訓練方法。其中包括卷積神經網路、遞歸神經網路、生成式對抗網路和自動編碼器。
效能
ML 和深度學習都有特定的使用案例,其效能都比另一個更優異。
若是更簡單的任務,例如識別新傳入的垃圾郵件,ML 很合適,並且通常會優於深度學習解決方案。若是更複雜的任務,例如醫學成像識別,深度學習解決方案優於 ML 解決方案,因為它們可以識別人眼看不到的異常狀況。
人為參與
ML 和深度學習解決方案都需要大量人為參與才能運作。人員必須定義問題、準備資料、選取和訓練模型,然後評估、最佳化和部署解決方案。
ML 模型可便於讓人員解釋,因為它們是從簡單的數學模型 (例如決策樹) 衍生而來。
相反地,深度學習模型需要大量時間才能進行詳細分析,因為模型在數學上很複雜。話雖如此,神經網路學習的方式消除了人們標記資料的需要。您可以選擇預先訓練的模型和平台,進一步減少人為參與。
基礎設施要求
由於它們更複雜且需要更大型的資料集,因此深度學習模型要求比 ML 模型更大的儲存空間和運算能力。ML 資料和模型可以在單一執行個體或伺服器叢集上執行,而深度學習模型通常需要高效能叢集和其他可靠的基礎設施。
深度學習解決方案的基礎設施需求可能會產生比 ML 更高的成本。對於執行深度學習解決方案,現場基礎設施可能不實際或不具成本效益。您可以使用可擴展的基礎設施和全受管深度學習服務來控制成本。
差異摘要:機器學習與深度學習
機器學習 |
深度學習 |
|
這是什麼? |
ML 是一種人工智慧 (AI) 方法。並非所有 ML 都是深度學習。 |
深度學習是一種進階 ML 方法。所有深度學習都是 ML。 |
最適合 |
ML 最適合具有結構化和標記資料的明確定義任務。 |
深度學習最適合需要機器理解非結構化資料的複雜任務。 |
問題解決方法 |
ML 透過統計學和數學來解決問題。 |
深度學習將統計學和數學與神經網路架構相結合。 |
培訓 |
您必須從原始資料中手動選取和擷取特徵,並指派權重來訓練 ML 模型。 |
深度學習模型可利用對已知錯誤的意見回饋來進行自我學習。 |
所需資源 |
ML 不太複雜,且具有較少的資料量。 |
深度學習更複雜,且具有非常大的資料量。 |
AWS 如何支援您的機器學習和深度學習需求?
Amazon Web Services (AWS) 上有許多機器學習 (ML) 和深度學習 (DL) 解決方案。它們允許您在所有應用程式和使用案例中整合人工智慧 (AI)。
針對傳統的 ML,Amazon SageMaker 是一個完整的平台,可在功能強大且可擴展的雲端基礎設施上建置、訓練和部署演算法。
針對您的深度學習需求,您可以使用如下所示全受管服務:
- Amazon Comprehend 可協助您使用自然語言處理,從任何文字中探索寶貴的洞察,或者使用 Amazon Comprehend Medical 用於處理更複雜的醫療文字。
- Amazon Fraud Detector 可協助您根據歷史記錄來偵測詐騙作業。
- Amazon Lex 可協助您建置智慧型聊天機器人和交談介面。
- Amazon Personalize 可協助您快速區隔客戶,並建立經策管的建議系統。
- Amazon Polly 可協助您從數十種語言的輸入文字中,產生自然發音的口語文字。
- Amazon Rekognition 可協助您進行預先建置的影像識別和影片分析。
- Amazon Textract 可協助您從任何電腦產生或手寫的文件中擷取文字。
立即建立免費的 AWS 帳戶,開始使用機器學習和深度學習。