Diferența dintre Deep Learning și Machine Learning Vs AI

Cuprins:

Anonim

Ce este AI?

AI (inteligența artificială) este o ramură a informaticii în care mașinile sunt programate și li se oferă o capacitate cognitivă de a gândi și imita acțiuni precum oamenii și animalele. Punctul de referință pentru IA este inteligența umană în ceea ce privește raționamentul, vorbirea, învățarea, viziunea și rezolvarea problemelor, care este departe în viitor.

AI are trei niveluri diferite:

  1. AI îngustă : se spune că o inteligență artificială este îngustă atunci când mașina poate îndeplini o sarcină specifică mai bine decât un om. Cercetările actuale ale IA sunt aici acum
  2. AI generală : o inteligență artificială ajunge la starea generală atunci când poate îndeplini orice sarcină intelectuală cu același nivel de precizie ca un om
  3. AI activă : o IA este activă atunci când poate învinge oamenii în multe sarcini

Sistemele AI timpurii au folosit sisteme de potrivire a modelelor și sisteme expert.

Prezentare generală a sistemului de inteligență artificială

În acest tutorial, veți învăța-

  • Ce este AI?
  • Ce este ML?
  • Ce este Deep Learning?
  • Procesul de învățare automată
  • Proces de învățare profundă
  • Automatizați extragerea caracteristicilor utilizând DL
  • Diferența dintre învățarea automată și învățarea profundă
  • Când se utilizează ML sau DL?

Ce este ML?

ML (Machine Learning) este un tip de IA în care un computer este instruit pentru a automatiza sarcini care sunt exhaustive sau imposibile pentru ființele umane. Este cel mai bun instrument pentru a analiza, a înțelege și a identifica tiparele din date bazate pe studiul algoritmilor computerului. Învățarea automată poate lua decizii cu o intervenție umană minimă.

Comparând inteligența artificială vs învățarea automată, învățarea automată utilizează date pentru a alimenta un algoritm care poate înțelege relația dintre intrare și ieșire. Când mașina a terminat învățarea, poate prezice valoarea sau clasa unui nou punct de date.

Ce este Deep Learning?

Învățarea profundă este un software de calculator care imită rețeaua de neuroni din creier. Este un subset de învățare automată și se numește învățare profundă, deoarece folosește rețele neuronale profunde. Aparatul folosește diferite straturi pentru a învăța din date. Adâncimea modelului este reprezentată de numărul de straturi din model. Învățarea profundă este noua stare de artă în termenii AI. În învățarea profundă, faza de învățare se face printr-o rețea neuronală. O rețea neuronală este o arhitectură în care straturile sunt stivuite una peste alta

Procesul de învățare automată

Imaginați-vă că sunteți menit să construiți un program care să recunoască obiecte. Pentru a instrui modelul, veți folosi un clasificator . Un clasificator folosește caracteristicile unui obiect pentru a încerca să identifice clasa căreia îi aparține.

În exemplu, clasificatorul va fi instruit pentru a detecta dacă imaginea este:

  • Bicicleta
  • Barcă
  • Mașină
  • Avion

Cele patru obiecte de mai sus sunt clasa pe care clasificatorul trebuie să o recunoască. Pentru a construi un clasificator, trebuie să aveți date ca intrare și să îi atribuiți o etichetă. Algoritmul va lua aceste date, va găsi un model și apoi îl va clasifica în clasa corespunzătoare.

Această sarcină se numește învățare supravegheată. În învățarea supravegheată, datele de instruire pe care le furnizați algoritmului includ o etichetă.

Antrenarea unui algoritm necesită parcurgerea câtorva pași standard:

  • Colectați datele
  • Antrenează clasificatorul
  • A face predictii

Primul pas este necesar, alegerea datelor corecte va face algoritmul să aibă succes sau eșec. Datele pe care le alegeți pentru a antrena modelul se numesc o caracteristică. În exemplul obiectului, caracteristicile sunt pixelii imaginilor.

Fiecare imagine este un rând în date, în timp ce fiecare pixel este o coloană. Dacă imaginea dvs. are o dimensiune de 28x28, setul de date conține 784 de coloane (28x28). În imaginea de mai jos, fiecare imagine a fost transformată într-un vector caracteristică. Eticheta spune computerului ce obiect este în imagine.

Procesul de învățare automată

Obiectivul este de a utiliza aceste date de instruire pentru a clasifica tipul de obiect. Primul pas constă în crearea coloanelor de caracteristici. Apoi, al doilea pas implică alegerea unui algoritm pentru a antrena modelul. Când se termină antrenamentul, modelul va prezice ce imagine corespunde cu ce obiect.

După aceea, este ușor de utilizat modelul pentru a prezice imagini noi. Pentru fiecare nouă imagine introdusă în model, aparatul va prezice clasa de care aparține. De exemplu, o imagine complet nouă, fără etichetă, trece prin model. Pentru o ființă umană, este banal să vizualizezi imaginea ca pe o mașină. Mașina își folosește cunoștințele anterioare pentru a prezice, de asemenea, imaginea este o mașină.

Proces de învățare profundă

În învățarea profundă, faza de învățare se face printr-o rețea neuronală. O rețea neuronală este o arhitectură în care straturile sunt stivuite una peste alta.

Luați în considerare același exemplu de imagine de mai sus. Setul de antrenament ar fi alimentat către o rețea neuronală

Fiecare intrare intră într-un neuron și este înmulțită cu o greutate. Rezultatul multiplicării curge la următorul strat și devine elementul de intrare. Acest proces se repetă pentru fiecare strat al rețelei. Stratul final este denumit stratul de ieșire; oferă o valoare reală pentru sarcina de regresie și o probabilitate a fiecărei clase pentru sarcina de clasificare. Rețeaua neuronală folosește un algoritm matematic pentru a actualiza greutățile tuturor neuronilor. Rețeaua neuronală este complet antrenată atunci când valoarea greutăților oferă o ieșire apropiată de realitate. De exemplu, o rețea neuronală bine antrenată poate recunoaște obiectul pe o imagine cu o precizie mai mare decât rețeaua neuronală tradițională.

Proces de învățare profundă

Automatizați extragerea caracteristicilor utilizând DL

Un set de date poate conține o duzină până la sute de caracteristici. Sistemul va învăța din relevanța acestor caracteristici. Cu toate acestea, nu toate caracteristicile sunt semnificative pentru algoritm. O parte crucială a învățării automate este de a găsi un set relevant de caracteristici care să facă sistemul să învețe ceva.

O modalitate de a efectua această parte în învățarea automată este utilizarea extracției caracteristicilor. Extragerea caracteristicilor combină caracteristicile existente pentru a crea un set mai relevant de caracteristici. Se poate face cu PCA, T-SNE sau cu orice alt algoritm de reducere a dimensionalității.

De exemplu, o prelucrare a imaginii, practicantul trebuie să extragă caracteristica manual în imagine, cum ar fi ochii, nasul, buzele și așa mai departe. Aceste caracteristici extrase sunt alimentate cu modelul de clasificare.

Învățarea profundă rezolvă această problemă, în special pentru o rețea neuronală convoluțională. Primul strat al unei rețele neuronale va afla mici detalii din imagine; straturile următoare vor combina cunoștințele anterioare pentru a face informații mai complexe. În rețeaua neuronală convoluțională, extragerea caracteristicii se face cu utilizarea filtrului. Rețeaua aplică un filtru imaginii pentru a vedea dacă există o potrivire, adică forma caracteristicii este identică cu o parte a imaginii. Dacă există o potrivire, rețeaua va utiliza acest filtru. Prin urmare, procesul de extragere a caracteristicilor se face automat.

Învățarea automată tradițională vs învățarea profundă

Diferența dintre învățarea automată și învățarea profundă

Mai jos este o diferență cheie între învățarea profundă și învățarea automată

Învățare automată

Invatare profunda

Dependențe de date

Performanțe excelente pe un set de date mic / mediu

Performanță excelentă pe un set de date mare

Dependențe hardware

Lucrați pe o mașină low-end.

Necesită o mașină puternică, de preferință cu GPU: DL efectuează o cantitate semnificativă de multiplicare a matricei

Ingineria caracteristicilor

Trebuie să înțelegeți caracteristicile care reprezintă datele

Nu este nevoie să înțelegeți cea mai bună caracteristică care reprezintă datele

Timpul de execuție

De la câteva minute la ore

Până la săptămâni. Rețeaua neuronală trebuie să calculeze un număr semnificativ de greutăți

Interpretabilitate

Unii algoritmi sunt ușor de interpretat (logistică, arborele decizional), unii sunt aproape imposibili (SVM, XGBoost)

Greu până la imposibil

Când se utilizează ML sau DL?

În tabelul de mai jos, rezumăm diferența dintre învățarea automată și învățarea profundă cu exemple.

Învățare automată Invatare profunda
Set de date de antrenament Mic Mare
Alegeți caracteristici da Nu
Număr de algoritmi Mulți Puțini
Timpul antrenamentului Mic de statura Lung

Cu învățarea automată, aveți nevoie de mai puține date pentru a instrui algoritmul decât învățarea profundă. Învățarea profundă necesită un set extins și divers de date pentru a identifica structura subiacentă. În plus, învățarea automată oferă un model mai rapid antrenat. Cea mai avansată arhitectură de învățare profundă poate dura câteva zile până la o săptămână pentru a se antrena. Avantajul învățării profunde față de învățarea automată este că este extrem de precis. Nu trebuie să înțelegeți ce caracteristici reprezintă cea mai bună reprezentare a datelor; rețeaua neuronală a învățat cum să selecteze caracteristici critice. În învățarea automată, trebuie să alegeți pentru dvs. ce caracteristici să includeți în model.

rezumat

Inteligența artificială conferă o mașină o capacitate cognitivă. Comparând AI față de învățarea automată, sistemele AI timpurii au folosit potrivirea modelelor și sistemele expert.

Ideea din spatele învățării automate este că mașina poate învăța fără intervenția umană. Mașina trebuie să găsească o modalitate de a învăța cum să rezolve o sarcină având în vedere datele.

Învățarea profundă este o descoperire în domeniul inteligenței artificiale. Atunci când există suficiente date pentru a vă antrena, învățarea profundă obține rezultate impresionante, în special pentru recunoașterea imaginilor și traducerea textului. Motivul principal este că extragerea caracteristicilor se face automat în diferitele straturi ale rețelei.