Ce este învățarea automată supravegheată?
În învățarea supravegheată, instruiți mașina folosind date care sunt bine „etichetate ”. Înseamnă că unele date sunt deja etichetate cu răspunsul corect. Poate fi comparat cu învățarea care are loc în prezența unui supraveghetor sau a unui profesor.
Un algoritm de învățare supravegheat învață din datele de formare etichetate, vă ajută să preziceți rezultatele pentru datele neprevăzute. Construirea, scalarea și implementarea cu succes a învățării automate supravegheate cu precizie Modelul științei datelor necesită timp și expertiză tehnică de la o echipă de oameni de știință de date cu înaltă calificare. Mai mult, omul de știință al datelor trebuie să reconstruiască modele pentru a se asigura că informațiile oferite rămân adevărate până la modificarea datelor sale.
În acest tutorial, veți învăța
- Ce este învățarea automată supravegheată?
- Ce este învățarea fără supraveghere?
- De ce învățarea supravegheată?
- De ce învățarea nesupravegheată?
- Cum funcționează învățarea supravegheată?
- Cum funcționează învățarea fără supraveghere?
- Tipuri de tehnici de învățare automată supravegheate
- Tipuri de tehnici de supraveghere automată fără supraveghere
- Învățare supravegheată vs. învățare nesupravegheată
Ce este învățarea fără supraveghere?
Învățarea fără supraveghere este o tehnică de învățare automată, în care nu trebuie să supravegheați modelul. În schimb, trebuie să permiteți modelului să funcționeze singur pentru a descoperi informații. Se ocupă în principal de datele neetichetate.
Algoritmii de învățare nesupravegheați vă permit să efectuați sarcini de procesare mai complexe în comparație cu învățarea supravegheată. Deși, învățarea nesupravegheată poate fi mai imprevizibilă în comparație cu alte metode de învățare naturală profundă și metode de învățare de consolidare.
De ce învățarea supravegheată?
- Învățarea supravegheată vă permite să culegeți date sau să produceți rezultate din experiența anterioară.
- Vă ajută să optimizați criteriile de performanță folosind experiența
- Învățarea automată supravegheată vă ajută să rezolvați diferite tipuri de probleme de calcul din lumea reală.
De ce învățarea nesupravegheată?
Iată care sunt principalele motive pentru utilizarea învățării fără supraveghere:
- Învățarea automată fără supraveghere găsește tot felul de tipare necunoscute în date.
- Metodele nesupravegheate vă ajută să găsiți caracteristici care pot fi utile pentru clasificare.
- Acesta are loc în timp real, astfel încât toate datele de intrare să fie analizate și etichetate în prezența cursanților.
- Este mai ușor să obțineți date neetichetate de pe un computer decât datele etichetate, care necesită intervenție manuală.
Cum funcționează învățarea supravegheată?
De exemplu, doriți să instruiți o mașină pentru a vă ajuta să preziceți cât de mult vă va dura să conduceți acasă de la locul de muncă. Aici, începeți prin crearea unui set de date etichetate. Aceste date includ
- Conditiile meteo
- Timpul zilei
- Sărbători
Toate aceste detalii sunt contribuțiile dvs. Rezultatul este cantitatea de timp necesară pentru a reveni acasă în acea zi specifică.
Știi instinctiv că, dacă plouă afară, atunci îți va lua mai mult timp să conduci acasă. Dar aparatul are nevoie de date și statistici.
Să vedem acum cum puteți dezvolta un model de învățare supravegheat al acestui exemplu care să ajute utilizatorul să determine timpul de navetă. Primul lucru pe care trebuie să îl creați este un set de date de antrenament. Acest set de antrenament va conține timpul total de deplasare și factori corespunzători, cum ar fi vremea, ora etc. Pe baza acestui set de antrenament, aparatul dvs. poate vedea că există o relație directă între cantitatea de ploaie și timpul pe care îl veți lua pentru a ajunge acasă.
Deci, se constată că, cu cât plouă mai mult, cu atât veți conduce mai mult timp pentru a vă întoarce acasă. S-ar putea vedea, de asemenea, legătura dintre timpul în care pleci de la serviciu și timpul în care vei fi pe drum.
Cu cât ești mai aproape de ora 18, cu atât îți ia mai mult timp până ajungi acasă. Aparatul dvs. poate găsi unele dintre relațiile cu datele etichetate.
Acesta este începutul modelului dvs. de date. Începe să aibă impact asupra modului în care ploaia influențează modul în care oamenii conduc. De asemenea, începe să se vadă că mai mulți oameni călătoresc într-un anumit moment al zilei.
Cum funcționează învățarea fără supraveghere?
Să luăm cazul unui bebeluș și al câinelui ei de familie.
Ea cunoaște și identifică acest câine. Câteva săptămâni mai târziu, un prieten de familie aduce un câine și încearcă să se joace cu copilul.
Copilul nu a văzut acest câine mai devreme. Dar recunoaște multe trăsături (2 urechi, ochi, mers pe 4 picioare) sunt ca câinele ei de companie. Ea identifică un nou animal ca un câine. Aceasta este o învățare nesupravegheată, în care nu sunteți învățat, dar învățați din datele (în acest caz date despre un câine.) Dacă această învățare ar fi fost supravegheată, prietenul familiei i-ar fi spus copilului că este un câine.
Tipuri de tehnici de învățare automată supravegheate
Regresie:
Tehnica de regresie prezice o singură valoare de ieșire folosind datele de antrenament.
Exemplu: puteți utiliza regresia pentru a prezice prețul casei din datele de instruire. Variabilele de intrare vor fi localitatea, dimensiunea unei case etc.
Clasificare:
Clasificare înseamnă gruparea ieșirii într-o clasă. Dacă algoritmul încearcă să eticheteze intrarea în două clase distincte, se numește clasificare binară. Selectarea dintre mai mult de două clase este denumită clasificare multiclass.
Exemplu : Determinarea faptului dacă cineva va fi sau nu contravenient al împrumutului.
Puncte forte : Ieșirile au întotdeauna o interpretare probabilistică, iar algoritmul poate fi regularizat pentru a evita supraadaptarea.
Puncte slabe : Regresia logistică poate avea performanțe slabe atunci când există limite de decizie multiple sau neliniare. Această metodă nu este flexibilă, deci nu surprinde relații mai complexe.
Tipuri de tehnici de supraveghere automată fără supraveghere
Problemele de învățare nesupravegheate s-au grupat în continuare în probleme de grupare și de asociere.
Clustering
Clusterizarea este un concept important atunci când vine vorba de învățare nesupravegheată. Se ocupă în principal de găsirea unei structuri sau tipare într-o colecție de date necategorizate. Algoritmii de grupare vă vor procesa datele și vor găsi clustere naturale (grupuri) dacă acestea există în date. De asemenea, puteți modifica câte clustere ar trebui să identifice algoritmii dvs. Vă permite să ajustați granularitatea acestor grupuri.
Asociere
Regulile de asociere vă permit să stabiliți asociații între obiecte de date în baze de date mari. Această tehnică nesupravegheată este despre descoperirea unor relații interesante între variabile în baze de date mari. De exemplu, persoanele care cumpără o casă nouă cel mai probabil să cumpere mobilier nou.
Alte exemple:
- Un subgrup de pacienți cu cancer grupați după măsurătorile lor de expresie genică
- Grupuri de cumpărători pe baza istoricelor de navigare și cumpărare
- Grup de filme după evaluarea acordată de spectatorii de filme
Învățare supravegheată vs. învățare nesupravegheată
Parametrii | Tehnica de învățare automată supravegheată | Tehnica de supraveghere automată fără supraveghere |
Proces | Într-un model de învățare supravegheat, vor fi date variabile de intrare și ieșire. | În modelul de învățare nesupravegheat, vor fi date doar datele de intrare |
Date de intrare | Algoritmii sunt instruiți folosind date etichetate. | Algoritmii sunt folosiți împotriva datelor care nu sunt etichetate |
Algoritmi utilizați | Suportă mașină vectorială, rețea neuronală, regresie liniară și logistică, pădure aleatorie și arbori de clasificare. | Algoritmii nesupravegheați pot fi împărțiți în diferite categorii: cum ar fi algoritmii Cluster, mijloacele K, clusterizarea ierarhică etc. |
Complexitatea Computațională | Învățarea supravegheată este o metodă mai simplă. | Învățarea fără supraveghere este complexă din punct de vedere al calculului |
Utilizarea datelor | Modelul de învățare supravegheat folosește datele de instruire pentru a învăța o legătură între intrări și ieșiri. | Învățarea nesupravegheată nu folosește date de ieșire. |
Precizia rezultatelor | Metodă foarte precisă și de încredere. | Metodă mai puțin precisă și de încredere. |
Învățare în timp real | Metoda de învățare are loc offline. | Metoda de învățare are loc în timp real. |
Numărul de clase | Se cunoaște numărul de clase. | Numărul de clase nu este cunoscut. |
Dezavantaj principal | Clasificarea datelor mari poate fi o adevărată provocare în învățarea supravegheată. | Nu puteți obține informații precise cu privire la sortarea datelor, iar rezultatul ca date utilizate în învățarea nesupravegheată este etichetat și nu este cunoscut. |
rezumat
- În învățarea supravegheată, instruiți mașina folosind date care sunt bine „etichetate”.
- Învățarea fără supraveghere este o tehnică de învățare automată, în care nu trebuie să supravegheați modelul.
- Învățarea supravegheată vă permite să culegeți date sau să produceți rezultate din experiența anterioară.
- Învățarea automată fără supraveghere vă ajută să găsiți tot felul de tipare necunoscute în date.
- De exemplu, veți putea determina timpul necesar pentru a vă întoarce în funcție de condițiile meteorologice, orele zilei și de sărbători.
- De exemplu, Baby poate identifica alți câini pe baza învățării supravegheate din trecut.
- Regresia și clasificarea sunt două tipuri de tehnici de învățare automată supravegheate.
- Clusterizarea și asocierea sunt două tipuri de învățare fără supraveghere.
- Într-un model de învățare supravegheat, variabilele de intrare și ieșire vor fi date în timp ce cu modelul de învățare nesupravegheat, vor fi date doar datele de intrare