Top 50 de întrebări de interviuri despre învățarea automată & Răspunsuri

Anonim

Descărcați PDF

1) Ce este învățarea automată?

Învățarea automată este o ramură a informaticii care se ocupă cu programarea sistemului pentru a învăța și a îmbunătăți automat cu experiență. De exemplu: roboții sunt programați astfel încât să poată îndeplini sarcina pe baza datelor colectate de la senzori. Învață automat programe din date.

2) Menționați diferența dintre Data Mining și Machine learning?

Învățarea automată se referă la studiul, proiectarea și dezvoltarea algoritmilor care oferă computerelor capacitatea de a învăța fără a fi programate în mod explicit. În timp ce, extragerea datelor poate fi definită ca procesul în care datele nestructurate încearcă să extragă cunoștințe sau tipare interesante necunoscute. În timpul acestei mașini de proces, se utilizează algoritmi de învățare.

3) Ce este „supradaptarea” în învățarea automată?

În învățarea automată, atunci când un model statistic descrie o eroare aleatorie sau un zgomot în loc de relația subiacentă apare „supraadaptarea”. Atunci când un model este excesiv de complex, supravegherea este observată în mod normal, deoarece are prea mulți parametri în ceea ce privește numărul de tipuri de date de antrenament. Modelul prezintă performanțe slabe, care au fost excesive.

4) De ce se întâmplă supra-dotarea?

Posibilitatea supra-dotării există deoarece criteriile utilizate pentru instruirea modelului nu sunt aceleași cu criteriile utilizate pentru a judeca eficacitatea unui model.

5) Cum puteți evita supra-dotarea?

Folosind o mulțime de date, supraevaluarea poate fi evitată, supradaptarea se întâmplă relativ, deoarece aveți un set de date mic și încercați să învățați din acesta. Dar dacă aveți o bază de date mică și sunteți forțați să veniți cu un model bazat pe asta. Într-o astfel de situație, puteți utiliza o tehnică cunoscută sub numele de validare încrucișată . În această metodă, setul de date se împarte în două secțiuni, seturi de date de testare și instruire, setul de date de testare va testa modelul numai în timp ce, în setul de date de instruire, punctele de date vor veni cu modelul.

În această tehnică, unui model i se oferă de obicei un set de date cu date cunoscute pe care se desfășoară antrenamentul (setul de date de antrenament) și un set de date cu date necunoscute împotriva cărora este testat modelul. Ideea validării încrucișate este de a defini un set de date pentru a „testa” modelul în faza de instruire.

6) Ce este învățarea prin mașini inductive?

Învățarea automată inductivă implică procesul de învățare prin exemple, în care un sistem, dintr-un set de instanțe observate, încearcă să inducă o regulă generală.

7) Care sunt cei cinci algoritmi populari ai învățării automate?

  • Arbori de decizie
  • Rețele neuronale (propagare înapoi)
  • Rețele probabilistice
  • Cel mai apropiat vecin
  • Sprijină mașinile vectoriale

8) Care sunt diferitele tehnici de algoritm în învățarea automată?

Diferitele tipuri de tehnici în învățarea automată sunt

  • Învățare supravegheată
  • Învățare fără supraveghere
  • Învățare semi-supravegheată
  • Consolidarea învățării
  • Transducție
  • Învățarea de a învăța

9) Care sunt cele trei etape pentru construirea ipotezelor sau modelului în învățarea automată?

  • Construirea modelului
  • Testarea modelului
  • Aplicarea modelului

10) Care este abordarea standard a învățării supravegheate?

Abordarea standard a învățării supravegheate este de a împărți setul de exemple în setul de instruire și test.

11) Ce este „Set de antrenament” și „Set de test”?

În diverse domenii ale științei informației, cum ar fi învățarea automată, un set de date este utilizat pentru a descoperi relația potențial predictivă cunoscută sub numele de „Set de instruire”. Setul de instruire este un exemplu dat cursantului, în timp ce setul de testare este utilizat pentru a testa acuratețea ipotezelor generate de cursant și este setul de exemple reținut de cursant. Setul de antrenament este diferit de setul de testare.

12) Enumerați diferite abordări pentru învățarea automată?

Diferitele abordări în învățarea automată sunt

  • Concept Vs Clasificare Învățare
  • Simbolic Vs Învățarea statistică
  • Inductiv Vs Învățarea analitică

13) Ce nu este învățarea automată?

  • Inteligență artificială
  • Inferință bazată pe reguli

14) Explicați care este funcția „Învățare fără supraveghere”?

  • Găsiți grupuri de date
  • Găsiți reprezentări de dimensiuni reduse ale datelor
  • Găsiți direcții interesante în date
  • Coordonate și corelații interesante
  • Găsiți noi observații / curățarea bazelor de date

15) Explicați care este funcția „Învățării supravegheate”?

  • Clasificări
  • Recunoaștere a vorbirii
  • Regresie
  • Preziceți seriile de timp
  • Adnotați șirurile

16) Ce este învățarea automată independentă de algoritmi?

Învățarea automată în care fundațiile matematice sunt independente de orice clasificator particular sau algoritmul de învățare este denumit învățare automată independentă a algoritmului?

17) Care este diferența dintre învățarea artificială și învățarea automată?

Proiectarea și dezvoltarea algoritmilor în funcție de comportamentele bazate pe date empirice sunt cunoscute sub numele de Machine Learning. În timp ce inteligența artificială pe lângă învățarea automată, acoperă și alte aspecte precum reprezentarea cunoștințelor, procesarea limbajului natural, planificarea, robotica etc.

18) Ce este clasificatorul în învățarea automată?

Un clasificator într-o învățare automată este un sistem care introduce un vector de valori ale caracteristicilor discrete sau continue și scoate o singură valoare discretă, clasa.

19) Care sunt avantajele Naive Bayes?

În Naïve Bayes, clasificatorul va converge mai repede decât modelele discriminative, cum ar fi regresia logistică, deci aveți nevoie de mai puține date de formare. Principalul avantaj este că nu poate învăța interacțiunile dintre caracteristici.

20) În ce domenii se folosește Recunoașterea modelelor?

Recunoașterea modelelor poate fi utilizată în

  • Viziunea computerizată
  • Recunoaștere a vorbirii
  • Exploatarea datelor
  • Statistici
  • Recuperare informală
  • Bioinformatica

21) Ce este programarea genetică?

Programarea genetică este una dintre cele două tehnici utilizate în învățarea automată. Modelul se bazează pe testare și selectarea celei mai bune alegeri dintr-un set de rezultate.

22) Ce este programarea logică inductivă în învățarea automată?

Programarea logică inductivă (ILP) este un subcâmp al învățării automate care folosește programarea logică reprezentând cunoștințe de fundal și exemple.

23) Ce este selecția modelului în învățarea automată?

Procesul de selectare a modelelor dintre diferite modele matematice, care sunt utilizate pentru a descrie același set de date este cunoscut sub numele de Selecție model. Selecția modelului se aplică în domeniile statisticii, învățării automate și prelucrării datelor.

24) Care sunt cele două metode utilizate pentru calibrare în învățarea supravegheată?

Cele două metode utilizate pentru a prezice probabilități bune în învățarea supravegheată sunt

  • Calibrare Platt
  • Regresia izotonică

Aceste metode sunt concepute pentru clasificarea binară și nu este banală.

25) Ce metodă este frecvent utilizată pentru a preveni supraadaptarea?

Atunci când există suficiente date, se folosește „Regresia izotonică” pentru a preveni o problemă de supra-dotare.

26) Care este diferența dintre euristica pentru învățarea regulilor și euristica pentru arborii de decizie?

Diferența constă în faptul că euristicile pentru arborii de decizie evaluează calitatea medie a unui număr de seturi neunite, în timp ce cursanții de regulă evaluează doar calitatea setului de instanțe care este acoperit de regula candidatului.

27) Ce este Perceptron în învățarea automată?

În învățarea automată, Perceptron este un algoritm pentru clasificarea supravegheată a intrării într-una dintre mai multe ieșiri posibile non-binare.

28) Explicați cele două componente ale programului logic Bayesian?

Programul logic Bayesian este format din două componente. Prima componentă este una logică; constă dintr-un set de Clauze Bayesiene, care surprinde structura calitativă a domeniului. A doua componentă este una cantitativă, codifică informațiile cantitative despre domeniu.

29) Ce sunt rețelele Bayesian (BN)?

Rețeaua Bayesiană este utilizată pentru a reprezenta modelul grafic pentru relația de probabilitate între un set de variabile.

30) De ce algoritmul de învățare bazat pe instanțe numit uneori algoritm de învățare leneș?

Algoritmul de învățare bazat pe instanțe este, de asemenea, denumit algoritm de învățare leneș, deoarece întârzie procesul de inducere sau generalizare până când se efectuează clasificarea.

31) Care sunt cele două metode de clasificare pe care SVM (Support Vector Machine) le poate gestiona?

  • Combinarea clasificatorilor binari
  • Modificare binară pentru a încorpora învățarea multiclasă

32) Ce este învățarea ansamblului?

Pentru a rezolva un anumit program de calcul, mai multe modele, cum ar fi clasificatoare sau experți, sunt generate și combinate strategic. Acest proces este cunoscut sub numele de învățare în ansamblu.

33) De ce se folosește învățarea în ansamblu?

Învățarea ansamblului este utilizată pentru a îmbunătăți clasificarea, predicția, aproximarea funcției etc. a unui model.

34) Când se folosește învățarea ansamblului?

Învățarea ansamblului este utilizată atunci când creați clasificatori de componente care sunt mai exacți și independenți unul de celălalt.

35) Care sunt cele două paradigme ale metodelor de ansamblu?

Cele două paradigme ale metodelor de ansamblu sunt

  • Metode de ansamblu secvențial
  • Metode de ansamblu paralel

36) Care este principiul general al unei metode de ansamblu și ce înseamnă punerea și amplificarea în metoda ansamblului?

Principiul general al unei metode de ansamblu este de a combina predicțiile mai multor modele construite cu un algoritm de învățare dat pentru a îmbunătăți robustețea asupra unui singur model. Pungirea este o metodă în ansamblu pentru îmbunătățirea estimărilor instabile sau a sistemelor de clasificare. În timp ce metoda boosting este utilizată secvențial pentru a reduce părtinirea modelului combinat. Ameliorarea și ambalarea ambelor pot reduce erorile prin reducerea termenului de varianță.

37) Ce este descompunerea varianței de părtinire a erorii de clasificare în metoda ansamblului?

Eroarea așteptată a unui algoritm de învățare poate fi descompusă în părtinire și varianță. Un termen de părtinire măsoară cât de aproape se potrivește clasificatorul mediu produs de algoritmul de învățare cu funcția țintă. Termenul de varianță măsoară cât de mult fluctuează predicția algoritmului de învățare pentru diferite seturi de antrenament.

38) Ce este un algoritm de învățare incrementală în ansamblu?

Metoda de învățare incrementală este capacitatea unui algoritm de a învăța din datele noi care ar putea fi disponibile după ce clasificatorul a fost deja generat din setul de date deja disponibil.

39) La ce se utilizează PCA, KPCA și ICA?

PCA (Principal Components Analysis), KPCA (Kernel based Principal Component Analysis) și ICA (Independent Component Analysis) sunt tehnici importante de extragere a caracteristicilor utilizate pentru reducerea dimensionalității.

40) Ce este reducerea dimensiunii în învățarea automată?

În Învățarea automată și statisticile, reducerea dimensiunii este procesul de reducere a numărului de variabile aleatorii în considerare și poate fi împărțit în selectarea caracteristicilor și extragerea caracteristicilor.

41) Ce sunt mașinile vectoriale de suport?

Mașinile vectoriale de suport sunt algoritmi de învățare supravegheați utilizați pentru clasificare și analiza de regresie.

42) Care sunt componentele tehnicilor de evaluare relațională?

Componentele importante ale tehnicilor de evaluare relațională sunt

  • Achizitie de date
  • Achiziționarea adevărului la sol
  • Tehnica de validare încrucișată
  • Tipul interogării
  • Scor metric
  • Testul de semnificație

43) Care sunt diferitele metode pentru învățarea supravegheată secvențială?

Diferitele metode de rezolvare a problemelor de învățare supravegheate secvențiale sunt

  • Metode de ferestre glisante
  • Ferestre glisante recurente
  • Modele ascunse Markow
  • Modele Markow de entropie maximă
  • Câmpuri aleatorii condiționate
  • Rețele transformatoare grafice

44) Care sunt domeniile în robotică și procesarea informațiilor în care apare problema predicției secvențiale?

Domeniile din robotică și prelucrarea informațiilor în care apare problema predicției secvențiale sunt

  • Imitație de învățare
  • Predicție structurată
  • Învățare de întărire bazată pe model

45) Ce este învățarea statistică în serie?

Tehnicile de învățare statistică permit învățarea unei funcții sau a unui predictor dintr-un set de date observate care pot face predicții despre date nevăzute sau viitoare. Aceste tehnici oferă garanții privind performanța predictorului învățat cu privire la datele nevăzute viitoare pe baza unei ipoteze statistice privind procesul de generare a datelor.

46) Ce este învățarea PAC?

Învățarea PAC (probabil aproximativ corectă) este un cadru de învățare care a fost introdus pentru a analiza algoritmii de învățare și eficiența lor statistică.

47) Care sunt diferitele categorii în care puteți clasifica procesul de învățare a secvenței?

  • Predicția secvenței
  • Generarea secvenței
  • Recunoașterea secvenței
  • Decizie secvențială

48) Ce este învățarea secvențială?

Învățarea secvențială este o metodă de predare și învățare într-un mod logic.

49) Care sunt două tehnici de învățare automată?

Cele două tehnici de învățare automată sunt

  • Programare genetică
  • Învățare inductivă
50) Oferiți o aplicație populară de învățare automată pe care o vedeți în fiecare zi?

Motorul de recomandare implementat de principalele site-uri web de comerț electronic folosește Machine Learning.