Machine Learning in Python
PROGRAM DE TRAINING B2B PERSONALIZAT
DISPONIBIL ONLINE SAU ON-SITE
În acest curs vei învăța algoritmi de bază și metode de procesare a datelor pentru probleme de clasificare și regresie folosind Machine Learning
- Tipuri de probleme rezolvabile cu ML
- Preprocesarea datelor și selecția variabilelor
- Construirea unui model de clasificare
- Construirea unui model de regresie
- Explicarea modelelor de ML
Noțiunile de bază sunt fundația pe care poți clădi
În cadrul acestui curs veți programa în Python, folosind cele mai populare instrumente și librării de Data Science și veți învăța cum să-l utilizați pentru analize statistice avansate, pre-procesare și transformare a datelor, dezvoltarea vizualizărilor de date și dezvoltarea de modele predictive pentru a rezolva o varietate de probleme.
Cursul are exerciții practice pentru fiecare modul (cu aplicabilitate directă în domeniul bancar), deci nu numai că veți învăța teoria, dar veți aborda și partea practică în construirea propriilor modele, pe care le puteți utiliza în continuare ca puncte de plecare în construirea propriilor proiecte.
De asemenea, veți învăța cum să îmbunătățiți modelele dezvoltate prin algoritmii de învățare automată, prin aprofundarea conceptelor de bias ridicat (underfitting), dispersie ridicată (overfitting), validarea comparativă (cross-validation) și modul în care hiperparametrii ar putea îmbunătăți performanța modelelor (hyper-parameter tuning).
Programa
Durata: 18 ore
Cursurile se desfasoara pe parcursul a doua saptamani cu 3 sesiuni de 3 ore pe saptamana. O sesiune se tine intr-o singura zi.
- Analiza datelor cu Pandas
- Instrumente de vizualizare și raportare a datelor
- Tehnici de tratare a valorilor lipsă
- Tratamentul valorilor extreme
- Tratamentul categoriilor rare
- Multiple tehnici pentru tratamentul variabilelor categorice
- Tehnici de procesare și transformare a datelor necesare pentru principalele grupuri de algoritmi de învățare automată
- Importanța reducerii spațiului dimensional pentru modelare
- Aplicarea metodelor de filtrare (elemente de bază, corelație, măsuri statistice)
- Aplicarea metodelor încorporate (lasso, random forrest, etc.)
- Aplicarea metodelor agnostice (RFE)
- Tipuri de modele utilizate
- Overfitting si validare comparativă
- Tehnici de optimizare a hiperparametrilor folosind Scikit-learn
- Exercițiu practic: prezicerea riscului de nerambursare al unui client bancar
- Tipuri de modele utilizate
- Overfitting si validare comparativă
- Tehnici de optimizare a hiperparametrilor folosind Scikit-learn
- Exercițiu practic: prezicerea prețurilor locuințelor
- Evaluarea erorilor
- Evaluare modelelor folosind validarea comparativă
- Exercițiu practic: selectați modelul cel mai performant
- Grafice de dependență
- Analiza importanței variabilelor de intrare prin permutări
- Exercițiu practic: interpretarea unui model de clasificare
Cui se adreseaza cursul
Specialiști din departamentele: Data Science, Advanced Analytics, IT, Risk, Statistica, Cercetare, Analiză de date, MIS, Business Intelligence, Raportare, Project Management etc.
Care sunt cerintele pentru inscriere
Familiaritatea cu conceptele de Inteligență Artificială și Machine Learning sau participarea la cursul Introducere in Inteligenta Artificiala si Machine Learning
Posibilitatea de a accesa Google Colab: https://colab.research.google.com/ (necesită acces firewall și existența unui cont de Google personal)
Este recomandabilă cunoașterea unui limbaj de programare și familiaritatea cu conceptele statistice de bază