Explicatiii
Explicatiii
Explicatiii
În prima linie, sunt importate modulele pandas, numpy, pyplot din matplotlib și câteva
funcții de măsurare a erorii din sklearn.
În a doua linie, se citește fișierul CSV și se stochează în variabila "fisier" folosind pandas.
În a patra și a cincea linie, variabilele "t" și "b" sunt inițializate cu valorile din coloanele
"TotalSteps" și "Calories", respectiv, convertite într-o matrice numpy și reorganizate
pentru a avea un format adecvat pentru analiza de regresie.
Acest program efectuează o regresie liniară și polinomială pe un set de date citit dintr-
un fișier CSV și calculează o serie de metrici de evaluare a performanței modelelor.
Partea cea mai importantă a programului este regresia polinomială, care este definită
prin funcția "reg_polinomiala". Aceasta primește un argument "grad" care specifică
gradul polinomului folosit pentru regresie și apoi calculează coeficienții polinomului de
regresie prin metoda minimelor pătratelor și afișează o serie de metrici de evaluare a
performanței, cum ar fi MSE, RMSE, MAE și R^2. De asemenea, funcția trasează un grafic
de dispersie a datelor de antrenare și o curbă de regresie polinomială de gradul
specificat.
Programul începe prin încărcarea fișierului csv "ml_fitbit.csv" folosind biblioteca Pandas
și inițializarea a două variabile, t și b, cu datele din coloanele "TotalSteps" și "Calories"
din fișier, care vor fi folosite mai târziu pentru a realiza regresia. Variabila t1 este
inițializată cu o matrice de 1-uri pentru a fi folosită la regresia liniară.