Repose sur la prédiction
Un programme apprend de l’expérience E par rapport à une Tache T et mesurée par des performances P
Apprentissages supervisés et non supervisé disponibles la grande majorité est supervisée. On donne des entrées x (Features) et de sortie y (Target).
on cherche donc
→ Usage de la classification et régression
Machine learning et big data sont interdépendants
Droite de régression (linéaire) → modèle de régression fonction quadratique (polynomiale de degré 2) (non linéaire) → modèle de régression polynomiale

Clustering: Séparer une population en groupe Association: Découvrir les relations intéressantes entre =/= variables
💡 On veut choisir a et b tant que est proche de pour tous les exemples

On utilise le Gradient Descent qui est une fonction qui converge vers le minimum.

💡Dans le cas de dérive sur , vu que est la constante on a pas le

Le gradient:
Soit le modèle
Ce qui peut être traduit par:
On a donc le gradient Descendant: