Home » Sciences et technologies » 10 algorithmes populaires en apprentissage automatique – Science et données

10 algorithmes populaires en apprentissage automatique – Science et données

by Nouvelles
10 algorithmes populaires en apprentissage automatique – Science et données

2024-01-23 20:11:14

Voici 10 algorithmes de Machine Learning très populaires et qui aident à résoudre d’innombrables problèmes commerciaux.

Régression linéaire: Algorithme utilisé pour modéliser la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Ils peuvent être utilisés en modélisation statistique (étudier la relation entre variables) ou en Machine Learning (construire des modèles prédictifs). Il existe plusieurs types de techniques de régression : régression linéaire, logistique, polynomiale, etc…

Régression logistique: Malgré son nom, il s’agit d’un algorithme de classification utilisé pour estimer des valeurs discrètes (valeurs binaires telles que 0/1, oui/non, vrai/faux) en fonction d’un ensemble donné de variables indépendantes.

Arbres de décision: Un modèle arborescent utilisé pour la classification et la régression. Il divise les données en fonction de certaines conditions, ce qui les rend intuitives et faciles à comprendre.

Forêt aléatoire: Un modèle d’apprentissage supervisé puissant utilisé à la fois pour la classification et la régression, mais est le plus couramment utilisé dans les problèmes de classification. Il s’agit d’un ensemble d’arbres de décision.

AdaBoost (Boost adaptatif): Un algorithme de boosting qui combine plusieurs estimateurs faibles (généralement des arbres de décision) pour créer un classificateur fort.

Machines d’amplification de gradient (GBM): Une technique d’ensemble qui construit des modèles séquentiellement, chaque nouveau modèle corrigeant les erreurs commises par les précédents. Les variantes incluent XGBoost, LightGBM et CatBoost.

Bayes naïf: Une famille de classificateurs probabilistes basés sur l’application du théorème de Bayes avec des hypothèses fortes (naïves) d’indépendance entre les caractéristiques.

Machine à vecteurs de support (SVM): Un modèle d’apprentissage supervisé puissant utilisé à la fois pour la classification et la régression, mais est le plus couramment utilisé dans les problèmes de classification. Cela fonctionne en trouvant l’hyperplan qui divise le mieux un ensemble de données en classes.

K-Voisins les plus proches (KNN): Un algorithme d’apprentissage automatique supervisé simple et facile à mettre en œuvre qui peut être utilisé à la fois pour la classification et la régression. Il s’agit d’un algorithme d’apprentissage non paramétrique.

Clustering K-Means: Un algorithme d’apprentissage non supervisé utilisé pour regrouper (regrouper) les données par similarité. Il divise les données en K clusters distincts en fonction de la distance au centre de gravité d’un cluster.

De nombreux autres algorithmes d’apprentissage automatique plus avancés sont des variantes, des compositions ou des portemanteaux de ces algorithmes.

David Matos



#algorithmes #populaires #apprentissage #automatique #Science #données
1706078653

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.