Définition du Machine Learning

Le Machine Learning, littéralement Apprentissage machine, est une technologie basée sur l’apprentissage automatique des ordinateurs, des machines industrielles et des objets connectés. Avec le passage massif au SaaS et aux applications natives, l’accessibilité ne peut pas vivre avec succès dans un monde où 70 % des tests sont manuels. Il ne suffit pas d’obtenir des logiciels accessibles, il faut les garder accessibles par le biais du DevOps. Le Machine Learning doit atteindre 100% de tests automatisés afin d’être performant en termes de traitement des images, traitement du langage naturel, reconnaissance des formes et apprentissage supervisé et non supervisé.

Qu’est ce que le Machine Learning ?

Un bon début de définition du Machine learning est qu’il s’agit d’un sous-domaine essentiel de l’intelligence artificielle (IA). Les applications de Machine Learning apprennent de l’expérience et de la data. Lorsqu’elles sont exposées à de nouvelles données, ces applications apprennent, grandissent, changent et se développent par elles-mêmes. En d’autres termes, avec l’apprentissage automatique, les ordinateurs trouvent des informations pertinentes sans qu’on leur dise où chercher, en exploitant des algorithmes qui apprennent des données dans un processus itératif.

Si le concept d’apprentissage automatique existe depuis longtemps, la capacité d’automatiser l’application de calculs mathématiques complexes à des données volumineuses (data lakes) a pris de l’ampleur ces dernières années.

À un niveau élevé, l’apprentissage automatique est la capacité à s’adapter à de nouvelles données de manière indépendante et par itérations. Fondamentalement, les applications tirent des leçons des calculs précédents et utilisent la reconnaissance des formes pour produire des résultats fiables et informés.

Le processus d’apprentissage automatique commence par l’entrée de données d’apprentissage dans l’algorithme sélectionné. Les données de formation étant des données connues ou inconnues, l’algorithme final de l’apprentissage automatique est élaboré à partir de ces données. Le type d’entrée des données de formation a un impact sur l’algorithme.

Pour tester si cet algorithme fonctionne correctement, de nouvelles données d’entrée sont introduites dans l’algorithme d’apprentissage automatique. La prédiction et les résultats sont ensuite vérifiés.

Si la prédiction n’est pas conforme aux attentes, l’algorithme est relancé plusieurs fois jusqu’à ce que la sortie souhaitée soit trouvée. Cela permet à l’algorithme de Machine Learning d’apprendre continuellement par lui-même et de produire la réponse la plus optimale qui augmentera progressivement en précision au fil du temps. Ainsi, le Machine Learning va continuer à être exceptionnellement important pour faire progresser l’IA (Intelligence Artificielle).

Les différents types de Machine Learning.

L’apprentissage machine est complexe, c’est pourquoi il a été divisé en deux domaines principaux, l’apprentissage supervisé et l’apprentissage non supervisé. Chacun a un objectif et une action spécifiques au sein de l’apprentissage automatique, produisant des résultats particuliers et utilisant diverses formes de données.

75 % de l’apprentissage automatique est un apprentissage supervisé, tandis que l’apprentissage non supervisé et l’apprentissage par renforcement représentent 25 %.

Apprentissage supervisé.

Dans l’apprentissage supervisé, nous utilisons des données connues ou étiquetées pour les données de formation. Comme les données sont connues, l’apprentissage est donc supervisé, c’est-à-dire orienté vers une exécution réussie. Les données d’entrée passent par l’algorithme d’apprentissage automatique et sont utilisées pour former le modèle. Une fois que le modèle est formé sur la base des données connues, vous pouvez utiliser des données inconnues dans le modèle et obtenir une nouvelle réponse.

Dans ce cas, le modèle tente de déterminer si les données sont une pomme ou un autre fruit. Une fois que le modèle a été bien formé, il identifiera que les données sont une pomme et donnera la réponse souhaitée. Les principaux algorithmes utilisés pour l’apprentissage supervisé sont les suivants :

Régression polynomiale
Forêt aléatoire
Régression linéaire
Régression logistique
Arbres de décision
Les voisins les plus proches

Apprentissage non supervisé.

Dans l’apprentissage non supervisé, les données de formation sont inconnues et non étiquetées, ce qui signifie que personne n’a jamais regardé les données auparavant. Sans l’aspect des données connues, l’entrée ne peut pas être guidée vers l’algorithme, d’où le terme non supervisé. Ces données sont introduites dans l’algorithme d’apprentissage automatique et sont utilisées pour former le modèle. Le modèle formé essaie de rechercher un modèle et de donner la réponse souhaitée.

Les principaux algorithmes actuellement utilisés pour l’apprentissage non supervisé sont les suivants :

Les moindres carrés partiels
Décomposition de la valeur singulière
A priori
Regroupement hiérarchique
Analyse des composantes principales

Apprentissage renforcé.

Comme les types traditionnels d’analyse de données, l’algorithme découvre les données par un processus d’essais et d’erreurs puis décide ensuite quelle action entraîne des récompenses plus élevées. Trois composantes majeures composent l’apprentissage de renforcement : l’agent, l’environnement et les actions. L’agent est l’apprenant ou le décideur, l’environnement comprend tout ce avec quoi l’agent interagit, et les actions sont ce que l’agent fait.

L’apprentissage par renforcement se produit lorsque l’agent choisit des actions qui maximisent la récompense attendue sur une période donnée. Cet apprentissage est plus facile à réaliser lorsque l’agent travaille dans un cadre politique solide.