Analyse des résultats et compréhension du fonctionnement

1. C’est quoi ?

1

Qu’est-ce que le machine learning ?

Un type d’ordinateur puissant
Un ensemble de règles pour programmer un ordinateur
Un domaine de l’intelligence artificielle où les systèmes apprennent à partir des données
Un type de robot capable de prendre des décisions autonomes

2. Comment ?

1

Si la machine a gagné, on va remettre ces billes dans les verres en en ajoutant une (prise de la réserve) de la même couleur. C'est une .

3. Programmation

1

Quelle est la principale différence entre la programmation standard et l’apprentissage par renforcement dans le jeu de Nim ?

La programmation standard suit une stratégie gagnante connue, tandis que l’apprentissage par renforcement explore les choix de manière aléatoire.
La programmation standard explore les choix de manière aléatoire, tandis que l’apprentissage par renforcement suit une stratégie gagnante connue.
La programmation standard ne tient pas compte des récompenses et des punitions, tandis que l’apprentissage par renforcement les utilise.
La programmation standard ne permet pas à la machine d’apprendre, tandis que l’apprentissage par renforcement lui permet d’ajuster ses choix en fonction des résultats.

4. Différence ?

1

Quelle est la principale différence entre l’apprentissage supervisé et l’apprentissage non supervisé en machine learning ?

L’apprentissage supervisé nécessite un enseignant pour fournir des étiquettes de classe, tandis que l’apprentissage non supervisé n’en a pas besoin.
L’apprentissage supervisé ne peut pas être utilisé pour résoudre des problèmes de classification, contrairement à l’apprentissage non supervisé.
L’apprentissage supervisé est plus rapide que l’apprentissage non supervisé.
L’apprentissage non supervisé est principalement utilisé pour le traitement du langage naturel, tandis que l’apprentissage supervisé est utilisé pour la vision par ordinateur.

5. Renforcement

1

Pourquoi l’apprentissage par renforcement peut-il être plus adapté lorsque la stratégie gagnante n’est pas connue à l’avance ?

Parce qu’il explore toutes les possibilités du jeu de manière exhaustive.
Parce qu’il permet à la machine d’ajuster ses choix en fonction des résultats obtenus.
Parce qu’il suit une stratégie gagnante prédéfinie.
Parce qu’il ne nécessite pas de récompenses ni de punitions.

6. Comment la machine apprend-elle ?

1

Compléter le texte :

À la fin de la partie, si la machine a perdu, on va simplement ne pas remettre les billes jouées (stockées dans les récipients) dans les verres dont elles proviennent. On les remet dans la réserve. C'est une (terme consacré en apprentissage machine). Cela correspond à un mauvais choix dans la base des possibilités de jeu.

7. Processus

1

Quelles sont les étapes du processus d’apprentissage par renforcement dans le jeu de Nim ?

Exploration de l’arbre de jeu, récompense des victoires, punition des défaites.
Programmation standard, récompense des victoires, punition des défaites.
Exploration de l’arbre de jeu, stratégie gagnante, récompense des coups réussis.
Programmation standard, récompense des coups réussis, exploration de l’arbre de jeu.

Intelligence Artificielle