Journal d'un Terrien

Web log de Serge Boisse

On line depuis 1992 !

Publicité

Si cette page vous a plu, Copiez son adresse et partagez-la !
http://sboisse.free.fr/technique/info/deep-tought-et-deep-blue.php

deep-tought-et-deep-blue
Metadata
Serge Boisse
Le 31/03/2023 à 18:03
web/MOC
oui
oui

Deep tought et Deep blue : des programmes pour jouer aux échecs

jeu d'échecs

J'ai écrit cette page en 1998, bien avant alphaZero... Mais son contenu est toujours d'actualité

L'intelligence artificielle (IA) est essentiellement connue du grand public par les programmes de jeu d’échecs, dont les plus célèbres sont Deep Thought et Deep Blue. (Le nom Deep Thought est celui d’un ordinateur fabuleux dans le film hilarant le guide de l’auto-stoppeur galactique). Kasparov battit facilement Deep Thought lors d’un match en deux parties en  1989,  et il  déclara que jamais un programme n’arriverai à le battre, mais il avait compté sans l’amélioration de la rapidité des ordinateurs au fil des ans.  Deep Blue, successeur de Deep Thought, n’était pas plus intelligent que Deep Thought, et il ne connaissait pas mieux que lui le jeu d’échecs (c’est à dire très mal !), mais il calculait plus vite et donc plus profondément dans l’arbre de jeu. Et il se trouve, que, à partir d’une certaine vitesse critique, cela suffit pour être champion du monde.

Le cours de l’action IBM a quadruplé dans les quelques mois qui ont suivi la victoire de Deeper Blue (une variante de Deep Blue)  sur Gary Kasparov, et ce bien que les bénéfices et les dividendes versés par la compagnie soient restés à peut près constants. Pour le grand public, la victoire d’une machine sur le champion du monde du « roi des jeux » intellectuel montrait que les machines allaient pouvoir bientôt devenir plus intelligente que l’homme. Naturellement il n’en a rien été. Après sa vitoire, Deep Blue, qui n’était capable que de jouer aux échecs, et rien d’autre, fut partiellement démonté, et ses processeurs utilisés dans des applications industrielles.

Deep Thought et Deep Blue sont les exemples types de ce que l’on appelle des programmes de force brute. A peu de choses près, les seule connaissances dont ils disposent sont : les règles du jeu, c’est à dire les coups « légaux » qui permettent de passer d’une position à une autre, et la fonction d’évaluation, c’est à dire une procédure qui analyse (assez sommairement) le caractéristiques d’une position dans le jeu, et retourne une valeur numérique, positive si la position est « bonne pour les blancs », et négative si elle bonne pour les noirs, par exemple. Cette fonction pourrait devenir très compliquée (et longue à calculer) si elle devait prendre en compte toutes les connaissances qu’un champion utilise réellement pour évaluer une position. 

L’astuce est que le programme génère tous les coups possibles, puis tous les coups de l’adversaire, etc., jusqu’à une profondeur qui dépend de la vitesse de calcul et du temps alloué pour réfléchir à un coup. Le programme n’évalue que les positions à cette profondeur, et pas les positions intermédiaires (sinon sommairement, pour les classer entre elles). Il cherche alors à minimiser le score maximal que pourra obtenir l’adversaire. C’est ce l’on appelle l’algorithme minimax, et cet algorithme est utilisé par pratiquement tous les programmes de jeu de réflexion.

Depuis la création des premiers programmes d’échecs, deux conceptions radicalement opposées se sont affrontées :

La première est la plus naturelle, elle consiste à dire que pour améliorer un programme de jeu il faut lui donner plus de connaissances, et donc améliorer la fonction d’évaluation, même si elle devient longue à calculer et que la profondeur maximale de la réflexion du programme s’en trouvera réduite d’autant : même si c’est seulement quatre ou cinq coups à l’avance, peu importe parce que ce seront des bons coups !

La seconde tendance, celle de la force brute, consiste à dire que l’ordinateur est essentiellement stupide, mais qu’il calcule très vite. Il suffit donc de profiter de cette stupidité naturelle et ultra-rapide, et on se contentera d’une évaluation sommaire, mais très profonde. Si on ajoute à l’ordinateur de nouveaux processeurs, voire même des co-processeurs spécialisés, si l’on peut anticiper 12 coups à l’avance (comme Deep Blue), peu importe que l’évaluation soit sommaire, on saura éviter tous les pièges et trouver la stratégie gagnante !

La force brute est, hélas pour les tenants d’une IA « vraiment intelligente », la conception qui a gagné. Les ordinateurs sont devenus tellement rapides qu’il ne leur est plus nécessaire d’être intelligents pour vaincre les humains. Depuis Deep Blue, coup médiatique d’IBM, d’autres programmes de force brute ont vu le jour, toujours plus puissants, toujours meilleurs.

Le summum actuel de cette approche est le système Hydra, situé à Abou Dhabi, qui tourne sur 32 processeurs intel Xeon cadencés  à 3,6 Ghz, eux-même assistés par des circuits logiques ultra-rapides, spécialisés dans l’évaluation des positions d’échecs et conçus exprès pour cela. Hydra arrive à calculer à une profondeur de 18 coups ! Ce programme n’a jamais pu être vaincu par des humains seuls ; il a par contre été vaincu plusieurs fois par des humains assistés d’ordinateurs, qui leur évitent les « gaffes ».

NB: cette page est extraite de mon livre "L'esprit, l'IA et la SIngularité".
La suite>: Eliza

Publicité
Commentaires

Commentaires (0) :

Page :



Ajouter un commentaire (pas besoin de s'enregistrer)

Pseudo :
Message :


image de protection
En cliquant sur le bouton "Envoyer" vous acceptez les conditions suivantes : Ne pas poster de message injurieux, obscène ou contraire à la loi, ni de liens vers de tels sites. Respecter la "netiquette", ne pas usurper le pseudo d'une autre personne, respecter les posts faits par les autres. L'auteur du site se réserve le droit de supprimer un ou plusieurs posts à tout moment. Merci !
Ah oui : le bbcode et le html genre <br>, <a href=...>, <b>b etc. ne fonctionnent pas dans les commentaires. C'est voulu.
< Retour en haut de la page