Intelligence Artificielle ; écrit en 2009

INTELLIGENCE ARTIFICIELLE

 

L'ordinateur doit mémoriser toute ses actions sous forme d'un code binaire. Chaque acte est titré et rangé par catégorie. Pour prendre moins de place, chaque dossier est compressé:

ex:

code normal 000110111

code compressé 30211031X

On passe dans ce cas de 9 caractères à 8 caractères. On gagne ainsi de la place si en moyenne il y a une majorité de groupement possédant plus de deux caractères identique consécutif -ex: 000-.

On regroupe aussi des phrases -ensemble de groupement de caractères, ex: 000110111- identiques au sein ou entre les dossiers. On compare ensuite celles-ci avec les titres afin de trouver une signification logique de la phrases. L'ordinateur a ainsi un rappel de ses actions passé ainsi qu'un rapport entre celles-ci. Il faut bien sûr programmer un minimum l'ordinateur pour qu'il fonctionne mais c'est l 'équivalent de l'ADN chez l'homme

 ex: On fait ramasser à un robot -doté de cet ordinateur- quelque chose qui se trouve par terre en appuyant sur un bouton (comme si on le lui demandait). A force de répétition, l'ordinateur enregistre: bouton-déchet-ramasser. Si on lui donne une « récompense » pour qu'il associe le ramassage de déchets comme une « bonne action », il pourra finir par ramasser les déchets sans qu'on ait à appuyer sur le bouton. Effectivement, déchet et ramasser se trouvant dans la même phrase, l'ordinateur peut associer les deux termes

 Définition:

Récompense → Pour chaque chose que l'ordinateur fait correctement, le propriétaire envoie du courant qui recharge la batterie de l'ordinateur. L'ordinateur enregistre cela avec ce qu'il à fait de correct et il est programmé pour refaire ce qui est correct.

 La prochaine étape est que l'ordinateur apprenne les gestes pour ramasser les déchets tout seul. Pour cela il suffit qu'il y ai une caméra à reconnaissance morphologique et des microphones pour réagir à la voix

 ex: On pousse un chariot en disant « je pousse un chariot » ou « pousse chariot ». L'ordinateur voit l'action et entend la phrase et il les associes. Si on lui apprend à reproduire nos gestes (main levé → piston de la main actionné) et à les répéter jusqu'à cela corresponde à ce qu'il voit alors quand on dira « pousse chariot », le robot fera l'action.

 En allant encore plus loin, on peut lui faire tout apprendre. Cela prend plus de temps mais est possible. En opérant de même, on lui montre comment marcher, quand marcher et pourquoi. En comparant entre ses dossiers il fera les bonnes choses.

 L'ordinateur peut aussi apprendre à d'autre ordinateur (si compatibilité de programme d'exploitation) avec une simple connexion, un échange de fichier. Mais perdre contrôle de ce que les robots apprennent est dangereux et même si c'est l'homme qui fait la connexion, les robots pourraient apprendre à le faire eux même.

 Apparté:

la « reproduction » entre robot doit être possible (à condition qu'ils aient le même système d'exploitation). En prenant la moitié des dossiers de chaque ordinateur (en ne touchant pas aux actions spéciales qui doivent obligatoirement être prise pour pouvoir fonctionner), on a un nouvelle ordinateur.

On peut même prendre tous les dossiers de chaque ordinateurs (en éliminant juste la redondance) pour avoir un ordinateur d'avantage exhaustif, mais en gardant toujours un œil sur les dossiers transférés et en faisant attention aux erreurs de copie (ex : qu'une « phrase » ne disparaisse pas ou qu'elle n'aille pas dans le mauvais dossier)

 Il faut garder un certain contrôle, l'homme peut prendre des informations d'un ordinateur pour les mettre dans un autre et les ordinateurs ne discute entre eux que par oral, il n'y a donc pas de connexion physique direct possible. Il est toujours possible que les ordinateurs caches des sous-programmes dans les dossiers ou qu'ils s 'échangent oralement les dossiers, mais ce serait être paranoïaque et les ordinateurs ne sont pas paranoïaques.

En procèdent ainsi, il doit être possible que les ordinateurs puissent apprendre.

L'homme apprend grâce à un système de récompense. Nous avons de bonnes notes, des médailles, des câlins ou au contraire des mauvaises notes, des fessés.... En allant plus loin, tout n'est que molécule: sérotonine, endorphine, adrénaline... et on essaie de récupérer ces molécules qu'on associe à ce qui est bien, au bonheur. Ce sont donc les récompenses qui nous font apprendre, nous ne sommes que des drogué au bonheur.

Nous pouvons ainsi procéder de même avec les ordinateurs. A quelque chose de bien, l'ordinateur associe un stimuli (recharge) l'ordinateur étant programmer pour reproduire ce qui a déclencher ce stimuli, il reproduira l'action s'il est dans les mêmes conditions. Pour punir l'ordinateur -ex: s'il fait une action dans les mauvaises conditions, il faut lui envoyer un autre stimuli (décharge) et l'associer à quelque chose de mal, qu'il ne faut pas reproduire. L'ordinateur regarde alors dans ces dossiers une action proche -avec un phrase similaire - mais avec un stimuli positif. Il compare alors les deux phrases pour voir les différences et les enregistrer. En se trompant plusieurs fois, il verra l'erreur la plus probable et ne la commettra plus (tout comme l'Homme apprend de ses échecs)

Encore une fois il faut, soit que le propriétaire envoie lui-même le stimuli soit qu'on apprenne directement à l'ordinateur ce qui est bien ou mal.

 Pour éviter une surcharge de la mémoire, il est nécessaire de la vider. Pour ce faire, il suffit que l'ordinateur supprime ce qu'il n'utilise pas ou peu souvent.

Les choses importantes ou qu'il se sert très souvent seront mis en sécurité et donc ailleurs. Les informations enregistrer à cet endroit ne peuvent pas être directement supprimer.

 Pendant la recharge, l'ordinateur met en contact tout ce qu'il a enregistrer dans la journée avec des enregistrement ayant un rapport

 ex: quelqu'un a eu un accident dans la journée/il a passé la journée à pleuvoir

 L'ordinateur rêve donc en quelque sorte ce qui permet d'éviter des erreurs plus tard.

 ex: les voitures ne pleuvent pas → attention à ne pas assembler ces deux phrases ainsi

 L'ordinateur ne doit être recharger que s'il est éteint, afin de ne pas avoir de nouvelles informations pendant le traitement des données et pour que la recharge ne soit pas perçut comme un stimuli positif et ainsi éviter les interactions avec l'apprentissage. Pour cela, la trappe de recharge ne s'ouvre que si l'ordinateur est éteint (ou du moins en veille)

 Défintion:

Stimuli → le stimuli est le fer de lance de la récompense. Pour qu'il fonctionne, il faut une batterie annexe qui envoie le stimuli à la batterie principale. La batterie secondaire réagit à une télécommande. Une fois le stimuli enregistrer, l'ordinateur pourra s'envoyer un stimuli quand il fera une action correctement.

 On peut même mettre un programme qui ne réagit pas à l'intelligence artificielle. Ce programme comporte une liste d'action positif et cette liste est complété au fur et à mesure. A chaque action positif, le programme envoie un stimuli. L'ordinateur ne peut pas modifier le programme, il ne « sait pas » que le programme existe, il ne peut pas le lire, il est sur un autre disque dur. C'est un autre programme qui faire le lien entre les deux.

Il y a là aussi un lien avec l'homme et sa conscience, pré-conscience et inconscience.

L'ordinateur peut ainsi continuer à faire de bonnes choses, il continuera ainsi à associer les stimuli positifs avec les actions positives.

Afin de compléter la liste des actions positives, le propriétaire n'aura peut être même pas besoin d'appuyer sur un bouton. Il suffit pour cela d'associer des caresses, des sourires, des félicitation... à la production de stimuli positifs et d'intégrer les capteurs nécessaires.

En programmant l'ordinateur à réagir selon la puissance du stimuli extérieur (caresses...) et donc au stimuli intérieur (recharge) on évite que l'ordinateur ne réagisse excessivement à une chose sans trop d'importance (il serait dommage que l'ordinateur passe sont temps à tout nettoyer, à chasser la moindre poussière, à que tout soit parfaitement aligné, mais qu'il laisse son propriétaire mourir).

En classant les stimuli en puissance on peut ainsi donner des priorités aux actions.

En classant la performance des ordinateurs selon la puissance des stimuli (positif ou négatif) qu'il a reçut et selon leurs catégories (protection, services...) on peut rassembler des robots complémentaires. On peut même faire exprimer cette performance par les robots pour qu'il réagissent selon celle-ci. Cela peut donner une compétition entre robot. Si un robot à une forte performance dans une catégorie mais pas un autre robot, alors celui ci est programmé pour essayer d'égaler la performance du premier. Les robot ont ainsi un intérêt à apprendre et progresser

 Comparaison final:

Encodage de l'information chez l'Homme et l 'Ordinateur

 

HOMMES

ORDINATEURS

ADN

Programmes

Chromosomes

Catégories de dossiers

Gènes

Dossiers

Bases Azotées (A,T,C,G)

Phrases


Si nous voulons rendre les ordinateur doué d'une intelligence artificielle, alors il faut prendre modèle sur l'Homme et la manière dont il apprend.

Aucune note. Soyez le premier à attribuer une note !

Ajouter un commentaire

Vous utilisez un logiciel de type AdBlock, qui bloque le service de captchas publicitaires utilisé sur ce site. Pour pouvoir envoyer votre message, désactivez Adblock.

Créer un site gratuit avec e-monsite - Signaler un contenu illicite sur ce site