Pourquoi les progrès de l'IA ne sont-ils pas uniformes ? a16z, fondateur de Replit : la vérifiabilité est la différence clé.

robot
Création du résumé en cours

Marc Andreessen, co-fondateur de la célèbre société de capital-risque a16z, et Amjad Masad, co-fondateur de Replit, ont eu une conversation le 25/10, se concentrant sur l'état actuel du développement de l'IA. Andreessen a souligné que les avancées de l'IA dans l'écriture de programmes, le calcul mathématique et la simulation de phénomènes physiques sont impressionnantes, mais qu'il y a un ralentissement dans des domaines tels que la médecine et le droit. Masad a répondu que la clé n'est pas la difficulté, mais la vérifiabilité. En d'autres termes, les tâches dont l'exactitude peut être jugée objectivement progressent le plus rapidement, tandis que les domaines plus flous sont plus difficiles à percer.

L'IA a deux vitesses : celle qui peut être vérifiée court plus vite que quiconque.

Masad a d'abord passé en revue la manière dont les modèles sont entraînés. Les premiers modèles de langage se contentaient de regarder le texte et de deviner le mot suivant. Bien qu'ils puissent parler, ils ne faisaient pas vraiment de raisonnement. Ce n'est qu'après l'introduction de l'apprentissage par renforcement (Reinforcement Learning, RL) que l'IA a commencé à apprendre dans des environnements vérifiables. Il a expliqué :

« Des questions comme le débogage de programme, les tests unitaires ou celles qui peuvent produire des résultats clairs, l'IA peut directement savoir si elle a raison ou tort. »

Ce type de formation avec feedback instantané permet à l'IA de renforcer rapidement ses capacités de résolution de problèmes.

Pourquoi les domaines de la santé et du droit ne suivent-ils pas ?

Andreessen a posé la question : « Et pour les domaines de la santé et du droit ? Pourquoi semble-t-il que les progrès soient si lents et qu'il y ait des phénomènes de stagnation ? » Masad a répondu :

« Parce qu'il n'y a pas de réponse unique à cause d'eux. »

Par exemple, dans le domaine médical, un diagnostic peut avoir de multiples causes et des variations dans le parcours de la maladie. De même, les décisions judiciaires peuvent différer en raison des juges et des cas concernés, ce qui signifie qu'il y a une trop grande flexibilité et qu'il n'existe pas de réponse standard claire. Cela rend difficile pour le modèle de se valider lui-même et d'établir un cycle de renforcement.

Bien que l'on puisse aider le modèle grâce à l'apprentissage par renforcement avec retour humain (RLHF), cela reste une évaluation subjective, contrairement aux mathématiques ou à la programmation qui sont plus directes et claires.

(Note : L'apprentissage par renforcement basé sur le feedback humain (RLHF) est une technique d'apprentissage automatique (ML) qui utilise le feedback humain pour améliorer les modèles ML afin d'augmenter l'efficacité de l'auto-apprentissage.)

La véritable clé n'est pas la “difficulté” mais la “vérifiabilité”.

Andreessen a déclaré après avoir organisé ses observations : « Donc, le point n'est pas de savoir si le problème est difficile ou non, mais si nous pouvons confirmer la bonne réponse ? » Masad a déclaré :

« Oui, l'explosion de l'IA dans la programmation et les mathématiques n'est pas parce que c'est plus simple, mais parce que cela permet de vérifier les résultats. »

Par exemple, lorsque vous codez, tant que le programme peut être compilé et que les tests passent, l'IA peut immédiatement recevoir un retour « correct », ce qui permet au modèle de s'entraîner automatiquement des milliers de fois par jour et d'évoluer rapidement.

Quels autres domaines possèdent une vérifiabilité ?

Les deux personnes ont énuméré quelques domaines dans lesquels l'IA progresse le plus rapidement :

Mathématiques et physique : il existe des équations claires et des résultats de simulation.

Chimie et biologie : des choses comme le repliement des protéines et les séquences génétiques, qui peuvent être validées par des expériences ou des simulations.

Robot : le succès ou l'échec de la mission peut être quantifié directement.

Ces domaines relèvent de la “vérification objective”, ce qui en fait la courbe d'apprentissage la plus abrupte pour l'IA actuellement.

L'IA qui écrit des programmes va d'abord s'envoler, tandis que la médecine et le droit sont encore en route.

Masad a déclaré en résumant ses points de vue :

“L'IA qui écrit des programmes décollera d'abord, suivie de près par les mathématiques, la physique et la chimie. Mais pour des domaines plus abstraits comme la médecine et le droit, il faudra y aller lentement.”

Andreessen a également acquiescé :

« C'est un phénomène naturel. L'IA éclate d'abord là où elle peut être quantifiée, et elle sera un peu en retard dans les domaines où le jugement humain est flou. »

Cet article traite de la question suivante : pourquoi les progrès de l'IA sont-ils inégaux ? a16z, le fondateur de Replit : la vérifiabilité est la différence clé. Publié pour la première fois sur Chaîne d'Actualités ABMedia.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)