IBM a annoncé la publication d'une famille de modèles code "Granite" pour la communauté open-source, dans le but de simplifier le codage pour les développeurs de diverses industries. Les modèles code Granite sont conçus pour résoudre les problèmes auxquels les développeurs sont confrontés lorsqu'ils écrivent, testent, déboguent et livrent des logiciels fiables.IBM a publié quatre variantes du modèle code "Granite", dont la taille varie de 3 à 34 milliards de paramètres. Les modèles ont été testés sur une série de points de référence et ont surpassé d'autres modèles comparables tels que Code Llama et Llama 3 dans de nombreuses tâches.
Les modèles ont été entraînés sur un ensemble massif de données de 500 millions de lignes de code dans plus de 50 langages de programmation. Ces données d'entraînement ont permis aux modèles d'apprendre des modèles et des relations dans le code, ce qui leur permet de générer du code, de corriger des bogues et d'expliquer des concepts de code complexes.
Les modèles code Granite sont conçus pour être utilisés dans une variété d'applications, y compris la génération de code, le débogage et les tests. Ils peuvent également être utilisés pour automatiser des tâches de routine, telles que la génération de tests unitaires et la rédaction de documentation. Ils répondent à un large éventail de tâches de codage, y compris la modernisation d'applications complexes et les cas d'utilisation à mémoire limitée.
"Nous croyons au pouvoir de l'innovation ouverte et nous voulons toucher le plus grand nombre de développeurs possible", a déclaré Ruchir Puri, responsable scientifique chez IBM Research. "Nous sommes impatients de voir ce qui sera construit avec ces modèles, qu'il s'agisse de nouveaux outils de génération de code, de logiciels d'édition de pointe, ou de tout ce qui se trouve entre les deux."
IBM met en open-source les modèles code de son IA "Granite"
IBM explique le contexte de cette annonce :
IBM met à la disposition de la communauté open-source une famille de modèles code Granite. L'objectif est de rendre le codage aussi facile que possible - pour le plus grand nombre de développeurs possible.
Au cours des dernières décennies, les logiciels ont été intégrés dans tous les aspects de notre société. Mais malgré l'augmentation de la productivité que les logiciels modernes ont apportée à notre façon de travailler, l'acte d'écrire, de tester, de déboguer et de livrer des logiciels fiables reste une tâche ardue. Même le développeur le plus compétent doit chercher des astuces et des raccourcis, les langages de code sont constamment mis à jour et de nouveaux langages sont publiés presque tous les jours.
C'est pourquoi IBM Research a commencé à se demander si l'IA pouvait faciliter le développement et le déploiement du code. En 2021, nous avons dévoilé CodeNet, un ensemble de données massif et de haute qualité comprenant 500 millions de lignes de code dans plus de 50 langages de programmation, ainsi que des extraits de code, des problèmes de code et des descriptions. Nous avons vu la valeur qui pourrait être libérée en construisant un ensemble de données qui pourrait former les futurs agents d'IA - ceux que nous avons imaginés pour traduire le code des anciens langages à ceux qui alimentent les entreprises aujourd'hui. D'autres, nous l'avons vu, enseigneraient aux développeurs comment résoudre les problèmes dans leur code, ou même écrire du code à partir d'instructions de base rédigées en anglais simple.
Les grands modèles de langage (LLM) formés sur le code sont en train de révolutionner le processus de développement de logiciels. De plus en plus, les LLM de code sont intégrés dans des environnements de développement de logiciels afin d'améliorer la productivité des programmeurs humains, et les agents basés sur les LLM se révèlent prometteurs dans le traitement autonome de tâches complexes. La réalisation du plein potentiel des LLM de code nécessite un large éventail de capacités, notamment la génération de code, la correction des bogues, l'explication et la documentation du code, la maintenance des référentiels, et bien plus encore.
L'énorme potentiel des LLM qui a émergé au cours des dernières années a alimenté notre désir de transformer notre vision en réalité. Et c'est exactement ce que nous avons commencé à faire avec la famille de produits IBM watsonx Code Assistant (WCA), comme WCA for Ansible Lightspeed pour l'automatisation informatique, et WCA for IBM Z pour la modernisation des applications. WCA for Z utilise une combinaison d'outils automatisés et le propre grand modèle de langage code de Granite de 20 milliards de paramètres d'IBM que les entreprises peuvent utiliser pour transformer les applications COBOL monolithiques en services optimisés pour IBM Z.
Nous nous sommes efforcés de trouver des moyens de rendre les développeurs plus productifs, en leur faisant passer moins de temps à essayer de comprendre pourquoi leur code ne s'exécute pas ou comment faire communiquer une base de code héritée avec des applications plus récentes. C'est pourquoi nous annonçons aujourd'hui que nous mettons en open-source quatre variantes du modèle code d'IBM Granite.
Ce que IBM met en open-source
IBM publie une série de modèles code Granite à décodeur seul pour les tâches de génération de code, entraînés avec du code écrit dans 116 langages de programmation. La famille de modèles code Granite se compose de modèles dont la taille varie de 3 à 34 milliards de paramètres, à la fois dans un modèle de base et dans des variantes de modèles de suivi d'instructions. Ces modèles ont un large éventail d'utilisations, allant des tâches de modernisation d'applications complexes aux cas d'utilisation à mémoire restreinte sur les appareils.
L'évaluation sur un ensemble complet de tâches a montré que ces modèles code Granite correspondent systématiquement à l'état de l'art parmi les LLM de code open-source actuellement disponibles. La famille de modèles polyvalents a été optimisée pour les flux de travail de développement de logiciels d'entreprise et donne de bons résultats dans toute une série de tâches de codage, y compris la génération de code, la correction et l'explication.
Ces modèles sont disponibles sur Hugging Face, GitHub, watsonx.ai et RHEL AI, la nouvelle plateforme de modèles de base de Red Hat pour développer, tester et déployer des modèles d'IA génératifs. Les modèles code de base sous-jacents...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.