Microsoft rend le modèle Phi-4 entièrement open source dans Hugging Face

Microsoft rend le modèle Phi-4 entièrement open source dans Hugging Face


Rejoignez nos newsletters quotidiennes et hebdomadaires pour obtenir les dernières mises à jour et du contenu exclusif sur la couverture de l’IA de pointe. Plus d’informations


Même si son principal partenaire d’investissement OpenAI continue d’annoncer des modèles de raisonnement plus puissants, comme la dernière série o3, Microsoft ne reste pas les bras croisés. Elle poursuit plutôt le développement de petits modèles plus puissants lancés sous sa propre marque.

Comme annoncé aujourd’hui par plusieurs chercheurs et scientifiques actuels et anciens de Microsoft AI chez X, Microsoft lance son modèle Phi-4 en tant que projet entièrement open source avec des poids téléchargeables dans visage étreignantla communauté de partage de code IA.

“Nous sommes complètement surpris par la réaction suscitée par le lancement du (du) phi-4”, a écrit Shital Shah, ingénieur principal de recherche en IA chez Microsoft, sur X. « Beaucoup de gens nous demandaient de perdre du poids. (Certains ont même téléchargé des poids phi-4 piratés sur HuggingFace… Eh bien, n’attendez plus. Aujourd’hui, nous lançons le modèle phi-4 officiel sur HuggingFace ! Sous licence du MIT (sic) !!

Les poids se réfèrent à valeurs numériques qui spécifient comment un modèle de langage d’IA, petit ou grand, comprend et génère le langage et les données. Les pondérations du modèle sont définies par son processus de formation, généralement par le biais d’un apprentissage profond non supervisé, au cours duquel il détermine les résultats à fournir en fonction des entrées qu’il reçoit. Les chercheurs humains et les constructeurs de modèles peuvent affiner davantage les pondérations du modèle en ajoutant leurs propres ajustements, appelés biais, au modèle pendant la formation. En règle générale, un modèle n’est pas considéré comme entièrement open source à moins que ses pondérations n’aient été rendues publiques, car c’est ce qui permet à d’autres chercheurs humains de prendre le modèle et de le personnaliser complètement ou de l’adapter à leurs propres objectifs.

Bien que Microsoft ait dévoilé Phi-4 le mois dernier, son utilisation était initialement limitée à la nouvelle plateforme de développement Azure AI Foundry de Microsoft.

Désormais, Phi-4 est disponible en dehors de ce service propriétaire pour toute personne disposant d’un compte Hugging Face et est livré avec une licence MIT permissive, lui permettant également d’être utilisé pour des applications commerciales.

Cette version offre aux chercheurs et aux développeurs un accès complet aux 14 milliards de paramètres du modèle, permettant l’expérimentation et le déploiement sans les limitations de ressources souvent associées aux systèmes d’IA plus grands.

Une évolution vers l’efficacité de l’IA

Phi-4 a été publié pour la première fois sur la plateforme Azure AI Foundry de Microsoft en décembre 2024, où les développeurs pouvaient y accéder dans le cadre d’un accord de licence de recherche.

Le modèle a rapidement attiré l’attention car il surpassait de nombreux homologues plus importants dans des domaines tels que le raisonnement mathématique et la compréhension multitâche du langage, tout en nécessitant beaucoup moins de ressources informatiques.

L’architecture rationalisée du modèle et l’accent mis sur le raisonnement et la logique visent à répondre au besoin croissant de hautes performances en matière d’IA qui restent efficaces dans des environnements de calcul et de mémoire limités. Avec cette version open source sous licence permissive du MIT, Microsoft rend Phi-4 plus accessible à un public plus large de chercheurs et de développeurs, y compris commerciaux, signalant un changement potentiel dans la manière dont l’IA de l’industrie informatique aborde la conception et la mise en œuvre de modèles.

Qu’est-ce qui distingue Phi-4 ?

Phi-4 excelle dans les benchmarks qui testent le raisonnement avancé et les capacités spécifiques à un domaine. Les points forts incluent :

• A obtenu plus de 80 % lors de tests de référence exigeants tels que MATH et MGSM, surpassant les modèles plus grands tels que Gemini Pro et GPT-4o-mini de Google.

• Performance supérieure dans les tâches de raisonnement mathématique, une capacité essentielle pour des domaines tels que la finance, l’ingénierie et la recherche scientifique.

• Des résultats impressionnants sur HumanEval pour la génération de code fonctionnel, ce qui en fait un bon choix pour la programmation assistée par l’IA.

De plus, l’architecture et le processus de formation de Phi-4 ont été conçus dans un souci de précision et d’efficacité. Son modèle de transformateur dense de 14 milliards de paramètres, uniquement par décodeur, a été formé sur 9,8 billions de jetons à partir d’ensembles de données organisés et synthétiques, notamment :

• Documents accessibles au public rigoureusement filtrés pour en vérifier la qualité.

• Données synthétiques de type manuel axées sur les mathématiques, le codage et le raisonnement de bon sens.

• Livres universitaires et ensembles de données de questions et réponses de haute qualité.

Les données de formation incluaient également du contenu multilingue (8 %), bien que le modèle soit principalement optimisé pour les applications en anglais.

Ses créateurs chez Microsoft affirment que les processus de sécurité et d’alignement, y compris le réglage supervisé et l’optimisation directe des préférences, garantissent de solides performances tout en répondant aux préoccupations d’équité et de fiabilité.

L’avantage de l’open source

En rendant Phi-4 disponible sur Hugging Face avec tous ses poids et une licence MIT, Microsoft l’ouvre aux entreprises pour qu’elles puissent l’utiliser dans leurs opérations commerciales.

Les développeurs peuvent désormais intégrer le modèle dans leurs projets ou l’adapter à des applications spécifiques sans avoir besoin de ressources informatiques étendues ni d’autorisation de Microsoft.

Cette décision s’aligne également sur la tendance croissante des modèles d’IA fondamentaux open source pour favoriser l’innovation et la transparence. Contrairement aux modèles propriétaires, qui sont souvent limités à des plates-formes ou API spécifiques, la nature open source de Phi-4 garantit une plus grande accessibilité et adaptabilité.

Équilibre entre sécurité et performances

Avec la sortie de Phi-4, Microsoft souligne l’importance d’un développement responsable de l’IA. Le modèle a fait l’objet d’évaluations de sécurité approfondies, notamment de tests croisés, afin de minimiser les risques tels que les biais, la génération de contenus préjudiciables et la désinformation.

Il est toutefois conseillé aux développeurs de mettre en œuvre des protections supplémentaires pour les applications à haut risque et de baser les résultats sur des informations contextuelles vérifiées lors du déploiement du modèle dans des scénarios sensibles.

Implications pour le paysage de l’IA

Phi-4 remet en question la tendance dominante consistant à étendre les modèles d’IA à des tailles massives. Cela démontre que des modèles plus petits et bien conçus peuvent obtenir des résultats comparables ou supérieurs dans des domaines clés.

Cette efficacité réduit non seulement les coûts, mais également la consommation d’énergie, rendant les capacités avancées d’IA plus accessibles aux organisations de taille moyenne et aux entreprises disposant de budgets informatiques limités.

À mesure que les développeurs commenceront à expérimenter ce modèle, nous verrons bientôt s’il peut constituer une alternative viable aux modèles open source et commerciaux concurrents d’OpenAI, Anthropic, Google, Meta, DeepSeek et bien d’autres.


Share this content:

Post Comment

Vous avez peut-être manqué