a cell phone sitting on top of a laptop computer
IA

OpenAI lance son propre chip Jalapeño pour réduire sa dépendance à Nvidia

27 juin 20263 min de lecture1 vues

OpenAI a développé en partenariat avec Broadcom une puce informatique sur mesure, baptisée Jalapeño, pour faire tourner ses modèles d'IA. L'objectif : réduire massivement les coûts liés à l'achat de matériel Nvidia, dont les marges dépassent 75 %.

Pourquoi OpenAI fabrique sa propre puce ?

Derrière chaque réponse de ChatGPT se cachent des milliers de processeurs graphiques (GPU) qui tournent en permanence. Ces composants, fabriqués en grande majorité par Nvidia, coûtent une fortune. Et pour une entreprise comme OpenAI, dont les dépenses en infrastructure sont colossales, cette dépendance représente un frein financier majeur.

C'est pour sortir de cette logique que la société a développé une puce dédiée, surnommée Jalapeño. Conçue en collaboration avec le géant américain des semi-conducteurs Broadcom, il s'agit d'un circuit intégré à application spécifique — ou ASIC en jargon technique. Contrairement aux GPU polyvalents de Nvidia, une puce ASIC est taillée sur mesure pour une tâche précise : ici, faire fonctionner les modèles d'intelligence artificielle d'OpenAI de la manière la plus efficace possible.

Le problème avec Nvidia : des marges à 75 %

Nvidia réalise actuellement des marges bénéficiaires estimées à 75 % sur ses processeurs destinés à l'IA. Autrement dit, pour chaque euro dépensé par OpenAI en hardware Nvidia, les trois quarts constituent du profit pour le fabricant américain. À l'échelle des milliards investis dans l'infrastructure d'OpenAI, cette réalité économique devient insoutenable sur le long terme.

En produisant ses propres puces, OpenAI espère reprendre la main sur cette équation financière. C'est une stratégie déjà éprouvée par d'autres géants du numérique : Google a lancé ses propres TPU pour entraîner ses modèles, Amazon dispose de ses puces Trainium et Inferentia, et Meta investit également dans du silicium maison.

Ce que cela change concrètement

La puce Jalapeño est conçue spécifiquement pour l'inférence — c'est-à-dire la phase où le modèle répond à une question, génère du texte ou produit une image. C'est lors de cette phase que les coûts sont les plus importants au quotidien, car elle correspond à chaque interaction de l'utilisateur avec ChatGPT ou les API d'OpenAI.

En optimisant cette étape précise avec une puce dédiée, OpenAI pourrait significativement réduire son coût par requête, et donc améliorer sa rentabilité — ou baisser ses prix pour les utilisateurs et entreprises clientes.

Un secteur en pleine mutation

Cette initiative illustre une tendance de fond dans l'industrie de l'IA : les grandes plateformes ne veulent plus dépendre entièrement des fournisseurs de matériel. Le marché des puces pour l'IA est en train de se fragmenter, avec une multitude d'acteurs — startups et géants confondus — qui cherchent à challenger la domination de Nvidia.

Pour les lecteurs français, cela signifie que la bataille pour l'IA ne se joue pas seulement sur les algorithmes ou les données, mais aussi — et peut-être surtout — sur le silicium. Celui qui contrôle les puces contrôle les coûts, et donc les prix et l'accessibilité de l'IA pour tous.

Source : AI News

Source : AI News

Partager cet article

À lire aussi