in

Les dangers de la sur-ingénierie des systèmes d’IA générative

Le cloud est le moyen le plus simple de créer des systèmes d'IA générative ; c'est pourquoi les revenus du cloud montent en flèche. Cependant, bon nombre de ces systèmes sont trop complexes, ce qui entraîne une complexité et des coûts inutiles. La suringénierie est un problème familier. Nous réfléchissons et construisons excessivement des systèmes, des appareils, des machines, des véhicules, etc. depuis de nombreuses années. Pourquoi le cloud serait-il différent ?

La suringénierie consiste à concevoir un produit ou une solution inutilement complexe en y incorporant des caractéristiques ou des fonctionnalités qui n'apportent aucune valeur ajoutée substantielle. Cette pratique conduit à une utilisation inefficace du temps, de l'argent et des matériaux et peut entraîner une baisse de la productivité, une augmentation des coûts et une réduction de la résilience du système.

La suringénierie de tout système, qu'il s'agisse d'IA ou de cloud, se produit grâce à un accès facile aux ressources et à l'absence de limites quant à l'utilisation de ces ressources. Il est facile de trouver et d'allouer des services cloud, il est donc tentant pour un concepteur ou un ingénieur en IA d'ajouter des éléments qui peuvent être considérés comme « agréables à avoir » plutôt que « nécessaires ». Prendre un tas de décisions de ce type conduit à beaucoup plus de bases de données, de couches middleware, de systèmes de sécurité et de systèmes de gouvernance que nécessaire.

La facilité avec laquelle les entreprises peuvent accéder aux services cloud et les fournir est devenue à la fois une aubaine et un fléau. Les outils avancés basés sur le cloud simplifient le déploiement de systèmes d'IA sophistiqués, mais ils ouvrent également la porte à une ingénierie excessive. Si les ingénieurs devaient passer par un processus d'approvisionnement, y compris l'achat de matériel spécialisé pour des services informatiques ou de stockage spécifiques, ils seraient probablement plus restreints que lorsqu'il suffit d'un simple clic de souris.

Les dangers d’un approvisionnement facile

Les plateformes de cloud public disposent d’une gamme impressionnante de services conçus pour répondre à tous les besoins possibles en matière d’IA générative. Du stockage et du traitement des données aux modèles et analyses d’apprentissage automatique, ces plates-formes offrent une combinaison attrayante de fonctionnalités. En effet, regardez la liste recommandée de quelques dizaines de services que les fournisseurs de cloud considèrent comme « nécessaires » pour concevoir, construire et déployer un système d’IA générative. Bien entendu, gardez à l’esprit que l’entreprise qui crée la liste vend également les services.

Les GPU en sont le meilleur exemple. Je vois souvent des services de calcul configurés par GPU ajoutés à une architecture d’IA générative. Cependant, les GPU ne sont pas nécessaires pour les calculs de type « à la va-vite », et les systèmes alimentés par CPU fonctionnent très bien pour une petite partie du coût.

Pour une raison quelconque, la croissance explosive des entreprises qui fabriquent et vendent des GPU amène de nombreuses personnes à croire que les GPU sont une exigence, alors qu'ils ne le sont pas. Les GPU sont nécessaires lorsque des processeurs spécialisés sont indiqués pour un problème spécifique. Ce type de suringénierie coûte plus cher aux entreprises que d’autres erreurs de suringénierie. Malheureusement, recommander à votre entreprise de s'abstenir d'utiliser des processeurs haut de gamme et plus coûteux vous empêchera souvent de participer à des réunions d'architecture ultérieures.

Respecter un budget

L'augmentation des coûts est directement liée à la complexité des couches et aux services cloud supplémentaires, qui sont souvent inclus par souci de rigueur ou de pérennité. Lorsque je recommande à une entreprise d'utiliser moins de ressources ou des ressources moins coûteuses, on me répond souvent : « Nous devons tenir compte de la croissance future », mais cela peut souvent être géré en ajustant l'architecture à mesure qu'elle évolue. Cela ne devrait jamais signifier jeter de l’argent sur les problèmes dès le départ.

Cette tendance à inclure trop de services amplifie également la dette technique. La maintenance et la mise à niveau de systèmes complexes deviennent de plus en plus difficiles et coûteuses. Si les données sont fragmentées et cloisonnées entre différents services cloud, cela peut encore exacerber ces problèmes, rendant l'intégration et l'optimisation des données une tâche ardue. Les entreprises se retrouvent souvent piégées dans un cycle dans lequel leurs solutions d’IA générative sont non seulement sur-conçues, mais doivent également être davantage optimisées, ce qui entraîne une diminution du retour sur investissement.

Stratégies pour atténuer la suringénierie

Il faut une approche disciplinée pour éviter ces pièges. Voici quelques stratégies que j’utilise :

  • Donner la priorité aux besoins essentiels. Concentrez-vous sur les fonctionnalités essentielles nécessaires pour atteindre vos objectifs principaux. Résistez à la tentation de les surévaluer.
  • Planifiez et évaluez minutieusement. Investissez du temps dans la phase de planification pour déterminer quels services sont essentiels.
  • Commencez petit et évoluez progressivement. Commencez par un produit minimal viable (MVP) en vous concentrant sur les fonctionnalités de base.
  • Constituez une excellente équipe d’architecture d’IA générative. Choisissez l'ingénierie de l'IA, les scientifiques des données, les spécialistes de la sécurité de l'IA, etc., qui partagent la même approche pour tirer parti de ce qui est nécessaire, sans toutefois exagérer. Vous pouvez soumettre les mêmes problèmes à deux équipes d’architecture d’IA générative différentes et obtenir des plans dont le coût diffère de 10 millions de dollars. Lequel s'est trompé ? Habituellement, c’est l’équipe qui cherche à dépenser le plus.

La puissance et la flexibilité des plateformes de cloud public sont les raisons pour lesquelles nous utilisons le cloud en premier lieu, mais il convient d’être prudent pour éviter le piège de la sur-ingénierie des systèmes d’IA générative. Une planification réfléchie, une sélection judicieuse des services et une optimisation continue sont essentielles pour créer des solutions d’IA rentables. En adhérant à ces principes, les entreprises peuvent exploiter tout le potentiel de l’IA générative sans devenir la proie des complexités et des coûts d’un système sur-ingénierie.

Droits d'auteur © 2024 IDG Communications, Inc.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

GIPHY App Key not set. Please check settings

    Marché financier de la Cemac : Le Cameroun bat le record en levant une enveloppe de 135 milliards de FCFA

    vers une révolution conservatrice en France ?