in

Deep Cogito sort de l’ombre avec des modèles hybrides capables de « raisonner »

Deep Cogito sort de l’ombre avec des modèles hybrides capables de « raisonner »

Une nouvelle start-up, Deep Cogito, se dévoile après une phase discrète en présentant une famille de modèles d’IA open source capables de basculer entre un mode « raisonnement » et un fonctionnement standard.

Ces architectures hybrides, comme le modèle O1 d’OpenAI, ont montré leur potentiel dans des domaines exigeants tels que les mathématiques ou la physique, grâce à leur capacité à décomposer les problèmes complexes en étapes vérifiables. Mais cette approche requiert davantage de puissance de calcul et augmente la latence. Pour contourner cet écueil, des acteurs comme Anthropic explorent des modèles hybrides, combinant raisonnement structuré et traitement rapide. L’objectif : répondre instantanément aux questions simples tout en mobilisant davantage de ressources pour les requêtes complexes.

A Lire aussi  Coupure d’électricité : Tesla dévoile la plus grande batterie d’Europe aux portes de la France

C’est précisément la promesse des modèles Cogito 1 de Deep Cogito. La start-up affirme surpasser les meilleurs modèles open source de taille comparable, notamment ceux de Meta et de la pépite chinoise Deepseek. « Chaque modèle peut répondre directement… ou activer une phase d’auto-réflexion avant de générer une réponse, à la manière des systèmes de raisonnement dédiés », précise l’entreprise dans un billet de blog. Autre argument clé : ces modèles, déclinés de 3 à 70 milliards de paramètres, auraient été développés en seulement 75 jours par une petite équipe. Des versions atteignant 671 milliards de paramètres sont déjà annoncées.

À noter : Deep Cogito ne part pas de zéro. Ses fondations reposent sur les architectures QWEN de Meta (via Open Llama) et d’Alibaba, retravaillées avec de nouvelles méthodes d’entraînement pour booster leurs performances et intégrer ce raisonnement « à la demande ». Selon les benchmarks internes, le fleuron Cogito 70b (avec raisonnement activé) devancerait le modèle R1 de Deepseek sur des tests mathématiques et linguistiques. Même sans cette fonctionnalité, il surpasserait le récent LLAMA 4 Scout de Meta sur LiveBench, un benchmark d’IA généraliste.

A Lire aussi  Microsoft dévoile son nouvel ultrabook haut en couleurs

Disponibles en téléchargement ou via des API sur des plateformes comme Fireworks et Together AI, ces modèles ne seraient qu’une première étape. « Nous n’avons mobilisé qu’une fraction des ressources habituellement consacrées à l’entraînement des grands modèles », souligne Deep Cogito, laissant entrevoir des optimisations futures via l’auto-amélioration post-formation.

Fondée en juin 2024 à San Francisco, la start-up compte parmi ses soutiens South Park Commons, selon PitchBook. Ses deux cofondateurs, Drishan Arora (ex-ingénieur senior chez Google) et Dhruv Malhotra (ancien chef de produit chez DeepMind), nourrissent une ambition vertigineuse : développer une « superintelligence générale », capable non seulement de surpasser les humains, mais aussi de révéler « des capacités que nous n’imaginons pas encore ». Un pari qui pourrait redistribuer les cartes dans la course à l’IA de demain.

A Lire aussi  Le OnePlus 12 écrase Apple et Samsung, son benchmark impressionne

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

GIPHY App Key not set. Please check settings

Rencontre entre Giorgia Meloni et Donald Trump : enjeux et contexte

Rencontre entre Giorgia Meloni et Donald Trump : enjeux et contexte

Les forces syriennes éliminent le chef militant lié à un régime assad

Les forces syriennes éliminent le chef militant lié à un régime assad