Deep Cogito sort de l’ombre avec des modèles hybrides capables de « raisonner »

Une nouvelle start-up, Deep Cogito, se dévoile après une phase discrète en présentant une famille de modèles d’IA open source capables de basculer entre un mode « raisonnement » et un fonctionnement standard.

Ces architectures hybrides, comme le modèle O1 d’OpenAI, ont montré leur potentiel dans des domaines exigeants tels que les mathématiques ou la physique, grâce à leur capacité à décomposer les problèmes complexes en étapes vérifiables. Mais cette approche requiert davantage de puissance de calcul et augmente la latence. Pour contourner cet écueil, des acteurs comme Anthropic explorent des modèles hybrides, combinant raisonnement structuré et traitement rapide. L’objectif : répondre instantanément aux questions simples tout en mobilisant davantage de ressources pour les requêtes complexes.

C’est précisément la promesse des modèles Cogito 1 de Deep Cogito. La start-up affirme surpasser les meilleurs modèles open source de taille comparable, notamment ceux de Meta et de la pépite chinoise Deepseek. « Chaque modèle peut répondre directement… ou activer une phase d’auto-réflexion avant de générer une réponse, à la manière des systèmes de raisonnement dédiés », précise l’entreprise dans un billet de blog. Autre argument clé : ces modèles, déclinés de 3 à 70 milliards de paramètres, auraient été développés en seulement 75 jours par une petite équipe. Des versions atteignant 671 milliards de paramètres sont déjà annoncées.

À noter : Deep Cogito ne part pas de zéro. Ses fondations reposent sur les architectures QWEN de Meta (via Open Llama) et d’Alibaba, retravaillées avec de nouvelles méthodes d’entraînement pour booster leurs performances et intégrer ce raisonnement « à la demande ». Selon les benchmarks internes, le fleuron Cogito 70b (avec raisonnement activé) devancerait le modèle R1 de Deepseek sur des tests mathématiques et linguistiques. Même sans cette fonctionnalité, il surpasserait le récent LLAMA 4 Scout de Meta sur LiveBench, un benchmark d’IA généraliste.

Disponibles en téléchargement ou via des API sur des plateformes comme Fireworks et Together AI, ces modèles ne seraient qu’une première étape. « Nous n’avons mobilisé qu’une fraction des ressources habituellement consacrées à l’entraînement des grands modèles », souligne Deep Cogito, laissant entrevoir des optimisations futures via l’auto-amélioration post-formation.

Fondée en juin 2024 à San Francisco, la start-up compte parmi ses soutiens South Park Commons, selon PitchBook. Ses deux cofondateurs, Drishan Arora (ex-ingénieur senior chez Google) et Dhruv Malhotra (ancien chef de produit chez DeepMind), nourrissent une ambition vertigineuse : développer une « superintelligence générale », capable non seulement de surpasser les humains, mais aussi de révéler « des capacités que nous n’imaginons pas encore ». Un pari qui pourrait redistribuer les cartes dans la course à l’IA de demain.

Deep Cogito sort de l’ombre avec des modèles hybrides capables de « raisonner »

Le Charles de Gaulle en mer d’Arabie : la France se positionne pour le détroit d’Ormuz

Somalie : 50 combattants al-Shabaab tués près de Baidoa

Drame aux Maldives : cinq plongeurs italiens morts dans une grotte, la sixième rescapée par un coup du sort

Guerre en Ukraine : 205 prisonniers échangés, un signal ou une illusion ?

Les Etats-Unis rejettent la proposition de paix en 14 points de l’Iran

Ebola en RDC : une épidémie qui ressurgit à l’est, aux portes de l’Ouganda

Hantavirus sur un bateau de croisière : on en sait plus sur les décès et la contamination des passagers

Guerre en Iran et au Liban : quel est le coût du conflit au Moyen-Orient pour la France ?

Manifestation du 1er mai : des risques de débordement ? Les autorités ont évalué les risques

Cette technique de détective privé permet de passer inaperçu : « Plus c’est gros, plus ça passe »

Juvisy-sur-Orge : un bus tombe dans la Seine, quatre personnes à bord et une interrogation

Disparition de Manon Relandeau : un SMS au cœur des soupçons

Laisser un commentaireAnnuler la réponse

Rencontre entre Giorgia Meloni et Donald Trump : enjeux et contexte

Les forces syriennes éliminent le chef militant lié à un régime assad