Forte de la demande des clients, SingleStore, la société à l'origine de la base de données relationnelle SingleStoreDB, a décidé d'intégrer nativement Apache Iceberg dans son offre pour aider ses entreprises clientes à exploiter les données stockées dans les data lakehouses.
« Avec cette nouvelle intégration, SingleStore vise à transformer les données dormantes à l'intérieur des Lakehouses en un actif précieux en temps réel pour les applications d'entreprise. Apache Iceberg, un standard ouvert populaire pour les data lakehouses, offre aux DSI un stockage et une interrogation rentables de grands ensembles de données », a déclaré Dion Hinchcliffe, analyste principal chez The Futurum Group.
Hinchcliffe a souligné que l'intégration de SingleStore inclut des mises à jour qui aident ses clients à contourner les défis auxquels ils peuvent généralement être confrontés lors de l'adoption de méthodes traditionnelles pour rendre les données des tables Iceberg plus immédiates.
Ces défis incluent des workflows ETL (extraction, transformation, chargement) complexes et étendus et des tâches Spark gourmandes en calcul.
Certaines des principales caractéristiques de l'intégration sont l'ingestion à faible latence, le flux de données bidirectionnel et les performances en temps réel à moindre coût, a indiqué la société.
Carl Olofson, vice-président de la recherche d'IDC, explique comment SingleStore atteint une faible latence lors des requêtes et des mises à jour. cache.
« Ce faisant, l'entreprise peut considérablement améliorer la vitesse à laquelle les tables Iceberg peuvent être interrogées et mises à jour », a expliqué Olofson, ajoutant que l'entreprise pourrait charger de manière proactive les données d'Iceberg dans leur format optimisé pour la mémoire interne.
Avant l'intégration d'Iceberg, SingleStore conservait les données sous une forme ou un format optimisé pour un échange rapide vers la mémoire, où tout le traitement des données avait lieu, a déclaré l'analyste.
Plusieurs autres fournisseurs de bases de données, notamment Databricks, ont tenté d’adopter le format de table Apache Iceberg en raison de sa popularité croissante auprès des entreprises.
Plus tôt ce mois-ci, Databricks a accepté d'acquérir Tabular, le fournisseur de plate-forme de stockage dirigé par les créateurs d'Apache Iceberg, afin de promouvoir l'interopérabilité des données dans les Lakehouses.
Un autre format de data lakehouse – Delta Live Tables – développé par Databricks et plus tard open source via la Linux Foundation, est en concurrence avec les tables Iceberg.
Actuellement, la société travaille sur un autre format permettant aux entreprises d'utiliser à la fois les tables Iceberg et Delta Live.
Olofson et Hinchcliffe ont souligné que plusieurs fournisseurs et offres — tels que BigQuery de Google, Starburst, Watsonx.data d'IBM, DataSphere de SAP, Teradata, Cloudera, Dremio, Presto, Hive, Impala, StarRocks et Doris — ont intégré Iceberg en tant qu'outil ouvert. format de tableau d’analyse source pour les très grands ensembles de données.
L'intégration native d'Iceberg dans SingleStoreDB est actuellement en aperçu public.
Mises à jour des options de recherche et de déploiement
Dans le cadre des mises à jour de SingleStoreDB, la société ajoute de nouvelles fonctionnalités à sa fonction de recherche en texte intégral qui améliorent le score de pertinence, la similarité phonétique, la correspondance floue et le classement basé sur la proximité des mots clés.
La combinaison de ces capacités permet aux entreprises d'éliminer le besoin de bases de données spécialisées supplémentaires pour créer des applications génératives basées sur l'IA, a expliqué la société.
De plus, la société a introduit une fonctionnalité de mise à l'échelle automatique en version préliminaire publique qui permet aux entreprises de gérer les charges de travail ou les applications en augmentant ou en réduisant les ressources de calcul.
Il permet également aux utilisateurs de définir des seuils d'utilisation du processeur et de la mémoire pour la mise à l'échelle automatique, afin d'éviter toute consommation inutile.
En outre, la société a annoncé l'introduction d'une nouvelle option de déploiement pour la base de données via Helios -BYOC, qui est une version gérée de la base de données via un cloud privé virtuel.
Cette offre est désormais disponible en aperçu privé dans AWS et les clients d'entreprise peuvent exécuter SingleStore dans leurs propres locataires tout en respectant les politiques de résidence et de gouvernance des données, a déclaré la société.
Copyright © 2024 IDG Communications, Inc.



GIPHY App Key not set. Please check settings