in

Snowflake open sources SwiftKV pour réduire les coûts de charge de travail d'inférence

Snowflake open sources SwiftKV pour réduire les coûts de charge de travail d'inférence

« Cette idée n’est pas nouvelle et Snowflake n’est certainement pas le premier à illustrer sa valeur, bien entendu. SAP, par exemple, a introduit cette idée avec son plug-in de modèle, Finch, plus tôt en 2024 », a déclaré Bradley Shimmin, analyste en chef chez Omdia.

Cependant, malgré les affirmations de Snowflake selon lesquelles la perte de précision des LLM optimisés pour SwiftKV est minime, Shimmin a averti qu'il pourrait y avoir des compromis en termes de complexité à mettre en œuvre, de dégradation des capacités et de compatibilité avec l'architecture d'inférence sous-jacente.

« Les méthodes telles que la quantification sont très populaires car elles n’imposent pas beaucoup de compromis. Ainsi, si les clients trouvent que cette technique de Snowflake a une valeur similaire, j'imagine qu'ils l'utiliseront peut-être même avec d'autres techniques, selon les besoins de leur projet, quel qu'il soit », a expliqué Shimmin.

A Lire aussi  pour l’achat de l’Echo Dot 3 à 17,99€, Boulanger offre la prise connectée Tapo P100

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

GIPHY App Key not set. Please check settings

Ouais ! L'araignée la plus meurtrière au monde est en fait composée de 3 espèces différentes

Ouais ! L'araignée la plus meurtrière au monde est en fait composée de 3 espèces différentes

Madonna partage des photos de chambre racées en mini-robe noire et bottes hautes

Madonna partage des photos de chambre racées en mini-robe noire et bottes hautes