Hugging Face API et AutoTrain : comparaison des prix et des fonctionnalités avec NLP Cloud

Hugging Face est bien connu pour son grand travail sur la bibliothèque Python Transformers, et pour son grand référentiel de modèles d'apprentissage automatique. Mais ils fournissent également une API d'inférence et une plateforme de réglage fin appelée AutoTrain.

L'API de NLP Cloud et la plateforme de réglage fin de NLP Cloud sont des concurrents directs de l'API et de l'AutoTrain de Hugging Face. Comparons ici les prix et les fonctionnalités de ces 2 acteurs !

Fixation des prix : Hugging Face VS NLP Cloud

Tout d'abord, il convient de noter que l'API NLP Cloud peut être testée gratuitement lorsqu'elle est utilisée sur un CPU et un GPU (grâce au plan gratuit et au plan payant qui offre 100 000 jetons gratuits), tandis que l'API Hugging Face ne peut être testée gratuitement que sur un CPU (grâce à leur plan gratuit). Il s'agit d'une différence importante, car les modèles d'IA les plus intéressants basés sur le Transformer fonctionnent beaucoup plus rapidement sur un GPU. Certains ne fonctionnent même pas sur un GPU.

Prix de l'étreinte du visage

En termes de plans, Hugging Face propose uniquement une tarification à l'usage (tarification basée sur votre consommation) tandis que NLP Cloud propose à la fois des plans prépayés et des plans à l'usage. Disons que vous voulez effectuer une classification de texte sur des morceaux de texte qui contiennent environ 5k mots en moyenne, à un taux de 15 demandes par minute, sur un GPU. La tarification de Hugging Face est basée sur le nombre de caractères, tandis que celle de NLP Cloud est basée sur le nombre de tokens. 5k mots sont plus ou moins équivalents à 15k caractères et à 3,750 tokens. Sur NLP Cloud, il vous en coûtera 99 $/mois en souscrivant au plan Starter GPU, tandis que sur Hugging Face, il vous en coûtera 15k x 15 x 60 x 24 x 31 x 50 $ / 1M = 500k $/mois ( !!!).

Comme vous pouvez le constater, il semble que la tarification à l'acte de Hugging Face ne soit absolument pas adaptée à une utilisation en production. Littéralement personne ne va payer un tel prix pour la classification de texte sur un GPU...

En ce qui concerne le réglage fin, il n'est même pas possible de comparer car les prix de l'AutoTrain de Hugging Face ne sont pas publics. Nous nous sommes inscrits et avons essayé leur solution AutoTrain, mais nous n'avons toujours pas trouvé de prix clair...

Modèles disponibles

Ce qui est génial avec Hugging Face, c'est qu'ils hébergent des tonnes de modèles d'IA sur leur plateforme ! Cependant, cela ne signifie pas que vous pouvez réellement utiliser ces modèles. Vous pouvez bien sûr les télécharger, mais ce n'est pas la même chose que de les utiliser.

Seule une très petite partie des modèles de Hugging Face est disponible pour l'inférence via leur API. Si vous essayez d'utiliser un modèle qui n'est pas déjà chargé, vous devrez attendre plusieurs minutes, ou simplement obtenir une erreur. Une solution est d'épingler les modèles que vous voulez utiliser afin qu'ils soient toujours disponibles, mais dans ce cas, vous devez payer un supplément de 5 $/mois par modèle sur un GPU.

Sur NLP Cloud, nous avons choisi une stratégie différente : environ 50 modèles d'IA différents sont disponibles en permanence. Nous sélectionnons un modèle lorsque nous pensons qu'il s'agit du meilleur modèle pour un cas d'utilisation spécifique. Par exemple, nous choisissons Bart Large MNLI pour la classification, Distilbert pour l'analyse des sentiments, GPT-J pour la détection des intentions, etc.

Plus important encore : les modèles d'IA les plus avancés comme GPT-J ne sont pas disponibles sur l'API Hugging Face, et ne peuvent pas être affinés sur leur plateforme AutoTrain, alors que vous pouvez facilement utiliser et affiner ces grands modèles de langage sur NLP Cloud.

Exemple d'API GPT-J sur NLP Cloud

Réglage fin de GPT-J sur NLP Cloud

Soutien

Hugging Face ne propose une assistance que si vous choisissez leur plan Lab ou Enterprise.

NLP Cloud est complètement différent : nous offrons le meilleur support possible à tous nos clients, qu'il s'agisse d'un client gratuit, d'un petit client payant ou d'une entreprise. Nous pensons qu'un bon support est essentiel lorsqu'il s'agit d'IA et de traitement du langage naturel, car les clients peuvent avoir des tonnes de questions techniques ou commerciales intéressantes.

Vitesse et fiabilité

Dans nos benchmarks, nous avons remarqué une latence plus faible sur l'API NLP Cloud pour tous les modèles que nous avons testés, que ce soit sur un CPU ou un GPU.

La vitesse est essentielle pour une telle API d'apprentissage automatique, et le fait que NLP Cloud réponde plus rapidement peut faire une grande différence, selon les exigences de votre entreprise.

En ce qui concerne les réglages fins, nous n'avons pas été en mesure de faire une comparaison correcte pour le moment car la plupart des réglages fins que nous avons lancés sur la plateforme Hugging Face AutoTrain ont échoué sans message d'erreur explicite.

Conclusion

Les utilisateurs comparent souvent NLP Cloud à l'API Hugging Face et à la plateforme AutoTrain.

Nous pensons que l'API NLP Cloud est beaucoup plus intéressante, tant du point de vue des prix que des performances.

Nous sommes également très fiers d'offrir un support de haute qualité à tous nos clients sans distinction.

Voulez-vous faire un essai ? Testez NLP Cloud ici !

Julien Salinas
Directeur technique de NLP Cloud