« Algolia AI » désigne une suite de fonctionnalités avancées basées sur l’IA, conçues pour améliorer la pertinence de la recherche et des recommandations. Cela inclut NeuralSearch, Dynamic Re-Ranking, Dynamic Synonym Suggestion, Query Categorization, AI Personalization, ainsi que certaines fonctionnalités de Recommend (par ex. Frequently Bought Together ou Looking Similar).
Algolia AI s’appuie sur une large gamme de technologies, allant des méthodes simples et éprouvées (régressions, filtrage collaboratif) aux modèles les plus avancés (grands modèles de langage – LLM). Les modèles de deep learning, dont les LLMs, sont généralement pré-entraînés par des entreprises de confiance comme Google ou Microsoft. Selon les besoins spécifiques des clients, les modèles peuvent être affinés (fine-tuned) afin d’améliorer la qualité et la pertinence, notamment pour exceller dans l’e-commerce.
Algolia AI utilise vos données d’abonnés (comme les requêtes de recherche et événements, définis dans le glossaire Algolia) pour affiner les modèles à vos cas d’usage spécifiques. Ces données permettent d’améliorer la pertinence des résultats et recommandations pour vos utilisateurs finaux. Algolia applique toutefois des protocoles stricts de confidentialité et de sécurité (anonymisation, chiffrement) comme décrit dans nos mesures de sécurité.
Oui, mais uniquement dans votre environnement de production spécifique. Vos données servent à entraîner les modèles qui alimentent vos fonctionnalités de recherche et de recommandation. Elles ne sont pas utilisées pour entraîner les modèles d’autres clients et restent isolées.
Non. La nature des services Algolia AI repose sur l’utilisation des données clients pour fournir des résultats adaptés. Il n’est donc pas possible de désactiver l’entraînement, car vos données sont essentielles pour ajuster les modèles à vos besoins.
Non. Algolia ne partage pas vos données avec d’autres clients. Toutes les données utilisées pour l’entraînement et l’affinage des modèles sont strictement cloisonnées et réservées aux services qui vous sont fournis.
Algolia respecte rigoureusement les réglementations mondiales en matière de protection des données (dont le RGPD). Nous appliquons des techniques de minimisation des données, de pseudonymisation (par ex. remplacement des adresses IP par des userTokens) et supprimons/anonymisons les données personnelles (PII) avant tout entraînement de modèles. Les modèles IA ne contiennent pas de PII, sauf pour des fonctionnalités personnalisées comme AI Personalization.
-
Chiffrement robuste (AES-256) en transit et au repos
-
Contrôles d’accès basés sur les rôles (RBAC) et principe du moindre privilège
-
Segmentation logique des données clients dans le cloud
-
Entraînement des modèles en isolation
-
Audits réguliers, conformes aux standards de sécurité internationaux (SOC 2, ISO27001, ISO27017).
-
Sélection rigoureuse des données d’entraînement
-
Validation avancée pour limiter les biais
-
Utilisation de datasets publics de référence avant production
-
Détection des anomalies en production (attaques bots, utilisateurs surreprésentés)
-
Politiques d’usage éthique : l’IA est uniquement utilisée pour fournir recherche et recommandations, et non à des fins détournées.
Oui. Algolia propose une suite d’outils de Generative Experiences permettant de créer de nouvelles expériences web pour vos utilisateurs finaux.
Qu’est-ce que Generative Experiences chez Algolia ?
Il s’agit d’outils (dont Guides) qui permettent d’appliquer des capacités de génération IA sur vos données Algolia. Ces services s’appuient actuellement sur des LLMs tiers via API.
Les fournisseurs de LLM tiers peuvent-ils entraîner leurs modèles avec mes données ?
Non. Les contrats avec nos fournisseurs de LLM interdisent l’utilisation des données clients pour l’entraînement de leurs modèles. Algolia peut utiliser vos données pour affiner des LLM tiers afin de fournir les outils de Generative Experiences, mais vos données ne servent pas à entraîner des modèles globaux.
Les inputs et outputs de Generative Experiences sont-ils considérés comme des données abonnés (Subscriber Data) ?
Oui. Les entrées fournies par les clients et les sorties générées sont considérées comme Subscriber Data. Étant donné la nature évolutive de la génération de contenu par IA, les résultats peuvent contenir des inexactitudes ou incohérences. Nous recommandons d’intégrer une relecture humaine avant publication.