„Algolia AI“ bezeichnet eine Suite von fortschrittlichen, KI-gestützten Funktionen zur Verbesserung der Suchrelevanz und Empfehlungen. Dazu gehören NeuralSearch, Dynamic Re-Ranking, Dynamic Synonym Suggestion, Query Categorization, AI Personalization sowie bestimmte Recommend-Funktionen (z. B. Frequently Bought Together und Looking Similar).
Algolia AI nutzt ein breites Spektrum an Technologien – von einfachen und bewährten Methoden (z. B. Regressionen oder kollaboratives Filtern) bis hin zu modernsten Modellen wie Large Language Models (LLM). Deep-Learning-Modelle, einschließlich LLMs, werden in der Regel von vertrauenswürdigen Anbietern wie Google oder Microsoft vortrainiert. Je nach Kundenbedarf können Modelle feinabgestimmt (fine-tuned) werden, um Qualität und Relevanz zu erhöhen, insbesondere im E-Commerce-Umfeld.
Algolia AI verwendet Ihre Abonnentendaten (z. B. Suchanfragen und Events, wie im Algolia Glossar definiert), um Modelle für Ihren spezifischen Anwendungsfall zu optimieren. Diese Daten helfen, relevantere Suchergebnisse und Empfehlungen für Ihre Endnutzer bereitzustellen. Algolia stellt dabei strenge Datenschutz- und Sicherheitsprotokolle sicher, einschließlich Anonymisierung und Verschlüsselung, wie in unseren Sicherheitsmaßnahmen beschrieben.
Ja, aber nur innerhalb Ihrer spezifischen Produktionsumgebung. Ihre Daten werden genutzt, um die Modelle zu trainieren, die Ihre Such- und Empfehlungsfunktionen betreiben. Ihre Daten werden jedoch nicht zum Training von Modellen anderer Kunden verwendet und bleiben isoliert.
Nein. Die Algolia AI-Dienste basieren auf Kundendaten, um maßgeschneiderte Ergebnisse zu liefern. Ein Opt-out ist nicht möglich, da Ihre Daten entscheidend für die Feinabstimmung der Modelle auf Ihre Anforderungen sind.
Nein. Algolia teilt Ihre Daten nicht mit anderen Kunden. Alle Trainings- und Feinabstimmungsdaten sind strikt isoliert und werden ausschließlich für die Ihnen bereitgestellten Dienste genutzt.
Algolia erfüllt die Anforderungen globaler Datenschutzvorschriften, einschließlich DSGVO. Wir setzen Datenminimierung, Pseudonymisierung (z. B. Ersetzen von IP-Adressen durch userTokens) sowie die Entfernung oder Anonymisierung personenbezogener Daten (PII) vor der Modellnutzung ein. Unsere KI-Modelle enthalten keine PII, außer bei personalisierten Funktionen wie AI Personalization.
-
Starke Verschlüsselung (AES-256) während der Übertragung und im Ruhezustand
-
Strenge rollenbasierte Zugriffskontrollen (RBAC) und Prinzip des geringsten Privilegs
-
Logische Trennung der Kundendaten in der Cloud
-
Modelltraining in isolierten Umgebungen
-
Regelmäßige Audits nach führenden Sicherheitsstandards wie SOC 2, ISO27001 und ISO27017.
-
Kuratierung der Trainingsdaten zur Bias-Vermeidung
-
Strenge Validierungsprozesse
-
Nutzung modernster öffentlicher Datensätze in der Vorproduktion
-
Erkennung von Anomalien in der Produktion (z. B. Bot-Angriffe oder Power-User-Aktivität)
-
Richtlinien für den ethischen Einsatz: KI-Modelle werden ausschließlich für zugelassene Zwecke genutzt (Suche und Empfehlungen), Missbrauch wird verhindert.
Ja. Algolia stellt eine Suite von Generative Experiences bereit, mit denen Kunden neue Web-Erlebnisse für ihre Endnutzer aufbauen können.
Was sind Algolia Generative Experiences?
Dies sind Tools (u. a. Guides), mit denen Kunden generative KI-Fähigkeiten auf ihre Algolia-Daten anwenden können. Generative Experiences werden derzeit über APIs von LLM-Drittanbietern betrieben.
Können LLM-Drittanbieter meine Daten zum Training ihrer Modelle verwenden?
Nein. Unsere Verträge mit LLM-Drittanbietern verbieten die Nutzung von Kundendaten zum Training ihrer Modelle. Algolia kann Ihre Daten verwenden, um LLMs von Drittanbietern gezielt feinabzustimmen, damit Generative Experiences bereitgestellt werden können – jedoch ohne Ihre Daten für allgemeines Training freizugeben.
Gelten Inputs und Outputs von Generative Experiences als Abonnentendaten (Subscriber Data)?
Ja. Sowohl die Eingaben der Kunden als auch die generierten Ausgaben gelten als Subscriber Data. Da generative KI-Technologie noch in Entwicklung ist, können Ausgaben Ungenauigkeiten, Inkonsistenzen oder Fehler enthalten. Wir empfehlen Kunden daher, eine menschliche Überprüfung aller generierten Inhalte vorzunehmen.