Embedding-Modell auswählen
Das Embedding-Modell kann entweder lokal oder bei einem Cloud-Provider betrieben werden. Dabei gilt es folgende Aspekte zu beachten: Lokaler Betrieb:- Höhere Datensicherheit, da die Daten das eigene System nicht verlassen
- Benötigt entsprechende Hardware-Ressourcen (CPU/GPU, Arbeitsspeicher)
- Langsamere Verarbeitung im Vergleich zu Cloud-Lösungen
- Schnellere Verarbeitung
- Keine zusätzliche Hardware erforderlich
- Daten werden zur Verarbeitung an den Provider übermittelt
Unterstütze Provider
OpenAI
OpenAI ist der wohl bekannteste Anbieter für KI-Modelle und hat einige der führenden Modelle auf dem Markt. Mittext-embedding-3-small und text-embedding-3-large können sehr gute Ergebnisse erzielt werden.
Allerdings findet die Verarbeitung der Daten hier ggf. in Rechenzentren in den USA statt, sodass nicht der höchste Datensicherheitsstandard eingehalten werden kann.
Azure
Azure bietet als OpenAI-Partner ebenfalls dietext-embedding-3-small und text-embedding-3-large Modelle an, die bei Azure auch in EU-Rechenzentren gehosted werden können.
Hier fließen also garantiert keine Daten in die USA, allerdings gehört Azure zu Microsoft und ist somit ebenfalls ein US-amerikanischer Anbieter.