Bewerten und sortieren Sie Dokumente mit Cross-Encoder-Präzision auf europäischen GPUs. Steigern Sie die Genauigkeit Ihrer RAG-Pipeline, ohne dass Ihre Daten die EU verlassen.
Kostenloses Konto erstellen 100K Tokens/Monat kostenlosWir betreiben die Qwen3 Reranker-Familie: instruktionsbasierte Cross-Encoder-Modelle, die Anfrage-Dokument-Relevanz mit hoher Präzision bewerten. 100+ Sprachen, 32K Kontext. Perfekt als zweite Stufe nach der Embedding-Suche.
Alle Modelle laufen auf modernen Blackwell- oder neueren Chips für optimale Leistung. Preise pro Million Tokens. Free Tier bei allen Modellen inklusive.
Reranking ist die Präzisionsschicht in modernen Retrieval-Systemen. Fügen Sie einen Reranker nach der Embedding-Suche hinzu, um die Relevanz drastisch zu verbessern.
Die Reranking API verwendet einen einfachen Scoring-Endpunkt. Senden Sie eine Anfrage und eine Liste von Dokumenten, erhalten Sie Relevanzwerte zurück.
Gibt Relevanzwerte (0-1) für jedes Dokument zurück. Unterstützt instruktionsbasiertes Reranking über den instruction-Parameter.
100K kostenlose Tokens pro Monat. Keine Kreditkarte erforderlich. Alle Modelle inklusive.
Kostenloses Konto erstellen