Inference Embeddings Rerank Images Speech Guard
EN DE IT

IA Speech-to-Text &
Text-to-Speech,
hecho para Europa.

Sede en Alemania 100% residencia de datos en la UE

Transcribe audio and generate speech on European GPUs.
Open-source models with custom voice cloning.
Your voice data never leaves the EU.

Crear cuenta gratuita 5 min/mes gratis
// modelos + precios

Modelos de voz

Ejecutamos las familias de modelos Qwen3 ASR y TTS para reconocimiento y síntesis de voz. Multilingüe, pesos abiertos y optimizados para cargas de trabajo de producción. Clonación de voz personalizada incluida.

Todos los modelos funcionan en chips Blackwell modernos o más recientes para un rendimiento ideal. Plan gratuito incluido en todos los modelos.


Speech-to-Text
Qwen3-ASR-0.6B
Transcripción rápida y ligera. Ideal para cargas de alto rendimiento o en tiempo real.
0,006 € / minute Próximamente
Parameters0.6B
TaskSpeech-to-Text
LanguagesMultilingual
Pricing0,006 € / min
Qwen3-ASR-1.7B
Mayor precisión para audio complejo. Ideal para reuniones, llamadas y entornos ruidosos.
0,01 € / minute Próximamente
Parameters1.7B
TaskSpeech-to-Text
LanguagesMultilingual
Pricing0,01 € / min

Text-to-Speech
Qwen3-TTS-0.6B
Síntesis de voz rápida con entonación natural. Ideal para notificaciones y contenido breve.
0,015 € / 1K characters Próximamente
Parameters0.6B
TaskText-to-Speech
Custom VoiceYes
Pricing0,015 € / 1K chars
Qwen3-TTS-1.7B
Síntesis de calidad premium. Voz expresiva y natural para audiolibros, asistentes y contenido orientado al cliente.
0,020 € / 1K characters Próximamente
Parameters1.7B
TaskText-to-Speech
Custom VoiceYes
Pricing0,020 € / 1K chars
Plan gratuito
5 min de transcripción y síntesis/mes Sin tarjeta de crédito
Clonación de voz personalizada
Cree una voz sintética que suene como un hablante específico. Proporcione una referencia de audio corta y el modelo TTS generará nuevo discurso con esa voz. Ideal para voces de marca, asistentes virtuales o contenido personalizado.
Funciona con ambos modelos TTS. Sin necesidad de fine-tuning. Incluido sin coste adicional en cada llamada API TTS.
  1. 1. Suba una muestra de audio corta (se recomiendan 10+ segundos)
  2. 2. Haga referencia a la voz en sus llamadas API TTS
  3. 3. Genere voz con esa voz a partir de cualquier texto
Todos los datos de voz permanecen en infraestructura de la UE. No se almacenan datos de voz después del procesamiento a menos que cree explícitamente un perfil de voz guardado.
// qué puede construir

Casos de uso

Speech APIs enable a wide range of applications. From transcription pipelines to voice-enabled products.

Transcripción de reuniones y llamadas
Transcriba reuniones, llamadas y entrevistas en tiempo real o desde grabaciones. Soporte multilingüe para equipos europeos que trabajan en varios idiomas.
Asistentes de voz y chatbots
Combine speech-to-text y text-to-speech para asistentes IA completamente habilitados por voz. Procese el habla del usuario, genere una respuesta y pronunciéla.
Narración de contenido
Convierta artículos, documentación o contenido e-learning en audio con sonido natural. Use voces personalizadas para una identidad de marca consistente.
Accesibilidad
Haga su aplicación accesible con text-to-speech para usuarios con discapacidad visual y speech-to-text para usuarios con discapacidad auditiva. Compatible con GDPR por defecto.
// para equipos que necesitan más
¿Necesita más? El plan Business cubre todos los productos Nodion.ai: Inference, Embeddings, Images, Speech y más. 500 €/mes, capacidad GPU dedicada, 99.5% SLA.
Ver plan Business →
// primeros pasos

Documentación API

La API de voz sigue el formato de la API de Audio de OpenAI. Use los mismos endpoints y SDKs que ya conoce.

# Base URL
https://api.nodion.ai/v1

Speech-to-Text

# Transcribe audio
curl https://api.nodion.ai/v1/audio/transcriptions \
  -H "Authorization: Bearer $NODION_API_KEY" \
  -F file=@meeting.mp3 \
  -F model=qwen/qwen3-asr-1.7b

Text-to-Speech

# Generate speech
curl https://api.nodion.ai/v1/audio/speech \
  -H "Authorization: Bearer $NODION_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3-tts-1.7b",
    "input": "Welcome to Nodion, your European AI platform."
  }' \
  --output speech.mp3

Soporta: /v1/audio/transcriptions, /v1/audio/speech. Voz personalizada mediante el parámetro voice. Múltiples formatos de audio.

// por qué es importante
GDPR nativo. Los datos de voz son datos biométricos bajo el GDPR. Nuestra infraestructura garantiza que nunca salgan de la UE. Sin transatlantic transatlánticas. Sin riesgos de decisiones de adecuación.
Energía verde nórdica. Clústeres GPU en Suecia y Finlandia funcionan con energía renovable. El clima frío significa refrigeración natural, menos desperdicio energético, menor huella.
Sin dependencia de EE.UU. Empresa alemana. Servidores en la UE. Modelos open source. Soberanía total sin dependencia de hyperscalers.
Solo open source. Cada modelo que servimos es completamente abierto. Puede inspeccionar los pesos, entender la arquitectura y auditar los resultados.
OpenAI-compatible API. Drop-in replacement. Cambie su URL base y estará procesando voz en infraestructura europea soberana.

¿Listo para empezar?

5 minutos de transcripción y síntesis al mes. Sin tarjeta de crédito.

Crear cuenta gratuita