What speech models does Nodion.ai offer?

Nodion.ai ofrece la familia Qwen3 ASR para speech-to-text (0.6B y 1.7B parámetros) y la familia Qwen3 TTS para text-to-speech (0.6B y 1.7B parámetros), incluyendo clonación de voz personalizada. Todos los modelos son open source.

Is the Nodion.ai Speech API GDPR-compliant?

Yes. Like all Nodion.ai services, the Speech API runs entirely on EU-based GPU infrastructure in Sweden and Finland. No data leaves the EU. Operated by Nodion GmbH, a German company. This is especially important for voice data, which is biometric data under GDPR.

What is custom voice cloning?

Custom voice cloning allows you to create a synthetic voice that sounds like a specific speaker. Upload a short audio reference and the model will generate speech in that voice. All voice data stays on EU infrastructure.

What languages are supported?

Qwen3 ASR and TTS models support multiple languages including English, German, French, Spanish, Chinese, Japanese, Korean, and many more. Ideal for multilingual European businesses.

Inference Embeddings Rerank Images Speech Guard

IA Speech-to-Text &
Text-to-Speech,
hecho para Europa.

Sede en Alemania 100% residencia de datos en la UE

Transcribe audio and generate speech on European GPUs.
Open-source models with custom voice cloning.
Your voice data never leaves the EU.

Crear cuenta gratuita 5 min/mes gratis

// modelos + precios

Modelos de voz

Ejecutamos las familias de modelos Qwen3 ASR y TTS para reconocimiento y síntesis de voz. Multilingüe, pesos abiertos y optimizados para cargas de trabajo de producción. Clonación de voz personalizada incluida.

Todos los modelos funcionan en chips Blackwell modernos o más recientes para un rendimiento ideal. Plan gratuito incluido en todos los modelos.

Qwen

Speech-to-Text

Qwen3-ASR-0.6B

Transcripción rápida y ligera. Ideal para cargas de alto rendimiento o en tiempo real.

0,006 € / minute Próximamente

Parameters0.6B

TaskSpeech-to-Text

LanguagesMultilingual

Pricing0,006 € / min

Qwen3-ASR-1.7B

Mayor precisión para audio complejo. Ideal para reuniones, llamadas y entornos ruidosos.

0,01 € / minute Próximamente

Parameters1.7B

TaskSpeech-to-Text

LanguagesMultilingual

Pricing0,01 € / min

Text-to-Speech

Qwen3-TTS-0.6B

Síntesis de voz rápida con entonación natural. Ideal para notificaciones y contenido breve.

0,015 € / 1K characters Próximamente

Parameters0.6B

TaskText-to-Speech

Custom VoiceYes

Pricing0,015 € / 1K chars

Qwen3-TTS-1.7B

Síntesis de calidad premium. Voz expresiva y natural para audiolibros, asistentes y contenido orientado al cliente.

0,020 € / 1K characters Próximamente

Parameters1.7B

TaskText-to-Speech

Custom VoiceYes

Pricing0,020 € / 1K chars

Plan gratuito

5 min de transcripción y síntesis/mes Sin tarjeta de crédito

Clonación de voz personalizada

Cree una voz sintética que suene como un hablante específico. Proporcione una referencia de audio corta y el modelo TTS generará nuevo discurso con esa voz. Ideal para voces de marca, asistentes virtuales o contenido personalizado.

Funciona con ambos modelos TTS. Sin necesidad de fine-tuning. Incluido sin coste adicional en cada llamada API TTS.

1. Suba una muestra de audio corta (se recomiendan 10+ segundos)
2. Haga referencia a la voz en sus llamadas API TTS
3. Genere voz con esa voz a partir de cualquier texto

Todos los datos de voz permanecen en infraestructura de la UE. No se almacenan datos de voz después del procesamiento a menos que cree explícitamente un perfil de voz guardado.

// qué puede construir

Casos de uso

Speech APIs enable a wide range of applications. From transcription pipelines to voice-enabled products.

Transcripción de reuniones y llamadas

Transcriba reuniones, llamadas y entrevistas en tiempo real o desde grabaciones. Soporte multilingüe para equipos europeos que trabajan en varios idiomas.

Asistentes de voz y chatbots

Combine speech-to-text y text-to-speech para asistentes IA completamente habilitados por voz. Procese el habla del usuario, genere una respuesta y pronunciéla.

Narración de contenido

Convierta artículos, documentación o contenido e-learning en audio con sonido natural. Use voces personalizadas para una identidad de marca consistente.

Accesibilidad

Haga su aplicación accesible con text-to-speech para usuarios con discapacidad visual y speech-to-text para usuarios con discapacidad auditiva. Compatible con GDPR por defecto.

// para equipos que necesitan más

¿Necesita más? El plan Business cubre todos los productos Nodion.ai: Inference, Embeddings, Images, Speech y más. 500 €/mes, capacidad GPU dedicada, 99.5% SLA.

Ver plan Business →

// primeros pasos

Documentación API

La API de voz sigue el formato de la API de Audio de OpenAI. Use los mismos endpoints y SDKs que ya conoce.

            # Base URL

            https://api.nodion.ai/v1

Speech-to-Text

            # Transcribe audio

            curl https://api.nodion.ai/v1/audio/transcriptions \

              -H "Authorization: Bearer $NODION_API_KEY" \

              -F file=@meeting.mp3 \

              -F model=qwen/qwen3-asr-1.7b

Text-to-Speech

            # Generate speech

            curl https://api.nodion.ai/v1/audio/speech \

              -H "Authorization: Bearer $NODION_API_KEY" \

              -H "Content-Type: application/json" \

              -d '{

                "model": "qwen/qwen3-tts-1.7b",

                "input": "Welcome to Nodion, your European AI platform."

              }' \

              --output speech.mp3

Soporta: /v1/audio/transcriptions, /v1/audio/speech. Voz personalizada mediante el parámetro voice. Múltiples formatos de audio.

// por qué es importante

GDPR nativo. Los datos de voz son datos biométricos bajo el GDPR. Nuestra infraestructura garantiza que nunca salgan de la UE. Sin transatlantic transatlánticas. Sin riesgos de decisiones de adecuación.

Energía verde nórdica. Clústeres GPU en Suecia y Finlandia funcionan con energía renovable. El clima frío significa refrigeración natural, menos desperdicio energético, menor huella.

Sin dependencia de EE.UU. Empresa alemana. Servidores en la UE. Modelos open source. Soberanía total sin dependencia de hyperscalers.

Solo open source. Cada modelo que servimos es completamente abierto. Puede inspeccionar los pesos, entender la arquitectura y auditar los resultados.

OpenAI-compatible API. Drop-in replacement. Cambie su URL base y estará procesando voz en infraestructura europea soberana.

¿Listo para empezar?

5 minutos de transcripción y síntesis al mes. Sin tarjeta de crédito.

Crear cuenta gratuita

IA Speech-to-Text &Text-to-Speech,hecho para Europa.

Modelos de voz

Casos de uso

Documentación API

Speech-to-Text

Text-to-Speech

¿Listo para empezar?

IA Speech-to-Text &
Text-to-Speech,
hecho para Europa.