Presentaciones con IA: el workflow que transforma la manera de explicar contenido
Crear presentaciones visuales de calidad para acompañar videos explicativos puede marcar una enorme diferencia en la manera en que el público asimila la información. Gracias a los agentes de código basados en inteligencia artificial, hoy es posible generar diapositivas limpias, bien estructuradas y visualmente atractivas en cuestión de minutos, sin necesidad de herramientas de diseño complejas. En este artículo se detalla exactamente cómo lograrlo usando Mistral como modelo de IA, una skill personalizada y un servicio de generación de imágenes de bajo costo.
¿Por qué usar Mistral como agente de código?
Mistral es un modelo de inteligencia artificial desarrollado por una empresa francesa que, aunque no recibe tanta atención mediática como otros modelos de frontera, ofrece un rendimiento sobresaliente para tareas de generación de código y contenido estructurado. Algunas razones para considerarlo:
- Suscripción de larga duración: ideal para quienes buscan consistencia y no quieren estar cambiando de plataforma constantemente.
- Accesible para principiantes: su curva de aprendizaje es más amigable que la de modelos como Claude o Codex.
- Excelente para tareas de código: especialmente para generar HTML estructurado, que es la base de este flujo de presentaciones.
El entorno de trabajo utilizado es Visual Studio Code, donde se integra el agente de Mistral (conocido como Devstral) para ejecutar la skill de creación de presentaciones de manera directa desde el editor.
La skill de presentaciones: cómo funciona por dentro
La pieza central de este flujo es una skill personalizada, es decir, un conjunto de instrucciones que le indica al agente exactamente cómo construir las presentaciones. Su funcionamiento sigue una lógica clara:
- El agente realiza una búsqueda del tema solicitado para obtener información actualizada.
- Propone un plan de acción o, en muchos casos, comienza directamente la generación.
- Produce el resultado en HTML puro, listo para visualizarse en el navegador.
- Identifica los slides que requieren imágenes y genera los prompts correspondientes para cada una.
Estilos visuales disponibles
La skill ofrece al menos dos estilos visuales predefinidos entre los que el usuario puede elegir:
- Estilo 1 – Pergamino vintage: tonos cálidos, tipografía elegante y detalles que evocan documentos históricos. Es el estilo preferido por su calidez visual y legibilidad.
- Estilo 2 – Blueprint técnico: estética de plano técnico, ideal para temas de ingeniería o arquitectura de sistemas.
Una vez seleccionado el estilo, el agente genera la estructura completa de la presentación de forma autónoma, aceptando solo algunas confirmaciones de comandos por parte del usuario durante el proceso.
Generación automática de imágenes con KieAPI
Una de las funcionalidades más destacadas de este flujo es la integración con KeyAPI (también conocida como KeyEye), un servicio de generación de imágenes mediante inteligencia artificial que se distingue por ser uno de los más económicos del mercado. Sus características principales son:
- Acceso a modelos de generación de imagen de primer nivel, como GPT-Image 2.0 o modelos equivalentes.
- Coste de apenas 6 tokens por imagen generada, lo que equivale a poder crear decenas de imágenes de alta calidad por solo 5 dólares (equivalente a 1000 tokens).
- Soporte para múltiples proveedores y modelos de frontera, incluyendo opciones de texto, video y código.
Dentro del flujo, el agente detecta automáticamente qué slides necesitan imágenes y genera prompts detallados para cada una. Por ejemplo, para una presentación sobre el modelo Minimax M2, los prompts incluyen descripciones como «diagrama técnico de red neuronal con ocho módulos expertos, líneas de conexión en naranja» o «visualización futurista de flujo de datos, ríos de tokens brillantes entre racks de servidores».

Ejemplo real: presentación del modelo Minimax M2
Para ilustrar el resultado final, se generó una presentación completa sobre el modelo de IA Minimax M2, el modelo open-weight más potente con 230 mil millones de parámetros (con 10 mil millones activos por token). Algunos elementos destacados del resultado:
- Diseño limpio y centrado: la información aparece estructurada en el centro de cada slide, con elementos visuales que conectan ideas mediante líneas animadas y efectos de aparición progresiva.
- Datos técnicos bien presentados: arquitectura Mixture of Experts (MoE), eficiencia del 4.3% de parámetros activos por token, ventana de contexto de 4 millones de tokens y benchmarks de ingeniería de software.
- Referencias visuales contextuales: iconografía que refuerza conceptos abstractos, como iconos de corazón, árbol o montañas para ilustrar la eficiencia energética del modelo.
- Estilo coherente y profesional: el estilo pergamino aporta calidez sin sacrificar claridad informativa.
El resultado es una presentación que no solo es visualmente atractiva, sino que transmite información compleja de manera clara y ordenada, lo que facilita enormemente la comunicación en videos educativos o explicativos.
Personalización: qué se puede y qué no se recomienda cambiar
Una vez generada la presentación base, el usuario tiene amplia libertad para personalizarla. Sin embargo, hay algunas recomendaciones importantes:
Elementos que se pueden modificar libremente
- Colores y paleta visual
- Tipografía y tamaño de fuentes
- Imágenes y sus prompts
- Animaciones, como el efecto de línea titilante que conecta ideas
- Formato de aspecto: horizontal (16:9) o vertical (9:16) según el canal de distribución
Qué no se recomienda alterar
- La estructura de flujo de información: el orden y jerarquía en que se presentan los datos está diseñado para maximizar la comprensión del espectador.
Conclusión
Este flujo de trabajo demuestra que es posible producir presentaciones de alto impacto visual con herramientas de IA accesibles y económicas. La combinación de Mistral como agente de código, una skill personalizada con instrucciones precisas y la generación de imágenes a través de KeyAPI ofrece un sistema replicable y adaptable a cualquier tipo de contenido. Si buscas mejorar la calidad visual de tus explicaciones y transmitir ideas complejas de forma más clara, este workflow representa una solución práctica, escalable y sorprendentemente económica.

Leave a Reply