IA – Caso #1. Piérdele el miedo
Este caso quiere mostrar cómo la Inteligencia Artifical nos permite «ser» y «Hacer» aquello que no somos o no sabemos hacer. De manera rápida y profesional.
No hay que preocuparse por no saber programar o no ser un tecnólogo. Sólo hay que preocuparse si «no sabéis preguntar», «o no queréis aprender», «o no sois capaces de reflexionar y pensar»: si estáis en cualquiera de estas tres situaciones
Objetivo: construir una página web (no quiero programar nada), que sea capaz de capturar mi voz, transcribirla en texto, que luego lo pueda guardar, editar, etc… No quiero tener que colgar nada ni configurar nada en ningún servidor, etc…
Técnica: Copilot Chat, con prompts enlazados tras prueba y error hasta conseguir el resultado deseado
1er Prompt
Quiero que me generes una página web, que funcione en local (no colgar nada en ningún servidor) que sea capaz de capturar mi voz y transcribirla. La quiero para poder dictar prompts/emails/empezar a redactar contenidos y luego poderlos depurar. La página tiene que tener un selector de idioma, luego que presente una tabla para poder identificar bloques en la conversación (que muestre una tabla con 3 campos: nombre del bloque, palabra de inicio y palabra de fin de bloque; un campo para eliminar bloque y un botón para añadir nuevos bloques). Después en la página un botón para Empezar a Grabar. Otro para detener la grabación. Un tercero para Mostrar texto otro para copiar y otro para guardar el audio. Al final de la página, después de los botones un cuadro en el que aparezca el texto (y los bloques si se han definido).
Respuesta Copilot-chat:
Aquí tienes la página web que solicitaste, diseñada para funcionar en local sin necesidad de servidor. Permite:
- Capturar y transcribir voz con reconocimiento de idioma.
- Definir bloques de conversación en una tabla editable.
- Controlar la grabación (empezar, detener, mostrar texto, copiar, guardar audio).
- Visualizar el texto transcrito junto con los bloques definidos.
¿Cómo usarla?
- Abre el archivo en tu navegador (doble clic o arrastrar al navegador).
- Selecciona el idioma en el desplegable.
- Define bloques si lo deseas (nombre, palabra de inicio y fin).
- Pulsa “Empezar a Grabar” para iniciar la transcripción.
- Pulsa “Detener Grabación” para finalizar.
- Usa los botones para mostrar el texto, copiarlo o guardar el audio.
¿Quieres que te prepare una versión con estilos más avanzados o funcionalidades adicionales como exportar los bloques a CSV o guardar el texto en archivo?
2º prompt: La indicación Perfecto. Ahora genera la página dándole un formato profesional.
3er prompt: He probado la página. La apariencia perfecta pero quiero que el botón de Detener, Mostrar texto, copiar texto y guardar audio queden desactivados hasta que no haya grabación. También he visto que cuando transcurren segundos sin hablar se borra el contenido. No se debe borrar. El contenido se va agregando hasta que se pulsa detener grabación.
4º prompt: Parece que al acumular el texto se produce algún problema. Fíjate en el siguiente texto capturado como se repiten palabras de manera incorrecta «empezandoempezando laempezando la pruebaempezando la prueba deempezando la prueba de grabaciónEmpezando la prueba de grabación.empezando laempezando la prueba delempezando la prueba de grabaciónEmpezando la prueba de grabación.pareceParece que.va ava repitiendo¿Va repitiendo?sisi hablosi hablo sinsi hablo sin pararsi hablo sin parar unasi hablo sin parar una frasesi hablo sin parar una frase losi hablo sin parar una frase lo hace consi hablo sin parar una frase lo hace correctoSi hablo sin parar una frase, lo hace correcto.». Mejor que no muestres lo que se va capturando y en el cuadro de texto sólo pongas la palabra «Capturando voz…» mientras se está en modo grabación. Cuando finaliza la grabación muestra «Finalizada grabación de vos…» y sólo se muestre el texto capturado cuando se pulse el botón Mostrar texto
5º prompt: Parece que funciona bien. Lo probaré en profundidad. Unos últimos ajustes: desactiva los botones «Empezar a grabar», «Mostrar texto», «copiar texto» y «Guardar audio» cuando se está en grabación (es decir, justo después de pulsar el botón de «Empezar a grabar»). Y al revés, cuando se pulsa «Detener Grabación» se reactivan todos los botones menos el de «Detener Grabación». Por defecto, si no hay grabación sólo debe estar activo el botón de «Empezar a grabar». Luego, abre un diálogo para escoger el nombre del archivo de audio. Por último añade al final de la página un resumen descriptivo del funcionamiento de la página. Añade también el límite máximo de minutos de grabación.
6º prompt: Ya por abusar, un último ajuste: los bloques muestralos separados, en cajas de texto separadas, una para cada bloque.
7º prompt: Con los bloques nos hemos complicado: la edición de bloques ya estaba bien. déjala como en la versión anterior. Solo quiero que cuando le demos al botón de Mostrar Texto: muestre el contenido de voz capturado global en una caja de texto. Y luego añadas tantas cajas como bloques identificados.
He eliminado deliberadamente la respuesta de copilot entre el 2º y el 7º Prompt. El resultado final lo podéis descargar.
Resultado
Nota: tenéis que guardar el archivo en vuestro disco local y ejecutarlo desde el explorardor de windows o similar para que funcione.