Desarrollo agentes de IA y sistemas RAG en Naturgy, y tengo experiencia montando y manteniendo infraestructura self-hosted. Me muevo igual de cómodo en un modelo de deep learning que en la red que lo sirve.
Soy Daniel Grao, ingeniero informático afincado en Barcelona. Trabajo como AI Engineer en Naturgy, donde desarrollo agentes de IA, sistemas RAG y automatizaciones que conectan herramientas internas con procesos de negocio reales.
Me gusta entender los sistemas completos, del deep learning y los Vision Transformers al kernel, la red y el deployment. Mi TFG fue un OCR de escritura manuscrita en catalán. En casa mantengo un homelab self-hosted en Proxmox VE en producción.
He trabajado en España, Francia e Irlanda, de la I+D en STMicroelectronics al desarrollo web a cliente. Hablo cuatro idiomas y se me da bien el punto donde se cruzan IA, infraestructura y automatización.
De la I+D internacional al desarrollo de IA en producción. Cuatro países, múltiples roles.
Proyectos de IA, speech-to-text y automatización desarrollados en Naturgy. Detalle resumido por confidencialidad.
Momentos con el equipo de Naturgy.





Proyectos personales y académicos: de investigación en deep learning a apps móviles e infraestructura self-hosted.
Las fuentes sintéticas no se parecen a la letra real de un niño, así que entrené VATr (Visual Analogies for Text Rendering), una GAN que, a partir de unas pocas muestras de un alumno, genera líneas nuevas imitando su mismo estilo de escritura. Con ello se sintetiza vocabulario catalán que parece escrito a mano por un niño, cerrando el salto entre los datos sintéticos y los cuadernos reales de clase. Probé 20 configuraciones (3 checkpoints × 4 ratios sintético:real): el checkpoint temprano ep100 a ratio 2.5:1 dio el mejor resultado del proyecto, 1.69% CER. Los checkpoints tardíos empeoraban por mode collapse de la GAN.
Etiqueté a mano 215 cuadernos de alumnos reales en Unitlab.ai: bounding boxes a nivel de línea y transcripción de cada una. La exportación COCO se convierte a Parquet con un pipeline propio (tratadoCOCO) que produce 5.467 line crops normalizados a 128 px, publicados en HuggingFace 🤗 como CatK12HW-actions, el primer corpus HTR K-12 en catalán. En total, más de 120 horas entre recolección, anotación, generación de datos y entrenamiento.
→ Ver en HuggingFace
Stika
Universe
Riscada
Friendly











Tecnologías que uso en el día a día, de la IA al metal.
Abierto a nuevas oportunidades y colaboraciones. Si quieres hablar de IA, infraestructura o automatización, escríbeme.