Desarrollo agentes de IA y sistemas RAG en Naturgy, y mantengo un homelab con 14 servicios self-hosted. Me muevo igual de cómodo en un modelo de deep learning que en la red que lo sirve.
Soy Daniel Grao, ingeniero informático afincado en Barcelona. Trabajo como AI & Automations Engineer en Naturgy, donde desarrollo agentes de IA, sistemas RAG y automatizaciones que conectan herramientas internas con procesos de negocio reales.
Me gusta entender los sistemas completos, del deep learning y los Vision Transformers al kernel, la red y el deployment. Mi TFG fue un OCR de escritura manuscrita en catalán. En casa mantengo un homelab en Proxmox VE con 14 servicios en producción.
He trabajado en España, Francia e Irlanda, de la I+D en STMicroelectronics al desarrollo web a cliente. Hablo cuatro idiomas y se me da bien el punto donde se cruzan IA, infraestructura y automatización.
De la I+D internacional al desarrollo de IA en producción. Cuatro países, múltiples roles.
Desde investigación en deep learning hasta apps móviles e infraestructura 24/7. Una selección de proyectos académicos, profesionales y personales.
Las fuentes sintéticas no se parecen a la letra real de un niño, así que entrené VATr (Visual Analogies for Text Rendering), una GAN que, a partir de unas pocas muestras de un alumno, genera líneas nuevas imitando su mismo estilo de escritura. Con ello se sintetiza vocabulario catalán que parece escrito a mano por un niño, cerrando el salto entre los datos sintéticos y los cuadernos reales de clase. Probé 20 configuraciones (3 checkpoints × 4 ratios sintético:real): el checkpoint temprano ep100 a ratio 2.5:1 dio el mejor resultado del proyecto, 1.69% CER. Los checkpoints tardíos empeoraban por mode collapse de la GAN.
Etiqueté a mano 215 cuadernos de alumnos reales en Unitlab.ai: bounding boxes a nivel de línea y transcripción de cada una. La exportación COCO se convierte a Parquet con un pipeline propio (tratadoCOCO) que produce 5.467 line crops normalizados a 128 px, publicados en HuggingFace 🤗 como CatK12HW-actions, el primer corpus HTR K-12 en catalán. En total, más de 120 horas entre recolección, anotación, generación de datos y entrenamiento.
→ Ver en HuggingFace
Stika
Universe
Riscada
Friendly











Datos en tiempo real desde la API de GitHub. Código abierto, datasets y experimentos.
Tecnologías que uso en el día a día, de la IA al metal.
Abierto a nuevas oportunidades y colaboraciones. Si quieres hablar de IA, infraestructura o automatización, escríbeme.