En los últimos años, nos hemos enfrentado a un tsunami de inteligencia artificial generativa que genera texto, imágenes, vídeos e incluso sonidos. Las imágenes y los vídeos son cada vez más realistas, y en parte se debe a los modelos de difusión. Estos han cobrado relevancia gracias a su capacidad para generar imágenes extremadamente realistas. Actualmente, diversas herramientas como ChatGPT y Gemini permiten generar imágenes mediante modelos de difusión.
Curiosamente, los modelos de difusión están estrechamente vinculados a los conceptos matemáticos y físicos de caos y ruido. Incluso el propio nombre se relaciona con las primeras ideas sobre las ecuaciones de difusión en física. Los modelos aprenden de datos ruidosos y aplican ecuaciones de difusión, además de procesos estocásticos,