61 Transformadores

Los transformadores son un modelo de red neuronal diseñado para superar las limitaciones de las redes neuronales recurrentes en el análisis de secuencias de datos (en nuestro caso, palabras o tokens)1.

Específicamente, los transformadores, a través del mecanismo de autoatención, permiten paralelizar el análisis de secuencias de datos y extraer las dependencias entre los elementos de estas secuencias y los contextos en los que se producen.


  1. Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30. https://papers.nips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf

Licencia

Icono de Licencia Creative Commons Atribución 4.0 Internacional

IA para Profesores: un libro de texto abierto Copyright © 2025 por Colin de la Higuera y Jotsna Iyer se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional, excepto cuando se especifiquen otros términos.

Comparte este libro