Transformadores

Colin de la Higuera; Jotsna Iyer

61 Transformadores

Los transformadores son un modelo de red neuronal diseñado para superar las limitaciones de las redes neuronales recurrentes en el análisis de secuencias de datos (en nuestro caso, palabras o tokens)¹.

Específicamente, los transformadores, a través del mecanismo de autoatención, permiten paralelizar el análisis de secuencias de datos y extraer las dependencias entre los elementos de estas secuencias y los contextos en los que se producen.

Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, Ł., & Polosukhin, I. (2017). Attention is all you need. Advances in Neural Information Processing Systems, 30. https://papers.nips.cc/paper_files/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf

Licencia

Icono de Licencia Creative Commons Atribución 4.0 Internacional

IA para Profesores: un libro de texto abierto Copyright © 2025 por Colin de la Higuera y Jotsna Iyer se distribuye bajo una Licencia Creative Commons Atribución 4.0 Internacional, excepto cuando se especifiquen otros términos.

Licencia

Comparte este libro