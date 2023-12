Der Transformer ist ein Modelltyp, der ursprünglich in dem 2017 veröffentlichten Paper "Attention Is All You Need" von Forschern bei Google vorgestellt wurde. Dieses Modell revolutionierte die Art und Weise, wie Algorithmen Sequenzen, insbesondere Text, verarbeiten. Im Gegensatz zu seinen Vorgängern, den rekurrenten neuronalen Netzwerken (RNNs) und den Long Short-Term Memory-Netzwerken (LSTMs), verzichtet der Transformer vollständig auf rekurrente Strukturen und setzt stattdessen auf eine Architektur, die auf einem Mechanismus namens "Attention" basiert.