IAML Blog


Uno degli articoli scientifici più influenti dell'ultima decade è sicuramente Attention is All You Need.1 Come da titolo, l'obiettivo dell'articolo era semplice: mostrare come una componente delle reti neurali fino a quel momento di nicchia (neural attention, o semplicemente attenzione in questo post) bastava da sola a costruire architetture neurali estremamente sofisticate. La famiglia di modelli così ottenuti, i Transfor…

Continue Reading...


Un mese fa si è conclusa la settima edizione della International Conference on Learning Representations (ICLR), una delle conferenze più prestigiose dedicate al mondo del deep learning. Come ogni edizione, grande interesse hanno destato i best paper award, elogi scelti da un comitato di prestigio per premiare articoli di particolare interesse o dal notevole impatto scientifico tra gli oltre Continue Reading...


Questo articolo passa in rassegna i principali sviluppi nel Natural Language Processing (NLP) relativi ai metodi basati su reti neurali.

Questa panoramica è apparsa per la prima volta su AYLIEN a cura di Sebastian Ruder. La traduzione (autorizzata) è a cura di Luca Palmieri.

Questo articolo è il primo di una serie d…

Continue Reading...


Anche quest'anno ho avuto il piacere di partecipare al Codemotion Milano, sia come membro del program committee per la selezione dei talk, che come speaker per parlare dell'attesissimo TensorFlow.js. Approfitto di questo breve post sul blog per riepilogare alcuni degli spunti principali del talk, dalla motivazione dell'unire reti neurali e Javascript al funzionamento della libreria stessa. Sul web trovate anche le Continue Reading...


Configurare i parametri di un modello di deep learning è sempre un'operazione a metà strada fra l'arte, l'esperienza, e la pura forza bruta di calcolo. In questo tutorial vediamo come utilizzare Hyperopt, una libreria di black-box optimization perfetta per ottimizzare iperparametri di ogni tipo affidandosi alle sue capacità di ricerca. Tra le sue caratteristiche principali, oltre ad essere altamente configurabile ha la possibilità di lanciare più simulazioni in parallelo appoggiandosi a Mongo…

Continue Reading...