Comprendere un LLM 01 - Tokenizzazione ed Embedding

Oggi porto qualche ragionamento sul modo in cui sto strutturando il recente corso sugli LLM che sto portando in piattaforma. Nello specifico parlo del perché ho scelto di iniziare il corso trattando la tokenizzazione e l'embedding. Il corso è disponibile qui: https://learn.esadecimale.it/courses/... Nel minuto 16:19 ho fatto un errore, il prodotto scalare tra u e v è dato dal coseno di theta moltiplicato per la norma di u e la norma di v. Invece io ho scritto diviso norma di u per norma di v. Nelle lezioni del corso non faccio questo errore. Il progetto Esadecimale nasce per offrire il migliore contenitore di didattica informatica presente in tutto il territorio Italiano. Se vuoi supportare la mia missione puoi approfondire il mio progetti tramite i seguenti link: https://esadecimale.it https://learn.esadecimale.it https://cyber.esadecimale.it https://forum.esadecimale.it