Lab. U. & A.

UTF-8 (UNICODE)


(SCUSI il tremendo ritardo Prof., ma sono stata sommersa dagli esami in queste settimane...:(( Adesso però posso dedicarmi totalmente al Lab.)Unicode è stila una lista dei caratteri delle lingue del mondo, come i caratteri arabi, latini, russi (come il cirillico), greci, e tutti i caratteri degli altri paesi. È nato dalla necessità di voler scrivere documenti leggibili in ogni paese, indipendentemente dal software utilizzato, ma anche dal voler creare una raccolta dei caratteri di tutto il mondo completa, ai fini della standardizzazione. Unicode, quindi, assegna un numero univoco ad ogni carattere, indipendentemente dalla piattaforma, indipendentemente dall'applicazione, o dalla lingua. Se, ad esempio, voglio rappresentare un carattere in cirillico, che non è, dunque, presente sulla mia tastiera sono costretta a servirmi di un codice che il computer è capace di interpretare come quello specifico carattere.  Bisogna definire, a tale scopo, un metodo che sia completamente universale, che venga decodificato allo stesso modo da tutte le piattaforme, da ogni tipo di software. 4032 può corrispondere, per esempio, ad un determinato carattere greco.  Nello specifico, usando Unicode, bisogna anteporre alla cifra di codice U+, che rappresenta la lista di codice utilizzata. Abbiamo, perciò, delle tabelle di encoding, che esemplificano le accoppiate di codice e caratteri speciali. Determinate combinazioni di numeri da tastiera rappresenteranno i caratteri non presenti sulle nostre tastiere. UTF-8 è un tipo di encoding usato da determinati software, quello maggiormente in uso, attualmente, e Unicode è l’organizzazione che si occupa della standardizzazione dei caratteri.Bisogna, a tale scopo, impostare il charset UTF-8 (il tag meta content-type, content e chaset tipo charset="UTF-8") nella pagina xhtml.Es: .Nelle pagine (x)html sperimentiamo spesso l’uso delle suddette entity per le vocali accentate (“è”=è “ò”=ò “È”=É…), le parentesi acute (< e >) e la stessa e commerciale. La sintassi è, quindi, &nomesimbolo;, dove “nomesimbolo” è, appunto la codifica del carattere speciale in questione.