Skip to main content

Tag Meta Charset: imposta la codifica dei caratteri in HTML5

27: Which HTML Meta Tags Are Required in A Website? | Learn HTML and CSS | HTML Tutorial | HTML SEO (Giugno 2026)

27: Which HTML Meta Tags Are Required in A Website? | Learn HTML and CSS | HTML Tutorial | HTML SEO (Giugno 2026)
Anonim

Prima dell'introduzione di HTML5, impostando la codifica dei caratteri su un documento con un elemento richiesto è possibile scrivere la linea un po 'prolissa vista di seguito. Questo è gli elementi di Meta Charset se stai usando HTML4 nella tua pagina web:

Cosa è importante notare in questo codeare le virgolette che vedi intorno a soddisfare attributo: content = ' text / html; charset = iso-8859-1 ' . Come tutti gli attributi HTML, queste virgolette definiscono il valore dell'attributo, indicando che l'intera stringa text / html; charset = iso-8959-1 è il soddisfare di questo elemento. Questo è l'HTML corretto ed è come questa stringa doveva essere scritta. È anche ingombrante lungo e brutto! Inoltre, non è qualcosa che probabilmente ricorderesti in cima alla tua testa! Nella maggior parte dei casi, gli sviluppatori web dovevano copiare e incollare questo codice da un sito a uno nuovo che stavano sviluppando perché scrivere da zero era chiedere molto.

HTML5 taglia fuori le "cose" extra

HTML5 non solo ha aggiunto un numero di nuovi elementi al linguaggio, ma ha anche notevolmente semplificato gran parte della sintassi dell'HTML, incluso l'elemento Meta Charset. Con HTML5, è possibile aggiungere la codifica dei caratteri con la sintassi molto più facile da ricordare perMETA elemento che vedi qui sotto:

Confronta la sintassi semplificata con ciò che abbiamo scritto all'inizio di questo articolo, la vecchia sintassi utilizzata per HTML4 e vedrai quanto è più semplice scrivere e ricordare la versione HTML5. Invece di dover copiare e incollare questo da un sito esistente a uno nuovo su cui stavi lavorando, questo è assolutamente qualcosa che, come sviluppatore web front-end, potresti ricordare. Questi risparmi di tempo non sono molti, ma se consideri le altre aree di sintassi che HTML5 ha semplificato, i risparmi si sommano!

Includere sempre la codifica dei caratteri

Dovresti sempre includere la codifica dei caratteri per le tue pagine web, anche se non hai mai inteso utilizzare caratteri speciali. Se non si include la codifica dei caratteri, il sito diventa vulnerabile a un attacco di cross site scripting utilizzando UTF-7.

In questo scenario, anattacker vede che il tuo sito non ha codifica dei caratteri definita, quindi induce il browser a pensare che la codifica dei caratteri della pagina sia in realtà UTF-7. Successivamente, l'utente malintenzionato inietta gli script codificati UTF-7 nella pagina Web e il tuo sito viene violato. Ciò è ovviamente problematico per tutte le persone coinvolte, dalla tua azienda ai tuoi visitatori. La buona notizia è che è un semplice problema da evitare: assicurati di aggiungere la codifica dei caratteri a tutte le tue pagine web.

Dove aggiungere la codifica dei caratteri

La codifica dei caratteri per una pagina web dovrebbe essere la prima riga del tuo HTML element.Questo assicura che il browser sappia cosa è la codifica del personaggio prima che faccia qualcos'altro sulla pagina tranne che per determinare il doctype e identificare che si tratta di una pagina HTML. Il codice HTML dovrebbe contenere:

Utilizzo di intestazioni HTTP per maggiore sicurezza

Puoi anche specificare la codifica dei caratteri nelle intestazioni HTTP. Questo è ancora più sicuro che aggiungerlo alla pagina HTML, ma è necessario avere accesso alle configurazioni del server o ai file .htaccess, il che significa che potrebbe essere necessario lavorare con il provider di hosting del tuo sito web per ottenere questo tipo di accesso o farli fare i cambiamenti per te. L'accesso è davvero la sfida qui. Il cambiamento stesso è semplice, quindi qualsiasi provider di hosting dovrebbe essere in grado di apportare questa modifica per il tuo con relativa facilità.

Se si utilizza Apache, è possibile impostare il set di caratteri predefinito per l'intero sito aggiungendo: AddDefaultCharset UTF-8 alla tua radice .htaccess file. Il set di caratteri predefinito di Apache è ISO-8859-1.