W3C: nuova recommendation per il Web
La Recommendation fornisce agli autori delle specifiche ed agli sviluppatori di software e contenuti una referenza architetturale comune, permettendo l'interoperabilità nella manipolazione di testi sul Web.
Il documento tratta il modo di utilizzo dei termini 'character', 'encoding' e 'string', il modello di riferimento per l' elaborazione, la scelta e l' identificazione della codifica dei caratteri, i meccanismi di escaping e di indicizzazione delle stringhe.
L'obiettivo del Character Model per il World Wide Web è facilitare l'utilizzo del Web a tutti gli utenti, indipendentemente dalla loro lingua, dal sistema di scrittura e dalle convenzioni culturali, in pieno accordo con uno dei principali obiettivi del W3C, l'accesso universale.
W3C ha adottato Unicode come document character set per HTML a partire dalla versione HTML 4.0. Lo stesso tipo di approccio è stato seguito più tardi per altre Recommendation quali XML 1.0 e CSS 2. Le specifiche e le applicazioni W3C, adesso, utilizzano Unicode come reference character set standard.
Il modello permette alle tecnologie Web di supportare testo in tutte le lingue del mondo (e su diversi tipi di piattaforma) e ne permette lo scambio, la consultazione e la ricerca via Web da parte di tutti gli utenti del mondo. Unicode è stato scelto in quanto permette di referenziare i caratteri indipendentemente dalla codifica del testo ed inoltre è continuamente aggiornato, largamente accettato ed implementato nei settori industriali.
La serie di documenti tratta degli aspetti particolari del Web, quali:
- Scelta del tipo di codifica Unicode (UTF-8, UTF-16, UTF-32)
- Conteggio del numero di caratteri, misura della lunghezza di una stringa in presenza di codifiche di lunghezza variabile e combinazioni di caratteri
- Codifica di carateri ridondanti
- Uso dei meccanismi di escape per la rappresentazione di caratteri
Maggiori informazioni sul sito del W3C







