|
## Standard UTF |
|
|
|
Le [standard Unicode](https://home.unicode.org/) UTF (Universal Character Set Transformation Format) |
|
s'est imposé pour l'échange, car il permet d'agréger sur 8 bits, 16 bits ou 32 bits par caractère la totalité des caractères utilisés dans toutes les langues humaines… et même extraterrestres, |
|
puisque le [Klingon](https://www.kli.org/about-klingon/klingon-history/) est également intégré. |
|
|
|
Les caractères liés à l'édition des partitions de musique ou les émojis sont également intégrés. |
|
|
|
### Variantes |
|
|
|
Pour éviter de consommer 32 bits par caractère, des variantes plus compactes |
|
ont été mises à disposition. |
|
|
|
La plus connue – des européens, puisqu'elle regroupe les caractères qui nous concernent – est la [table UTF-8](https://www.utf8-chartable.de/). Elle se concentre sur les premiers 8 bits de la table UTF complète. |
A mon avis il serait mieux d'expliquer d'abord unicode (sans parler des encodages), puis introduire clairement les différents encodages.
Par exemple la phrase "la table utf8 se concentre sur les premiers 8 bits de la table UTF complète" pourrait prêter à confusion
Je n'ai pas encore vraiment contribué à modulo, si vous me donnez le feu vert je ferais une petite pull-request pour cette petite partie de chapitre.
book/src/appr/rep-info/caracteres.md
Lines 164 to 177 in 009ff90
A mon avis il serait mieux d'expliquer d'abord unicode (sans parler des encodages), puis introduire clairement les différents encodages.
Par exemple la phrase "la table utf8 se concentre sur les premiers 8 bits de la table UTF complète" pourrait prêter à confusion
Je n'ai pas encore vraiment contribué à modulo, si vous me donnez le feu vert je ferais une petite pull-request pour cette petite partie de chapitre.