Skip to content

Manque de clarté entre unicode le standard et les différents encodages #82

@nwolff

Description

@nwolff

## Standard UTF
Le [standard Unicode](https://home.unicode.org/) UTF (Universal Character Set Transformation Format)
s'est imposé pour l'échange, car il permet d'agréger sur 8 bits, 16 bits ou 32 bits par caractère la totalité des caractères utilisés dans toutes les langues humaines… et même extraterrestres,
puisque le [Klingon](https://www.kli.org/about-klingon/klingon-history/) est également intégré.
Les caractères liés à l'édition des partitions de musique ou les émojis sont également intégrés.
### Variantes
Pour éviter de consommer 32 bits par caractère, des variantes plus compactes
ont été mises à disposition.
La plus connue – des européens, puisqu'elle regroupe les caractères qui nous concernent – est la [table UTF-8](https://www.utf8-chartable.de/). Elle se concentre sur les premiers 8 bits de la table UTF complète.

A mon avis il serait mieux d'expliquer d'abord unicode (sans parler des encodages), puis introduire clairement les différents encodages.
Par exemple la phrase "la table utf8 se concentre sur les premiers 8 bits de la table UTF complète" pourrait prêter à confusion

Je n'ai pas encore vraiment contribué à modulo, si vous me donnez le feu vert je ferais une petite pull-request pour cette petite partie de chapitre.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions