Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente Prochaine révision Les deux révisions suivantes | ||
tutoriel:encodage_caracteres [Le 10/11/2012, 18:39] 82.126.198.110 [Résumé,Règles de base] |
tutoriel:encodage_caracteres [Le 04/06/2020, 10:40] 154.126.80.154 [Encodages standards] |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
- | {{tag>encodage utf8 BROUILLON}} | + | {{tag>encodage BROUILLON}} |
---- | ---- | ||
Ligne 31: | Ligne 31: | ||
**Un texte, suite de caractères, n'a de sens que si l'on connaît son encodage.** | **Un texte, suite de caractères, n'a de sens que si l'on connaît son encodage.** | ||
- | - L'encodage par défaut sous Windows (interface graphique) est cp1252. | + | - L'encodage par défaut sous Windows (interface graphique) est [[wpfr>Windows-1252|cp1252]]. |
- L'encodage par défaut d'une console DOS est cp850 pour les systèmes de l'Europe de l'Ouest (Western Europe) ou cp437 pour les États-Unis. | - L'encodage par défaut d'une console DOS est cp850 pour les systèmes de l'Europe de l'Ouest (Western Europe) ou cp437 pour les États-Unis. | ||
- Aucun éditeur n'est capable — et ne le sera jamais — de déterminer l'encodage d'un fichier texte. | - Aucun éditeur n'est capable — et ne le sera jamais — de déterminer l'encodage d'un fichier texte. | ||
- | - Les bonnes applications peuvent travailler indifféremment avec différents encodages (généralement, ce sont ASCII, cp1252, ISO-8859-1 et UTF-8, ISO-8859-15 est moins utilisé) pour les utilisateurs de langues latines et anglo-saxonnes. | + | - Les bonnes applications peuvent travailler indifféremment avec différents encodages (généralement, ce sont ASCII, [[wpfr>Windows-1252|cp1252]], [[wpfr>ISO_8859-1|ISO-8859-1]] et [[wpfr>Unicode|UTF-8]], ISO-8859-15 est moins utilisé) pour les utilisateurs de langues latines et anglo-saxonnes. |
- Du point 4, il découle que les systèmes d'exploitation sont cohérents, les problèmes qui se posent sont généralement dus à une méconnaissance du fonctionnement des encodages. | - Du point 4, il découle que les systèmes d'exploitation sont cohérents, les problèmes qui se posent sont généralement dus à une méconnaissance du fonctionnement des encodages. | ||
- Il est faux de croire qu'il faille changer l'encodage d'un fichier pour passer d'un système à un autre. Si l'échange de fichiers est régulier, il est préférable de régler ses outils de travail (éditeurs, etc.) en conformité avec les-dits fichiers. | - Il est faux de croire qu'il faille changer l'encodage d'un fichier pour passer d'un système à un autre. Si l'échange de fichiers est régulier, il est préférable de régler ses outils de travail (éditeurs, etc.) en conformité avec les-dits fichiers. | ||
Ligne 90: | Ligne 90: | ||
* Windows 98 (FAT32): cp1252 | * Windows 98 (FAT32): cp1252 | ||
* Windows XP (ntfs): cp1252. ?? | * Windows XP (ntfs): cp1252. ?? | ||
+ | * Windows 7 : iso-8859-1 | ||
+ | * et pour Windows 10? | ||
Ligne 120: | Ligne 122: | ||
</code> | </code> | ||
- | Pour s'y retrouver dans les dénominations : une [[http://docs.python.org/lib/standard-encodings.html|table]]. | + | Pour s'y retrouver dans les dénominations : une <del>[[http://docs.python.org/lib/standard-encodings.html|table]]</del>. |
- | + | === Outils de migration === | |
- | ==== Réglage des éditeurs de textes ==== | + | |
- | + | ||
- | La plupart des [[:editeur_de_texte|éditeurs de textes]] sont capables de lire ou écrire dans différents encodages. Il faut trouver l'option d'affichage adéquate (usuellement dans //Outils → Encodage//). | + | |
- | + | ||
- | ==== Cas des partitions de disques ==== | + | |
- | + | ||
- | Pour une [[:partitions|partition]], il faut préciser un encodage pour décrire les **noms de fichiers** (chaque fichier pouvant utiliser des encodages différents). | + | |
- | + | ||
- | Sous GNU/Linux, il faut indiquer l'encodage au montage de la partition (voir [[:mount_fstab|/etc/fstab]]). | + | |
- | + | ||
- | ==== Outils de migration==== | + | |
<note important> | <note important> | ||
Ligne 145: | Ligne 136: | ||
* [[:iconv|iconv]] (commande en ligne, dans le package **convmv** voir https://wiki.ubuntu.com/UTFEightMigrationTool) | * [[:iconv|iconv]] (commande en ligne, dans le package **convmv** voir https://wiki.ubuntu.com/UTFEightMigrationTool) | ||
* l'utilitaire recode : [[http://pwet.fr/man/linux/commandes/recode]], très puissant. | * l'utilitaire recode : [[http://pwet.fr/man/linux/commandes/recode]], très puissant. | ||
+ | |||
+ | |||
+ | ==== Réglage des éditeurs de textes ==== | ||
+ | |||
+ | La plupart des [[:editeur_de_texte|éditeurs de textes]] sont capables de lire ou écrire dans différents encodages. Il faut trouver l'option d'affichage adéquate (usuellement dans //Outils → Encodage//). | ||
+ | |||
+ | ==== Cas des partitions de disques ==== | ||
+ | |||
+ | Pour une [[:partitions|partition]], il faut préciser un encodage pour décrire les **noms de fichiers** (chaque fichier pouvant utiliser des encodages différents). | ||
+ | |||
+ | Sous GNU/Linux, il faut indiquer l'encodage au montage de la partition (voir [[:mount_fstab|/etc/fstab]]). | ||
+ | |||
===== Liens utiles ===== | ===== Liens utiles ===== | ||
Ligne 150: | Ligne 153: | ||
* [[http://www.joelonsoftware.com/articles/Unicode.html|The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)]] **(en)** | * [[http://www.joelonsoftware.com/articles/Unicode.html|The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)]] **(en)** | ||
+ | * [[http://french.joelonsoftware.com/Articles/Unicode.html|Le minimum absolu que tout développeur doit absolument, positivement savoir sur Unicode et les jeux de caractères (aucune excuse !)]] **(fr)** | ||
* [[https://wiki.ubuntu.com/UTFEightMigrationTool|UTFEightMigrationTool]] **(en)** | * [[https://wiki.ubuntu.com/UTFEightMigrationTool|UTFEightMigrationTool]] **(en)** | ||
* [[wp>Character_encoding]] **(en)** | * [[wp>Character_encoding]] **(en)** | ||
* [[wpfr>Codage_de_caractères]] **(fr)** | * [[wpfr>Codage_de_caractères]] **(fr)** | ||
+ | * [[http://www.windowslinux.net/encodage| un article clair sur l'encodage sur le site windowslinux.net]] | ||
+ | * [[http://www.pigné.be/Thibaut/cours/LeWeb/mini_cours_html/codage.htm#lettres26plus16| Les 84 caractères de l'alphabet français]] | ||
==== Description d'encodages particuliers ==== | ==== Description d'encodages particuliers ==== | ||
Ligne 167: | Ligne 173: | ||
---- | ---- | ||
- | //Contributeurs principaux : [[:utilisateurs:fnx]], [[:utilisateurs:Rom]], [[:utilisateurs:aleph]].// | + | //Contributeurs principaux : [[:utilisateurs:fnx]], [[:utilisateurs:Rom]], [[:utilisateurs:aleph]], [[:utilisateurs:bcag2]].// |