DokuWiki

It's better when it's simple

Outils pour utilisateurs

Outils du site


fr:utf-8

Codage UTF-8

DokuWiki stocke toutes ses données en UTF-8. Pour éviter les problèmes, les noms des fichiers de données s’encodent eux-mêmes en utilisant la fonction urlencode quand ils sont sauvegardés. Les anciennes versions de DokuWiki utilisaient un encodage différent et donc les fichiers de données doivent être ré-encodés quand le logiciel est mis à jour. Le changement dans un autre jeu de caractères que l’UTF-8 n’est pas supporté.

Configuration des navigateurs pour l’UTF-8

Tous les navigateurs modernes acceptent les pages encodées en UTF-8 – c’est une des choses qui fonctionne actuellement correctement avec beaucoup de navigateurs. Si votre navigateur n’affiche pas correctement certains caractères, il vous manque probablement les polices Unicode adaptées.

Les utilisateurs de Windows doivent installer la police Arialuni.TTF de Microsoft. Elle est comprise dans la suite Microsoft Office ou peut être téléchargée sur internet (par exemple ici).

Les utilisateurs Debian peuvent lire une page sur les polices (anglais) pour apprendre comment installer une police Unicode correctement.

Edition des fichiers

Save without a BOM in Notepad 2

Si votre intention est d’éditer directement les fichiers de données ou de créer une traduction, vous aurez besoin d’un éditeur compatible UTF-8. Il y a beaucoup d’éditeurs qui conviennent pour cela, nous souhaitons juste vous en recommander deux, si vous avez besoin de l’un d’eux ils sont libres 1).

  • TEA – Un éditeur pour GNU/Linux basé sur GTK2
  • Notepad2 – un excellent remplaçant du « Bloc notes » de Windows

Veuillez noter : DokuWiki n’utilise pas la marque de boutianité (BOM, pour Byte Order Mark) aussi vous devez être certain que votre éditeur ne l’utilise pas non plus (notamment en éditant du PHP et des fichiers de configuration).

Traitement en lot d'encodage de fichiers

  • Sur Unix-like, utiliser http://www.gnu.org/software/libiconv/
  • Sur Winodws utiliser recode, un portage de iconv: http://recode.progiciels-bpi.ca/archives
    • Exemple d'une simple conversion pour un ordinateur local français
      recode lat1..u8 test.txt

      avec latI comme jeu de caractères source et “ u8 ” le jeu de caractères de conversion pour UTF-8.

    • Pour traiter la conversion sur Windows utiliser ceci (conversion de tous les fichiers des sous-répertoires )
      FOR /F "tokens=*" %%G IN ('dir/b/S/X ^"C:\yourpath\*.txt^"') DO recode -v lat1..u8 %%~sG

Exemples

Voici quelques exemples de caractères UTF-8 pour tester votre navigateur 2).

Signes du Zodiac: ♈ ♉ ♊ ♋ ♌ ♍ ♎ ♏ ♐ ♑ ♒ ♓

Un jeu d'échec :

A B C D E F G H
8
7
6
5
4
3
2
1

Russe (по-русски) :

По оживлённым берегам
Громады стройные теснятся
Дворцов и башен; корабли
Толпой со всех концов земли
К богатым пристаням стремятся;

Grec Antique :

Ἰοὺ ἰού· τὰ πάντʼ ἂν ἐξήκοι σαφῆ.
Ὦ φῶς, τελευταῖόν σε προσϐλέψαιμι νῦν,
ὅστις πέφασμαι φύς τʼ ἀφʼ ὧν οὐ χρῆν, ξὺν οἷς τʼ
οὐ χρῆν ὁμιλῶν, οὕς τέ μʼ οὐκ ἔδει κτανών.

Sanskrit :

पशुपतिरपि तान्यहानि कृच्छ्राद्
अगमयदद्रिसुतासमागमोत्कः ।
कमपरमवशं न विप्रकुर्युर्
विभुमपि तं यदमी स्पृशन्ति भावाः ॥

Hindi:

गूगल समाचार हिन्दी में 

Coréen :

한글은 아름다운 우리글입니다.
곱고 아름답게 사용하는 것이 우리의 의무입니다.

Traditional Chinese:

子曰:「學而時習之,不亦說乎?有朋自遠方來,不亦樂乎?
人不知而不慍,不亦君子乎?」

有子曰:「其為人也孝弟,而好犯上者,鮮矣;
不好犯上,而好作亂者,未之有也。君子務本,本立而道生。
孝弟也者,其為仁之本與!」

Simplified Chinese:

子曰:「学而时习之,不亦说乎?有朋自远方来,不亦乐乎?
人不知而不慍,不亦君子乎?」

有子曰:「其为人也孝弟,而好犯上者,鲜矣;
不好犯上,而好作乱者,未之有也。君子务本,本立而道生。
孝弟也者,其为仁之本与!」

Japonais :

「秋の田の かりほの庵の 苫をあらみ わが衣手は 露にぬれつつ」 天智天皇
「春すぎて 夏来にけらし 白妙の 衣ほすてふ 天の香具山」 持統天皇
「あしびきの 山鳥の尾の しだり尾の ながながし夜を ひとりかも寝む」 柿本人麻呂 

Letton :

Iedomu jaukie ideāli,
Vecākie principi, tikla, mīla - 
Dienas allažības priekšā
Šķīst kā graudi akmeņstarpā.
Glāžšķūņa rūķīši jautri dziedādami čiepj koncertflīģeļa vāku. 

Simplified Chinese :

这是简体字汉语: zhè shì jiǎn tǐ zì hàn yǔ 

Armenian:

Հարգանքներիս հավաստիքը Հայ Ժողովրդին:
Ամենալավ օրենքները չեն օգնի, եթե մարդիկ բանի պետք չեն:

Persian:

بنی‌آدم اعضای یک‌دیگرند / که در آفرینش ز یک گوهرند

Hebrew:

המשפט עם הזכוכית שאפשר לאכול בלי שזה מפריע, לא זוכר איך הוא הולך

Crédits

Philippe LAPEYRIE 2006-05-26 18:35
digitalin 2020-05-18 16:51

1)
Il ne s'agit ni d'une liste complète des éditeurs Unicode, ni d'une sélection des meilleurs choix disponibles. Il s'agit simplement de deux petits éditeurs que j'ai appréciés. Veuillez ne pas ajouter d'autres éditeurs.
fr/utf-8.txt · Dernière modification : 2020-05-18 17:19 de Digitalin

Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC Attribution-Share Alike 4.0 International
CC Attribution-Share Alike 4.0 International Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki