Table of Contents

UTF-8 Encoding

DokuWiki slaat tegenwoordig alle data op in UTF-8. Om problemen te voorkomen worden bestandsnamen van databestanden URL-geëncodeerd voordat ze worden opgeslagen. DokuWiki versies ouder dan release 2005-02-06 gebruiken een andere encodering, het is daarom nodig deze opnieuw te encoderen als de software wordt geüpgraded. Het wisselen naar karaktersets anders dan UTF-8 wordt niet ondersteund.

Browserinstellingen voor UTF-8

Alle moderne browsers kunnen omgaan met pagina's die UTF-8 geëncodeerd zijn - het is een van de weinige dingen die eigenlijk werkt zoals bedoelt in de meeste browsers. Als je browser sommige karakters niet correct weergeeft mis je waarschijnlijk de juiste Unicode-lettertypes.

Windowsgebruikers moeten het Arialuni.TTF lettertype van Microsoft installeren. Het zit standaard bij het Microsoft Office pakket.

Debiangebruikers kunnen mijn pagina over lettertypes lezen om te leren hoe Unicode-lettertypes juist worden geïnstalleerd.

Bestanden bewerken

Opslaan zonder een BOM in Notepad 2

Als je van plan bent om databestanden rechtstreeks te wijzigen of als je een vertaling wilt maken heb je een tekstbewerker nodig die met UTF-8 kan omgaan. Er zijn veel geschikte tekstbewerkers beschikbaar. Twee kleine simpele en gratis versies die ik kan aanbevelen als je er nog een zoekt zijn 1) :

Merk alsjeblieft op: DokuWiki gebruikt niet een Byte Order Mark en je moet opletten dat je software dat ook niet doet (in het bijzonder als je PHP en configuratiebestanden bewerkt).

batch Encoding bestand

Voorbeelden

Hieronder staan enkele voorbeelden van UTF-8 karakters om je browser te controleren2).

Zodiac Tekens: ♈ ♉ ♊ ♋ ♌ ♍ ♎ ♏ ♐ ♑ ♒ ♓

Een schaakbord:

A B C D E F G H
8
7
6
5
4
3
2
1

Russisch (по-русски):

По оживлённым берегам
Громады стройные теснятся
Дворцов и башен; корабли
Толпой со всех концов земли
К богатым пристаням стремятся;

Oud Grieks:

Αρχαίο Πνεύμα Αθάνατον! Ἰοὺ ἰού· τὰ πάντʼ ἂν ἐξήκοι σαφῆ.

Ὦ φῶς, τελευταῖόν σε προσϐλέψαιμι νῦν,
ὅστις πέφασμαι φύς τʼ ἀφʼ ὧν οὐ χρῆν, ξὺν οἷς τʼ
οὐ χρῆν ὁμιλῶν, οὕς τέ μʼ οὐκ ἔδει κτανών.

Modern Grieks:

Η σύγχρονη Ελλάδα, έχει να παρουσιάσει δυναμικό
έργο στον τομέα του πολιτισμού, των τεχνών και
των γραμμάτων. Αντίστοιχα δυναμική είναι η παρουσία
των Ελλήνων επιχειρηματιών στην διεθνή οικονομική
και βιομηχανική σκηνή.

Sanskriet:

पशुपतिरपि तान्यहानि कृच्छ्राद्
अगमयदद्रिसुतासमागमोत्कः । 
कमपरमवशं न विप्रकुर्युर्
विभुमपि तं यदमी स्पृशन्ति भावाः ॥

Hindi:

गूगल समाचार हिन्दी में

Koreaans:

한글은 아름다운 우리글입니다.
곱고 아름답게 사용하는 것이 우리의 의무입니다.

Chinees:

子曰:「學而時習之,不亦說乎?有朋自遠方來,不亦樂乎?
人不知而不慍,不亦君子乎?」

有子曰:「其為人也孝弟,而好犯上者,鮮矣;
不好犯上,而好作亂者,未之有也。君子務本,本立而道生。
孝弟也者,其為仁之本與!」

Japans:

「秋の田の かりほの庵の 苫をあらみ わが衣手は 露にぬれつつ」 天智天皇
「春すぎて 夏来にけらし 白妙の 衣ほすてふ 天の香具山」 持統天皇
「あしびきの 山鳥の尾の しだり尾の ながながし夜を ひとりかも寝む」 柿本人麻呂 

Lets:

Iedomu jaukie ideāli,
Vecākie principi, tikla, mīla - 
Dienas allažības priekšā
Šķīst kā graudi akmeņstarpā.
Glāžšķūņa rūķīši jautri dziedādami čiepj koncertflīģeļa vāku. 

Versimpeld Chinees:

这是简体字汉语。 zhè shì jiǎn t zì hàn yǔ 

Armeens:

Հարգանքներիս հավաստիքը Հայ Ժողովրդին:
Ամենալավ օրենքները չեն օգնի, եթե մարդիկ բանի պետք չեն:

Hebreeuws:

המשפט עם הזכוכית שאפשר לאכול בלי שזה מפריע, לא זוכר איך הוא הולך
1)
Dit is niet bedoeld als complete lijst van Unicode-tekstbewerkers, nog als best beschikbare keuze. Het zijn slechts twee kleine tekstbewerkers die ik fijn vind. Voeg alsjeblieft geen extra editors toe.