DokuWiki

It's better when it's simple

Gebruikershulpmiddelen

Site-hulpmiddelen


nl:utf-8

UTF-8 Encoding

DokuWiki slaat tegenwoordig alle data op in UTF-8. Om problemen te voorkomen worden bestandsnamen van databestanden URL-geëncodeerd voordat ze worden opgeslagen. DokuWiki versies ouder dan release 2005-02-06 gebruiken een andere encodering, het is daarom nodig deze opnieuw te encoderen als de software wordt geüpgraded. Het wisselen naar karaktersets anders dan UTF-8 wordt niet ondersteund.

Browserinstellingen voor UTF-8

Alle moderne browsers kunnen omgaan met pagina's die UTF-8 geëncodeerd zijn - het is een van de weinige dingen die eigenlijk werkt zoals bedoelt in de meeste browsers. Als je browser sommige karakters niet correct weergeeft mis je waarschijnlijk de juiste Unicode-lettertypes.

Windowsgebruikers moeten het Arialuni.TTF lettertype van Microsoft installeren. Het zit standaard bij het Microsoft Office pakket.

Debiangebruikers kunnen mijn pagina over lettertypes lezen om te leren hoe Unicode-lettertypes juist worden geïnstalleerd.

Bestanden bewerken

Opslaan zonder een BOM in Notepad 2

Als je van plan bent om databestanden rechtstreeks te wijzigen of als je een vertaling wilt maken heb je een tekstbewerker nodig die met UTF-8 kan omgaan. Er zijn veel geschikte tekstbewerkers beschikbaar. Twee kleine simpele en gratis versies die ik kan aanbevelen als je er nog een zoekt zijn 1) :

  • TEA – een GTK2 gebaseerde editor voor GNU/Linux
  • Notepad2 – een erg goede notepad vervanging voor Windows

Merk alsjeblieft op: DokuWiki gebruikt niet een Byte Order Mark en je moet opletten dat je software dat ook niet doet (in het bijzonder als je PHP en configuratiebestanden bewerkt).

batch Encoding bestand

  • Gebruik op Window recode, een afgeleide versie van iconv: http://recode.progiciels-bpi.ca/archives
    • Voorbeeld van een simpele omzetting voor een Franse lokale computer:
      recode lat1..u8 test.txt

      met lat1 het kararakterset van de bron en u8 het karakterset voor de conversie naar UTF-8.

    • Om de conversie te bundelen op Windows gebruik dit (converteert alle bestanden in de submap)
      FOR /F "tokens=*" %%G IN ('dir/b/S/X ^"C:\yourpath\*.txt^"') DO recode -v lat1..u8 %%~sG
  • Meer uitleg op: de link

Voorbeelden

Hieronder staan enkele voorbeelden van UTF-8 karakters om je browser te controleren2).

Zodiac Tekens: ♈ ♉ ♊ ♋ ♌ ♍ ♎ ♏ ♐ ♑ ♒ ♓

Een schaakbord:

A B C D E F G H
8
7
6
5
4
3
2
1

Russisch (по-русски):

По оживлённым берегам
Громады стройные теснятся
Дворцов и башен; корабли
Толпой со всех концов земли
К богатым пристаням стремятся;

Oud Grieks:

Αρχαίο Πνεύμα Αθάνατον! Ἰοὺ ἰού· τὰ πάντʼ ἂν ἐξήκοι σαφῆ.

Ὦ φῶς, τελευταῖόν σε προσϐλέψαιμι νῦν,
ὅστις πέφασμαι φύς τʼ ἀφʼ ὧν οὐ χρῆν, ξὺν οἷς τʼ
οὐ χρῆν ὁμιλῶν, οὕς τέ μʼ οὐκ ἔδει κτανών.

Modern Grieks:

Η σύγχρονη Ελλάδα, έχει να παρουσιάσει δυναμικό
έργο στον τομέα του πολιτισμού, των τεχνών και
των γραμμάτων. Αντίστοιχα δυναμική είναι η παρουσία
των Ελλήνων επιχειρηματιών στην διεθνή οικονομική
και βιομηχανική σκηνή.

Sanskriet:

पशुपतिरपि तान्यहानि कृच्छ्राद्
अगमयदद्रिसुतासमागमोत्कः । 
कमपरमवशं न विप्रकुर्युर्
विभुमपि तं यदमी स्पृशन्ति भावाः ॥

Hindi:

गूगल समाचार हिन्दी में

Koreaans:

한글은 아름다운 우리글입니다.
곱고 아름답게 사용하는 것이 우리의 의무입니다.

Chinees:

子曰:「學而時習之,不亦說乎?有朋自遠方來,不亦樂乎?
人不知而不慍,不亦君子乎?」

有子曰:「其為人也孝弟,而好犯上者,鮮矣;
不好犯上,而好作亂者,未之有也。君子務本,本立而道生。
孝弟也者,其為仁之本與!」

Japans:

「秋の田の かりほの庵の 苫をあらみ わが衣手は 露にぬれつつ」 天智天皇
「春すぎて 夏来にけらし 白妙の 衣ほすてふ 天の香具山」 持統天皇
「あしびきの 山鳥の尾の しだり尾の ながながし夜を ひとりかも寝む」 柿本人麻呂 

Lets:

Iedomu jaukie ideāli,
Vecākie principi, tikla, mīla - 
Dienas allažības priekšā
Šķīst kā graudi akmeņstarpā.
Glāžšķūņa rūķīši jautri dziedādami čiepj koncertflīģeļa vāku. 

Versimpeld Chinees:

这是简体字汉语。 zhè shì jiǎn t zì hàn yǔ 

Armeens:

Հարգանքներիս հավաստիքը Հայ Ժողովրդին:
Ամենալավ օրենքները չեն օգնի, եթե մարդիկ բանի պետք չեն:

Hebreeuws:

המשפט עם הזכוכית שאפשר לאכול בלי שזה מפריע, לא זוכר איך הוא הולך
1)
Dit is niet bedoeld als complete lijst van Unicode-tekstbewerkers, nog als best beschikbare keuze. Het zijn slechts twee kleine tekstbewerkers die ik fijn vind. Voeg alsjeblieft geen extra editors toe.
nl/utf-8.txt · Laatst gewijzigd: 2013-01-14 20:08 door Klap-in

Tenzij anders vermeld valt de inhoud van deze wiki onder de volgende licentie: CC Attribution-Share Alike 4.0 International
CC Attribution-Share Alike 4.0 International Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki