Denna delen av 99 uppdateras inte längre utan har arkiverats inför framtiden som ett museum.
Här kan du läsa mer om varför.
Mac-nyheter hittar du på Macradion.com och forumet hittar du via Applebubblan.

Vad är Unicode characters?

Tråden skapades och har fått 13 svar. Det senaste inlägget skrevs .
1

Kort och gott, vad är Unicode characters?

  • Medlem
  • Bollnäs
  • 2004-10-20 20:24

Kort:

Ett sätt att beskriva tecken binärt. Man använder två byte för ett tecken och åtta bitars adressering, vilket då ger 65 536 möjliga positioner (eller tecken).

Vill du veta mer så har jag skrivit en mer omfattande förklaring med utgångspunkt i digitala typsnitt. Du kan också läsa lite på Unicodes sajt, och hos Microsoft, Susning och Wikipedia.

Hoppas det räcker så länge.

Har hamnat i ett läge där jag inte får använda mappar med Unicode characters i sina "paths". Vad betyder det?

  • Medlem
  • Stockholm
  • 2004-10-21 09:35
Ursprungligen av Butterfly:

Har hamnat i ett läge där jag inte får använda mappar med Unicode characters i sina "paths". Vad betyder det?

Det betyder att inga specialtecken som använder sig av Unicode får finnas i mappens namn.

Man kan väl gissa att om datorernas och internets utveckling inte hade startat i USA så kanske vi inte hade samma problem med begränsad teckenuppsättning...

För de asiatiska språken med tusentals tecken är unicode väldigt vitkigt.

Är det i sin korthet att jag inte får ha åäö i mappnamnan kanske?

Som Adrian och Kalle säger så utvecklades "Ascii"-tabellerna för amerikansk standard och enbart de 128 första tecknen fick fasta positioner, allt därutöver lämnades odefinierat. Det gjorde bl.a. att Mac och PC fick problem med allt som inte tillhör dessa 128 tecken, t.ex. åäö som inte hade någon bestämd plats. Samma problem gäller så fort antalet möjliga tecken (256) tog slut, något man försökt lösa genom "teckenuppsättningar", något du t.ex. kan se i webbläsare där du kan välja teckenkodningar för olika språk.

Naturligtvis finns det bättre lösningar, t.ex. Unicode, där alla tecken har bestämad positioner och med vilket man kan undvika praktiskt taget alla såna här problem.

Lyckligtvis så är de första tecknen i unicode-tabellen samma som i Ascii -Win, så med andra ord kan du. t.ex. använda bokstäverna a-z och 0-9 m.fl.

  • Medlem
  • Mölndal
  • 2004-10-21 10:05

Om du får meddelandet i det program jag tror så är mitt tips att ignorera det, det brukar funka bra ändå.

ok, va bra det står nämligen fortfarande så, även om jag jobbat som en bäver för att få bort alla konstiga tecken..

  • Medlem
  • 2004-10-21 16:30

konvertering

Hej!

Jag vill ibland ta textdokument jag skrivit på min Mac och flytta över till en PC eller SUN-burk.

Varje gång får jag bråka med att teknen inte översätts korrekt, någon som har ett bra trick för hur man får rätt på tecken som åäö ()[]{} osv?

/hpe

Ursprungligen av hpe:

Hej!

Jag vill ibland ta textdokument jag skrivit på min Mac och flytta över till en PC eller SUN-burk.

Varje gång får jag bråka med att teknen inte översätts korrekt, någon som har ett bra trick för hur man får rätt på tecken som åäö ()[]{} osv?

/hpe

Det får du inte, annat än genom att använda Unicode

  • Medlem
  • 2004-10-21 16:38

inte så jag menade

Ursprungligen av Richard Rönnbäck:

Det får du inte, annat än genom att använda Unicode

Man kan ju faktiskt få de flesta tecken rätt om man använder 128-bits ASCII och inte den 127-bits som amerikaner ofta envisas med.

Vad jag är ute efter är ett sätt att konvertera textfiler så att så länge man inte använder tecken som inte finns i det format man konverterar till så funkar det.

Jämför exempelvis att Emacs ofta klarar av att hantera både PC och UNIX-format med lite olika tecken-tabeller.

Kommer inte riktigt ihåg men har för mig att GCC kräktes på mig när jag försökte mata in C-kod i annat format är ASCII.

/hpe

Ursprungligen av hpe:

Man kan ju faktiskt få de flesta tecken rätt om man använder 128-bits ASCII och inte den 127-bits som amerikaner ofta envisas med.

128-bits? Ojdå, det var värst.

Du menar väl 7-bits och 8-bits ( 8 bit = en byte), vilka ger 128 resp. 256 tecken.
Som sagt, alla varianter av alfabet och teckentabeller fick inte plats så därför har vi den röra av olika systemspecifika och regionsspecifika teckentabeller idag.

För att komma från detta utvecklades Unicode där adresseringen kan vara 8, 16 eller 32 bitar. (UTF-8, UTF-16 och UTF-32). Detta löser platsbristen men nu har vi fått tre teckentabeller till att välja mellan...

Tills hela världen har gått över till Unicode (OS, program, utvecklingsmiljöer etc.) så kommer vi att få dras med problem. Inom ett specifikt operativsystem kanske allt fungerar men det finns inga garantier att det system du kommunicerar med kör Unicode.

Butterfly:
Orsaken att du inte får använda Unicode i sökvägar är helt enkelt att systemet inte är byggt för att hantera det. Den sitter fast i 8-bitars träsket pga att det (eller delar av) skrevs före Unicode och för att allt ska fortsätta fungera med gamla program osv så har man inte ändrat. Att trycka in 2 bytes för ett tecken där andra program läser det som två separata tecken är inte så lyckat.
Minsta gemensamma nämnaren alltså.

Mer om Unicode hos www.unicode.org

/Hec
(Vars 'm' håller på att lägga av och retar inläggsskrivaren till vansinne)

Ursprungligen av Richard Rönnbäck:

Det får du inte, annat än genom att använda Unicode

Jo, det kan gå om han har ett program som kan spara i Windows Latin 1. BBEdit kan spara textfiler med den teckenuppsättningen och då blir det rätt på PC. Även ISO Latin 1 är mycket användbart, t.ex. om man vill skriva svenska tecken i en webbsida som ska ligga på en unix-webbserver.

1
Bevaka tråden