[Domain] Séríslenskir stafir í lénanöfnum undir .is

Marius Olafsson marius at isgate.is
Wed Oct 1 21:38:11 GMT 2003



Ágætu félagar

Eins og menn vita hafa lén verið skráð frá upphafi í mjög
takmörkuðu stafamengi (þ.e. tölustafir 0-9, bókastafir úr
enska stafrófinu a-z og bandstrikið "-" ). Ástæða þessarar
takmörkunar er/var auðvitað sú að þessi tákn eru sameiginleg
öllum (flestum) lyklaborðum um heim allan og þar sem netið
er alþjóðlegt hefur þótt eðlilegt að netföng þess væru að
sama skapi alþjóðleg.

Nú er þetta að breytast og stöðugt koma fram háværari kröfur
um að menn geti notað eigin tungumál við að skrá netföng og
þar með að lén skuli geta innihaldið stafróf eigin tungumáls.

Nýlega var lokið við að setja fram RFC (tillögur að stöðlum) 
um hvernig skrá skuli lén úr mun stærri stafamengjum en nú er 
mögulegt með ASCII menginu.

Eftirfarandi eru RFC sem aðalega fjalla um þetta:

RFC 3454 "Preperation of Internationalized Strings"
	  <http://ftp.rhnet.is/pub/rfc/rfc3454.txt>
RFC 3492 "Punycode: A Bootstring encoding of Unicode
          for Internationalized Domain Names in Applications (IDNA)"
	  <http://ftp.rhnet.is/pub/rfc/rfc3492.txt>
RFC 3491 "Nameprep: A Stringprep Profile for Internationalized
          Domain Names (IDN)"
	  <http://ftp.rhnet.is/pub/rfc/rfc3491.txt>
RFC 3490 "Internationalizing Domain Names in Applications (IDNA)"
	  <http://ftp.rhnet.is/pub/rfc/rfc3490.txt>

                          -- 0 --

Í ljósi þessa þurfum við að huga að hvernig við gerum
mönnum kleyft að skrá lén á íslensku undir .is, þ.e. hvernig við
bætum séríslensku stöfunum við í stafamengið sem nota má í íslensk lénanöfn.

Tæknileg útfærsla á þessu er í raun mjög einföld. Í DNS eru aldrei og verða
ekki skráð nein lén með séríslenskum stöfum. Nöfnin eru einfaldlega umkóðuð
yfir í svk ACE kóðun ("ASCII Compatible Encoding") og skráð sem slík (sjá
ofangreind RFC).  IANA úthlutaði fyrr á þessu ári sérstökum kóða 'xn' 
til að merkja þessa umkóðun og munu öll lén sem skráð eru skv þessu 
kerfi byrja á 'xn--'.

Aðili sem skráir t.d. lénið 'þjóðarlén.is' hjá ISNIC fær í raun skráð
í DNS lénið 'xn--jarln-esa9bxa1h.is' sem er ACE kóðun sem samsvarar
léninu 'þjóðarlén.is'. Ljóst er að fyrst um sinn verður notagildi léna
með slíkum séríslenskum stöfum lítið, þar sem búnað til að 
þýða þarna á milli vantar í flest notendaforrit. Sú staðalútfærsla
sem ofan á varð gerir ráð fyrir að notendaforrit/stýrikerfi sjái
um að þýða lénnöfn yfir í ACE kóðun áður en flett er upp í DNS.
Fyrst um sinn verður því sá sem vill senda póst til 'notandi@þjóðarlén.is' 
sjálfur að nota í staðinn til 'notandi at xn--jarln-esa9bxa1h.is' þar sem líklegt
er að póstkerfi viðkomandi samþykki ekki 'notandi@þjóðarlén.is' sem löglegt
netfang, og enn síður sjá um að þýða þarna á milli.

                           -- 0 -- 

Í tengslum við innleiðingu séríslenskra lénnafna hjá okkur eru nokkur
atriði sem gaman væri að menn veltu fyrir sér og kæmu með athugasemdir
við.

(1)
Fyrst mætti auðvitað spyrja hvort við ættum yfirhöfuð að gera þetta?
Þessi lén koma hvort eð er ekki til með að virka vel til að byrja með
og er þetta ekki bara aukakostnaður fyrir íslendinga sem nú þegar eru
með lén án séríslenskra stafa?  

Það er mat ISNIC að ekki verði hjá því komist að skrá lén með séríslenskum
stöfum undir .is. Brátt verður mönnum boðið upp á slíkt í almennu
lénunum og fjöldi opinna þjóðarléna munu bjóða upp á slíkt. Við viljum
síður neyða þá sem vilja lén með séríslenskum stöfum að skrá þau 
utan .is. Líklega eru u.þ.b 30% íslenskra léna þannig að þau væru
með séríslenskum stöfum en ekki er gott að segja hversu mörg þeirra
yrðu stofnuð. 

(2)
Ofangreindir staðlar um útfærslu á þessum lénum gera ráð fyrir UNICODE
stafamenginu <http://www.unicode.org/charts>. Það þýðir í raun að við verðum 
að velja hvaða stafi við viljum leyfa í íslenskum lénum. Gefin hafa 
verið út BCP á vegum CENTR og ICANN þar sem rök eru færð fyrir því að 
takmarka leyfilega stafi við þá sem notaðir eru innan viðkomandi lands. 
Sjá t.d. <http://www.icann.org/general/idn-guidelines-20jun03.htm>.
Þetta er gert til að lámarka líkur á ruglingi þegar mjög líkir stafir 
eru skráðir, og til að minnka þörf fyrirtækja og einstaklinga til að 
skrá mörg lén til að ná yfir þekkt merki sín.

ISNIC leggur til að við takmörkum skráningu léna undir .IS við íslenska
stafi eingöngu, þ.e. þæðö/ÞÆÐÖ áéýúíó/ÁÉÝÚÍÓ

(3)
Hvernig á að hefja þessa úthlutun? Skiptar skoðanir eru á því hjá þeim 
sem undirbúa að taka upp þjóðleg lén um hvernig skuli standa að þvi 
að byrja úthlutun.  Í grunninn eru tveir möguleikar; 

a  að skrá þessi lénum á nákvæmlega sama hátt og við skráum lén í dag
   þ.e. "fyrstur-kemur-fyrstur-fær" eða

b  að viðurkenna þá staðreynd að þeir sem upphaflega sóttu um lén
   án íslenskra stafa hefðu gjarnan viljað fá þau *með* íslenskum stöfum
   ef þeim hefði staðið það til boða.

ISNIC leggur til að við gerum þetta samkvæmt síðari kostinum en með
ákveðnum takmörkuðum yfirgangstíma (t.d. 6 mánuðir). Þetta er í raun
mjög einföld leið fyrir okkur. Þegar við fáum beiðni um skráningu á
þjóðlegu léni (þ.e. með íslenskum stöfum), þá umbreytum við nafninu
skv eftirfarandi töflu:

        þ -> th          á -> a            í -> i
        æ -> ae          é -> e            ó -> o
        ð -> d           ý -> y
        ö -> o           ú -> u

Ef rétthafi á léninu sem út kemur í þessari umbreytingu er sá hinn sami
(sama kennitala) og á hinu umbeðna þjóðlega léni (eða ef umbreytta lénið
er ekki skráð) þá er lénið veitt. Annars ekki. 

Sem dæmi, ef aðli sækir um lénið 'þjóðarlén.is', þá er athugað hver rétthafi
lénsins 'thjodarlen.is' og ef það er sami aðili, eða ef 'thjodarlen.is' er ekki
skráð þá skráir ISNIC lénið 'þjóðarlén.is' og setur 'xn--jarln-esa9bxa1h.is' 
inn í DNS. Sé lénið 'thjodarlen.is' ekki til veitir skráning lénsins
'þjóðarlén.is' engann rétt á því nafni þ.e. rétturinn er *ekki* gagnkvæmur.

Að yfirgangstíma loknum verður enginn greinarmunur gerður á lénum með eða
án íslenskra stafa. 

(4)
Ýmss önnur álitamál munu auðvitað koma upp við innleiðingu þjóðlegra
lénnafna og gefa þarf ISNIC og hýsingaraðilum tíma til að aðlaga eigin kerfi
(svo sem skráningarkerfi, bókhaldskerfi o.s.frv.) að nýjum gerðum léna.

ISNIC býst við að byrja að bjóða upp á skráningu léna af þessu tagi snemma
á næsta ári, ef ekkert óvænt kemur í veg fyrir það og það tekst að ljúka
nauðsynlegum breytingum á skráningarkerfum.


                         -- 0 --

Látið endilega heyra í ykkur. Okkur er mjög í mun að fá álit sem flestra
á framhaldinu, hvernig standa skuli að innleiðingu IDN undir .IS. Sendið 
ykkar tillögur/athugasemdir á 'domain at lists.isnic.is' -- til þess er þessi 
listi.


--
Marius


RFC	- "Request For Comment"
BCP     - "Best Current Practice"
ICANN   - "Internet Corporation for Assigend Names and Numbers"
IANA    - "Internet Assigned Numbers Authority"
CENTR   - "Council of European National Top-Level Domain Registries"
IDN     - "Internationalized Domain Names"



More information about the Domain mailing list