20 HTML 4.0のSGML宣言

注。このSGML宣言において文書文字集合の表現に許容されるコードポイントの総計は、[ISO10646]の最初の17面(65536文字の17倍)となります。この制限は、現在のSGML標準自体が8桁の限界を持っていることに由来します。決してUCS文字集合の利用可能性を最初の17面だけに留めようといったことを意図するものではありません。SGMLの限界である8桁制限が撤去される時期、ならびにHTMLの仕様が更新される時期の方が、必要とされる文字自体の数が最初の17面を越えてしまう時期よりも早く訪れるでしょう。

注。正確に言うと「ISO登録番号177」は1993年版[ISO10646]原典を指すものですが、この仕様書においては、常に最新版の「ISO 10646」を参照しています。1993年版からの変更点として、文字の追加と、ハングルに対して広大なコード空間を再配置したことがあげられます(改正第5案)。[訳注。宣言内容は、正誤表に基づき訂正済み。]

20.1 SGML宣言(SGML Declaration

<!SGML  "ISO 8879:1986 (WWW)"
    --
         SGML Declaration for HyperText Markup Language version 4.0
 
         With support for the first 17 planes of ISO 10646 and
         increased limits for tag and literal lengths etc.
    --
 
    CHARSET
          BASESET  "ISO Registration Number 177//CHARSET
                    ISO/IEC 10646-1:1993 UCS-4 with
                    implementation level 3//ESC 2/5 2/15 4/6"
         DESCSET 0       9       UNUSED
                 9       2       9
                 11      2       UNUSED
                 13      1       13
                 14      18      UNUSED
                 32      95      32
                 127     1       UNUSED
                 128     32      UNUSED
                 160     55136   160
                 55296   2048    UNUSED  -- SURROGATES --
                 57344   1056768 57344

CAPACITY        SGMLREF
                TOTALCAP        150000
                GRPCAP          150000
                ENTCAP          150000

SCOPE    DOCUMENT
SYNTAX
         SHUNCHAR CONTROLS 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
           17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 127
         BASESET  "ISO 646IRV:1991//CHARSET
                   International Reference Version
                   (IRV)//ESC 2/8 4/2"
         DESCSET  0 128 0

         FUNCTION
                  RE            13
                  RS            10
                  SPACE         32
                  TAB SEPCHAR    9

         NAMING   LCNMSTRT ""
                  UCNMSTRT ""
                  LCNMCHAR ".-_:"    
                  UCNMCHAR ".-_:"
                  NAMECASE GENERAL YES
                           ENTITY  NO
         DELIM    GENERAL  SGMLREF
                  HCRO "&#38#x" -- 38 is the number for ampersand --
                  SHORTREF SGMLREF
         NAMES    SGMLREF
         QUANTITY SGMLREF
                  ATTCNT   60      -- increased --
                  ATTSPLEN 65536   -- These are the largest values --
                  LITLEN   65536   -- permitted in the declaration --
                  NAMELEN  65536   -- Avoid fixed limits in actual --
                  PILEN    65536   -- implementations of HTML UA's --
                  TAGLVL   100
                  TAGLEN   65536
                  GRPGTCNT 150
                  GRPCNT   64

FEATURES
  MINIMIZE
    DATATAG  NO
    OMITTAG  YES
    RANK     NO
    SHORTTAG YES
  LINK
    SIMPLE   NO
    IMPLICIT NO
    EXPLICIT NO
  OTHER
    CONCUR   NO
    SUBDOC   NO
    FORMAL   YES
  APPINFO NONE
>