Windows 코드 페이지

Windows code page

Windows 코드 페이지는 1980년대와 1990년대 Microsoft Windows에서 사용된 문자 또는 코드 페이지 세트(다른 운영 체제에서는 문자 인코딩이라고도 함)입니다.Windows 코드 페이지는 Unicode가 Windows[citation needed]구현되었을 때 점차 대체되었지만 Windows와 다른 플랫폼 모두에서 여전히 지원되며 Alt 코드 바로 가기를 사용할 때 적용됩니다.

Windows 시스템의 시스템 코드 페이지에는 OEM 코드 페이지와 Windows 네이티브 코드 페이지("ANSI") 코드 페이지의 두 가지 그룹이 있습니다.이 두 그룹의 코드 페이지는 확장 ASCII 코드 페이지입니다.표준 Windows 변환 루틴에서는 추가 코드 페이지가 지원되지만 시스템 코드 페이지 유형으로는 사용되지 않습니다.

ANSI 코드 페이지

Windows-125x 시리즈
에일리어스ANSI(오식)
표준.WHATWG 부호화 표준
확장US-ASCII
선행ISO 8859
에 의해 성공자유니코드
UTF-16(Win32 API)

ANSI 코드 페이지(Microsoft가 이전 용어를 잘못된 이름으로[2] 받아들인 후 공식적으로 "Windows 코드 페이지"[1]라고 함)는 Windows 시스템에서 그래픽 사용자 인터페이스를 사용하는 유니코드 이외의 네이티브 응용 프로그램에 사용됩니다.코드 페이지 1252는 국제 표준 ISO 8859-1[2]된 초기 ANSI 초안에 기초하고 있으며 32개의 제어 코드와 96자의 인쇄 가능 문자를 추가할 수 있습니다.다른 차이점 중에서도 Windows 코드 페이지는 보조 제어 코드 공간에 인쇄 가능한 문자를 할당하기 때문에 표준 준거 운영 체제에서는 기껏해야 읽을 수 없습니다.)

대부분의 레거시 "ANSI" 코드 페이지에는 패턴 125x의 코드 페이지 번호가 있습니다.그러나 모두 OEM 코드 페이지로 사용되는 874(태국) 및 동아시아 멀티바이트 "ANSI" 코드 페이지(932, 936, 949, 950)는 IBM 인코딩과 일치하도록 번호가 지정되며, 모두 Windows 인코딩과 동일하지는 않습니다(대부분 유사함).코드 페이지 1258은 OEM 코드 페이지로도 사용되지만 기존 인코딩에 대한 확장자가 아니라 Microsoft에 대한 원본 페이지입니다.IBM은 Microsoft 버전에 대해 서로 다른 자체 번호를 할당했습니다. 이러한 번호는 해당되는 경우 아래 목록에서 참조할 수 있도록 제공됩니다.

IANA(Internet Assigned Numbers Authority)에서는 125x의 Windows 코드 페이지와 874 및 936은 모두 "Windows 번호"로 라벨이 지정되지만 "Windows-936"은 "GBK"의 동의어로 취급됩니다.Windows 코드 페이지 932는 「Windows-31J」[3]라고 하는 라벨이 붙어 있습니다.

ANSI Windows 코드 페이지, 특히 코드 페이지 1252는 ANSI에 대해 제출되거나 ANSI용으로 의도된 초안을 기반으로 했기 때문에 호출되었습니다.단, ANSI ISO는 이러한 코드 페이지를 표준화하지 않았습니다.대신 다음 [2]중 하나입니다.

Microsoft는 CP1252에서 약 12개의 타이포그래피 및 비즈니스 문자(특히 유로 기호, € 포함)를 ISO 8859에서 C1 제어 코드에 할당된 코드 포인트 0x80~0x9F에 할당했습니다.이러한 할당은, 같은 코드 포인트의 다른 많은 ANSI/Windows 코드 페이지에도 있습니다.Windows 는 C1 제어 코드를 사용하지 않았기 때문에, 이 결정은 Windows 유저에게 직접적인 영향은 없었습니다.그러나 Unix 또는 MacOS와 같은 표준 준수 플랫폼으로 전송된 파일에 포함된 경우 정보가 보이지 않아 운영 [citation needed]중단이 발생할 수 있습니다.

OEM 코드 페이지

OEM 코드 페이지(오리지널 기기 제조업체)Win32 콘솔 애플리케이션 및 가상 DOS에서 사용되며 DOS 및 원래 IBM PC 아키텍처에서 보류된 것으로 간주할 수 있습니다.호환성뿐만 아니라 VGA(및 하위) 하드웨어의 글꼴이 코드 페이지 437과 호환되는 선 그리기 문자의 인코딩을 제안하기 때문에 코드 페이지의 별도 세트가 구현되었습니다.대부분의 OEM 코드 페이지는 특히 문자가 아닌 문자의 경우 두 번째 코드(ASC 이외)와 많은 코드 포인트를 공유합니다.II) CP437의 절반.

일반적인 OEM 코드 페이지는 후반부에서 ANSI/Windows 코드 페이지와 거의 유사하지 않습니다.단, OEM 및 ANSI 코드 페이지에는 2개의 싱글바이트 고정폭 코드 페이지(태국어 874개, 베트남어 1258개)와 4개의 멀티바이트 CJK 코드 페이지(932, 936, 949, 950)가 사용됩니다.코드 페이지 1258은 분음 부호 조합을 사용합니다. 베트남어에는 128개 이상의 문자-분음 부호 조합이 필요하기 때문입니다.는 일부 C0(ASCII) 제어 코드를 대체하는 VISCII와는 대조적입니다.

역사

처음에 컴퓨터 시스템과 시스템 프로그래밍 언어는 문자바이트를 구분하지 않았습니다.아프리카, 아메리카, 동남아시아, 중동 및 유럽에서 사용되는 세그먼트 스크립트의 경우 한 문자는 1바이트만 필요하지만 나머지 문자 집합에는 2바이트 이상이 필요합니다.세상이것은 결과적으로 큰 혼란으로 이어졌다.Windows NT 라인 이전의 Microsoft 소프트웨어 및 시스템은 OEM 코드 페이지와 ANSI 코드 페이지를 사용하고 있기 때문에 구별이 되지 않습니다.

1990년대 후반부터 소프트웨어와 시스템은 선호하는 스토리지 포맷으로 Unicode를 채택했습니다. 이러한 경향은 XML이 널리 채택됨에 따라 개선되었습니다. XML은 [4]사용된 인코딩에 라벨을 붙이기 위한 보다 적절한 메커니즘을 제공합니다.최신 Microsoft 제품 및 응용 프로그램인터페이스에서는 내부적으로 [citation needed]Unicode를 사용하고 있지만, 많은 응용 프로그램 및 API는 텍스트 데이터를 파일 또는 표준 [citation needed]출력에 읽고 쓸 때 컴퓨터의 '로케일' 기본 인코딩을 계속 사용합니다.따라서 세계의 한 지역에서는 읽기 쉽고 이해하기 쉬운 파일이 발견될 수 있지만 다른 지역에서는 이해하기 어려운 mojibake 파일이 발견될 수 있습니다.

UTF-8, UTF-16

마이크로소프트는 Windows NT 이후의 모든 운영 체제에 16비트(2바이트) UTF-16 시스템을 채택하기로 결정했습니다. 방식에서는 Basic Multilinguage Plane 내의 모든 Unicode 문자와 32비트(4바이트) 코드가 고유하게 부호화됩니다.단, 업계에서는 UTF-8(7비트 ASCII 문자 세트에는 1바이트, BMP의 다른 문자에는 2바이트 또는 3바이트, 나머지 4바이트 사용)을 선택했습니다.Windows 10 버전 1803 이후에서는, Windows 머신을 「ANSI」및 OEM 코드 페이지로서 [5]UTF-8 를 허가하도록 설정할 수 있습니다.

목록.

다음의 Windows 코드 페이지가 있습니다.

Windows-125x 시리즈

이들 9개의 코드 페이지는 모두 확장 ASCII 8비트 SBCS 인코딩으로 Windows에서 ANSI 코드 페이지로 사용하도록 Microsoft에 의해 설계되었습니다.일반적으로 IANA에 등록된[6] 이름으로 알려져 있습니다.windows-<number>, 라고 불리기도 합니다.cp<number>, "cp"는 "code page"로 지정합니다.모두 ANSI 코드페이지로 사용되며 Windows-1258은 OEM 코드페이지로도 사용됩니다.

Windows-125x 시리즈는 9개의 ANSI 코드 페이지를 포함하고 있으며 대부분 유럽과 서아시아스크립트에 베트남을 추가합니다.태국어 및 동아시아 언어용 시스템 부호화에는 유사한 IBM 코드 페이지와 일치하도록 번호가 매겨져 ANSI 코드 페이지와 OEM 코드 페이지 양쪽으로 사용됩니다.이러한 코드들은 다음 섹션에서 설명합니다.

아이디 묘사 ISO 8859 또는 기타 확립된 인코딩과의 관계
1250[7][8] 라틴어 2 / 중앙유럽어 ISO-8859-2와 비슷하지만 여러 문자를 포함하여 여러 문자를 이동합니다.
1251[9][10] 키릴 문자 ISO-8859-5KOI-8과 호환되지 않습니다.
1252[11][12] 라틴어 1 / 서유럽어 ISO-8859-1의 슈퍼셋(C1 컨트롤 없음).레퍼토리는 CP850과 비슷합니다.
1253[13][14] 그리스어 ISO 8859-7과 비슷하지만 문자를 포함한 여러 문자를 이동합니다.
1254[15][16] 터키어 ISO 8859-9의 슈퍼셋(C1 컨트롤 없음).
1255[17][18] 히브리어 ISO 8859-8의 거의 슈퍼셋이지만 두 가지 호환되지 않는 구두점 변경이 있습니다.
1256[19][20] 아랍어 ISO 8859-6과 호환되지 않습니다.OEM 코드 페이지 708은 ISO 8859-6(ASMO 708) 슈퍼셋입니다.
1257[21][22] 발트해 ISO 8859-4가 아닙니다.나중의 ISO 8859-13은 밀접하게 관련되어 있습니다만, 사용 가능한 구두점에 약간의 차이가 있습니다.
1258[23][24] 베트남어(OEM도 가능) VSCII 또는 VISCII와 관련되지 않고 분음 문자를 조합하여 사용하는 기본 문자 수가 적습니다.

DOS 코드 페이지

이것들은 ASCII 베이스이기도 합니다.이들 대부분은 OEM 코드페이지로 사용하기 위해 포함되어 있으며 코드페이지 874는 ANSI 코드페이지로도 사용됩니다.

  • 437 – IBM PC US, 8비트 SBCS 확장 ASCII.[25]OEM-US로 알려진 VGA 그래픽 카드의 기본 내장 글꼴 인코딩입니다.
  • 708 – 아랍어, 확장 ISO 8859-6 (ASMO 708)
  • 720 – 아랍어, 상자 그리기 문자를 보통 위치에 고정
  • 737 – "MS-DOS 그리스어"모든 상자 그리기 문자를 유지합니다.869보다 더 인기가 있다.
  • 775 – "MS-DOS 발틱 림"
  • 850 – "MS-DOS Latin 1" (MS-DOS Latin 1 )ISO 8859-1의 완전한 (재편성된) 레퍼토리.
  • 852 – "MS-DOS Latin 2"
  • 855 – "MS-DOS 키릴 문자"주로 남부 슬라브어족에 사용됩니다.ISO-8859-5의 레퍼토리를 포함합니다(재편성).cp866과 혼동하지 마십시오.
  • 857 – "MS-DOS 터키어"
  • 858 – 서유럽 (유로 기호 포함)
  • 860 – "MS-DOS 포르투갈어"
  • 861 – "MS-DOS 아이슬란드어"
  • 862 – "MS-DOS 히브리어"
  • 863 – "MS-DOS 프렌치 캐나다"
  • 864 – 아랍어
  • 865 – "MS-DOS Nordic"
  • 866 – "MS-DOS 키릴어 러시아어", cp866.WHATWG Encoding Standard for HTML5에 레거시 인코딩으로 포함된 유일한 순수 OEM 코드 페이지(ANSI 또는 둘 다 아님)
  • 869 – "MS-DOS 그리스어 2", IBM869.ISO 8859-7의 완전한 (재편성된) 레퍼토리.
  • 874 – ANSI 코드페이지로도 사용되는 태국어는 ISO 8859-11(따라서 TIS-620)을 확장하여 Windows-1252에서 몇 개의 문자를 추가했습니다.IBM 코드 페이지 1162에 대응합니다(IBM-874는 유사하지만 확장자가 다릅니다).

동아시아 멀티바이트 코드 페이지

코드 페이지 932, 949 및 950은 동일한 번호의 IBM 코드 페이지와 부분적으로만 일치하지만, 숫자 936은 IBM에 의해 사용되지 않는 또 다른 중국어 간체 인코딩에 사용되었으며, Windows-951은 크러지의 일부로서 IBM-951과 관련이 없습니다.IBM의 동등한 코드 페이지는 두 번째 열에 나와 있습니다.코드 페이지 932, 936, 949 및 950/951은 해당 로케일에서 ANSI 및 OEM 코드페이지로 사용됩니다.

아이디 언어 부호화 IBM 동등품 같은 번호의 IBM CCSID와의 차이 사용하다
932 일본인입니다 Shift JIS(Microsoft 버전) 943[26] IBM-932는 또한 Shift JIS이며, 더 적은 확장자를 가지고 있으며(단, 이 확장자는 공통), JIS C 6226의 이전 버전과의 상호 운용성을 위해 일부 변형 한자(이타이지)를 교환합니다. ANSI/OEM(일본)
936 중국어(간체) GBK 1386 IBM-936은 다른 인코딩 방식을 사용하는 중국어 간체 인코딩으로 1993년부터 사용되지 않습니다. ANSI/OEM(PRC, 싱가포르)
949 한국인입니다 통일 한글 코드 1363 IBM-949도 EUC-KR 슈퍼셋이지만 서로 다른(충돌하는) 확장 기능을 가지고 있습니다. ANSI/OEM(대한민국)
950 중국어(번체) Big5(Microsoft 버전) 1373[27] IBM-950도 Big5이지만 ETEN 확장의 다른 서브셋을 포함하고 확장된 추적 바이트 범위로 확장 기능을 추가하며 Euro가 없습니다. ANSI/OEM(대만, 홍콩)
951 광둥어를 포함한 중국어(번체) Big5-HKSCS(2001년판) 5471[28] IBM-951은 IBM-949의 더블바이트 플레인(위 참조)이며 Microsoft가 내부적으로 951이라는 번호를 사용하는 것과는 관련이 없습니다. ANSI/OEM(홍콩, 98/NT4/2000/XP, HKSCS 패치 포함)

몇 개의 멀티바이트 코드 페이지는 운영체제라이브러리를 사용한 디코딩 또는 부호화에 대응하고 있지만, 어느 로케일의 시스템 부호화에도 사용되지 않습니다.

아이디 IBM 동등품 언어 부호화 사용하다
1361 - 한국인입니다 Johab (KS C 5601-1992 부속서 3) 변환
20000 - 중국어(번체) CNS 11643 부호화 변환
20001 - 중국어(번체) TCA 변환
20002 - 중국어(번체) Big5(ETEN 배리언트) 변환
20003 938 중국어(번체) IBM 5550 변환
20004 - 중국어(번체) 텔레텍스트 변환
20005 - 중국어(번체) 변환
20932 954(표준) 일본인입니다 EUC-JP 변환
20936 5479 중국어(간체) GB 2312 변환
20949, 51949 970 한국인입니다 Wansung(8비트, ASCII 지원, 즉 EUC-KR)[29] 변환

EBCDIC 코드 페이지

  • 37 – IBM EBCDIC US-Canada, 8비트 SBCS[30]
  • 500 – 라틴어 1
  • 870 – IBM870
  • 875 – cp875
  • 1026 – EBCDIC 터키어
  • 1047 – IBM01047 – 라틴어 1
  • 1140 – IBM01141
  • 1141 – IBM01141
  • 1142 – IBM01142
  • 1143 – IBM01143
  • 1144 – IBM01144
  • 1145 – IBM01145
  • 1146 – IBM01146
  • 1147 – IBM01147
  • 1148 – IBM01148
  • 1149 – IBM01149
  • 20273 – EBCDIC 독일
  • 20277 – EBCDIC 덴마크/노르웨이
  • 20278 – EBCDIC 핀란드/스웨덴
  • 20280 – EBCDIC 이탈리아
  • 20284 – EBCDIC 중남미/스페인
  • 20285 – EBCDIC 영국
  • 20290 – EBCDIC 일본어
  • 20297 – EBCDIC 프랑스
  • 20420 – EBCDIC 아랍어
  • 20423 – EBCDIC 그리스어
  • 20424 –x-EBCDIC-Korean Extended
  • 20833 – 한국어
  • 20838 – EBCDIC 태국어
  • 20924 – IBM00924 – IBM EBCDIC Latin 1/Open System (1047 + 유로 기호)
  • 20871 – EBCDIC 아이슬란드어
  • 20880 – EBCDIC 키릴 문자
  • 20905 – EBCDIC 터키어
  • 21025 – EBCDIC 키릴 문자
  • 21027 – 일본어 EBCDIC (불완전,[31] 폐지)[32]

Unicode 관련 코드 페이지

Macintosh 호환성 코드 페이지

  • 10000 – Apple Macintosh 로마자
  • 10001 – Apple Macintosh 일본어
  • 10002 – Apple Macintosh 중국어(번체) (BIG-5)
  • 10003 – Apple Macintosh 한국어
  • 10004 – Apple Macintosh 아랍어
  • 10005 – Apple Macintosh 히브리어
  • 10006 – Apple Macintosh 그리스어
  • 10007 – Apple Macintosh 키릴 문자
  • 10008 – Apple Macintosh 중국어 (간체) (GB 2312)
  • 10010 – Apple Macintosh 루마니아어
  • 10017 – Apple Macintosh 우크라이나어
  • 10021 – Apple Macintosh Thai
  • 10029 – Apple Macintosh Roman II / 중앙유럽
  • 10079 – Apple Macintosh 아이슬란드어
  • 10081 – Apple Macintosh 터키어
  • 10082 – Apple Macintosh 크로아티아어

ISO 8859 코드 페이지

ITU-T 코드 페이지

KOI8 코드 페이지

  • 20866 – 러시아어 – KOI8-R
  • 21866 – 우크라이나 – KOI8-U (일부 [40]버전에서는 KOI8-RU)

코드 페이지 사용으로 발생하는 문제

Microsoft는 최신 응용 프로그램에서 Unicode 사용을 강력히 권장하지만 많은 응용 프로그램 또는 데이터 파일은 여전히 레거시 코드 페이지에 의존합니다.

  • 프로그램이 (유니코드 이전) 파일의 내용을 올바르게 표시하려면 어떤 코드 페이지를 사용해야 하는지 알아야 합니다.프로그램에서 잘못된 코드 페이지를 사용하면 텍스트가 mojibake로 표시될 수 있습니다.
  • 사용 중인 코드 페이지는 머신마다 다를 수 있으므로, 한 머신에서 작성된 (유니코드 이전) 파일은 다른 머신에서 읽을 수 없습니다.
  • 데이터에 코드 페이지가 잘못 태그되어 있거나 태그가 전혀 붙어 있지 않은 경우가 많기 때문에 데이터를 읽기 위한 올바른 코드 페이지를 판단하기가 어렵습니다.
  • 이러한 Microsoft 의 코드 페이지는, 표준의 일부나 다른 벤더의 실장과는 다양한 정도로 다릅니다.이는 모든 벤더에서 발생하는 것처럼 마이크로소프트만의 문제는 아니지만, 일관성이 없기 때문에 다른 시스템과의 상호 운용성을 신뢰할 수 없는 경우가 있습니다.
  • 코드 페이지를 사용하면 사용할 수 있는 문자 집합을 제한할 수 있습니다.
  • 지원되지 않는 코드페이지에 표시되는 문자는 물음표(?) 또는 기타 대체문자로 변환하거나 간단한 버전(문자에서 악센트 삭제 등)으로 변환할 수 있습니다.어느 경우든 원래 문자가 손실될 수 있습니다.

「 」를 참조해 주세요.

  • AppLocale – 사용자가 선택한 로케일에서 Unicode(코드 페이지 기반) 이외의 응용 프로그램을 실행하기 위한 유틸리티입니다.

레퍼런스

  1. ^ "Code Pages". 2016-03-07. Archived from the original on 2016-03-07. Retrieved 2021-05-26.
  2. ^ a b c "Glossary of Terms Used on this Site". December 8, 2018. Archived from the original on 2018-12-08. The term "ANSI" as used to signify Windows code pages is a historical reference, but is nowadays a misnomer that continues to persist in the Windows community. The source of this comes from the fact that the Windows code page 1252 was originally based on an ANSI draft—which became International Organization for Standardization (ISO) Standard 8859-1. “ANSI applications” are usually a reference to non-Unicode or code page–based applications.
  3. ^ "Character Sets". www.iana.org. Archived from the original on 2021-05-25. Retrieved 2021-05-26.
  4. ^ "Extensible Markup Language (XML) 1.1 (Second Edition): Character encodings". W3C. 29 September 2006. Archived from the original on 19 April 2021. Retrieved 5 October 2020.
  5. ^ hylom (2017-11-14). "Windows 10のInsider PreviewでシステムロケールをUTF-8にするオプションが追加される" [The option to make UTF-8 the system locale added in Windows 10 Insider Preview]. スラド (in Japanese). Archived from the original on 2018-05-11. Retrieved 2018-05-10.
  6. ^ "Character Sets". IANA. Archived from the original on 2016-12-03. Retrieved 2019-04-07.
  7. ^ Microsoft. "Windows 1250". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  8. ^ IBM. "SBCS code page information document CPGID 01250". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  9. ^ Microsoft. "Windows 1251". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  10. ^ IBM. "SBCS code page information document CPGID 01251". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  11. ^ Microsoft. "Windows 1252". Archived from the original on 2013-05-04. Retrieved 2014-07-06.
  12. ^ IBM. "SBCS code page information document CPGID 01252". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  13. ^ Microsoft. "Windows 1253". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  14. ^ IBM. "SBCS code page information document CPGID 01253". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  15. ^ Microsoft. "Windows 1254". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  16. ^ IBM. "SBCS code page information document CPGID 01254". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  17. ^ Microsoft. "Windows 1255". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  18. ^ IBM. "SBCS code page information document CPGID 01255". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  19. ^ Microsoft. "Windows 1256". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  20. ^ IBM. "SBCS code page information document CPGID 01256". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  21. ^ Microsoft. "Windows 1257". Archived from the original on 2013-03-16. Retrieved 2014-07-06.
  22. ^ IBM. "SBCS code page information document CPGID 01257". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  23. ^ Microsoft. "Windows 1258". Archived from the original on 2013-10-25. Retrieved 2014-07-06.
  24. ^ IBM. "SBCS code page information document CPGID 01258". Archived from the original on 2014-07-14. Retrieved 2014-07-06.
  25. ^ IBM. "SBCS code page information document - CPGID 00437". Archived from the original on 2016-06-09. Retrieved 2014-07-04.
  26. ^ "IBM-943 and IBM-932". IBM Knowledge Center. IBM. Archived from the original on 2018-08-18. Retrieved 2020-07-08.
  27. ^ "Converter Explorer: ibm-1373_P100-2002". ICU Demonstration. International Components for Unicode. Archived from the original on 2021-05-26. Retrieved 2020-06-27.
  28. ^ "Coded character set identifiers – CCSID 5471". IBM Globalization. IBM. Archived from the original on 2014-11-29.
  29. ^ Julliard, Alexandre. "dump_krwansung_codepage: build Korean Wansung table from the KSX1001 file". make_unicode: Generate code page .c files from ftp.unicode.org descriptions. Wine Project. Archived from the original on 2021-05-26. Retrieved 2021-03-14.
  30. ^ IBM. "SBCS code page information document - CPGID 00037". Archived from the original on 2014-07-14. Retrieved 2014-07-04.
  31. ^ Steele, Shawn (2005-09-12). "Code Page 21027 "Extended/Ext Alpha Lowercase"". MSDN. Archived from the original on 2019-04-06. Retrieved 2019-04-06.
  32. ^ a