공백 문자
Whitespace character컴퓨터 프로그래밍에서 공백은 타이포그래피에서 가로 또는 세로 공간을 나타내는 모든 문자 또는 일련의 문자다.렌더링할 때 공백 문자는 눈에 보이는 표시에 해당하지 않지만 일반적으로 페이지의 영역을 차지한다.예를 들어, 공통 공백 기호 U+0020 SPACE(역시 ASCII 32)는 텍스트의 빈 공간 구두점 문자를 나타내며, 서양 스크립트에서는 단어 구분자로 사용된다.
개요
키보드 레이아웃이 많은 경우 공백 문자를 입력할 수 있음수평 공백은 키보드로 입력될 수 있지만spacebar, 공간의 길이는 다를 수 있다.수직 공백은 대부분의 프로그램에서 '뉴라인' 코드 시퀀스를 만드는 를 입력하여 입력할 수 있다.오래된 키보드에서 이 키는 대신 라벨이 붙을 수 있으며, 전자 기계식 리턴을 왼쪽 정지(유니코드 문자 U+000D)로 생성하고 다음 선으로 이동(U+000A)하는 타이프라이터 키보드 캐리지 리턴 키의 홀드오버가 발생할 수 있다.많은 초기 컴퓨터 게임들은 화면을 그리기 위해 공백 문자를 사용했고(예: Kroz 왕국), 워드 프로세싱 소프트웨어는 그것들을 볼드, 언더라인, 취소선 같은 인쇄 효과를 내기 위해 사용했다.[citation needed]
"whitespace"라는 용어는 보통 종이에 등장인물의 외관을 바탕으로 한다.그러나, 애플리케이션 내에서 공백 문자는 다른 문자 코드와 동일한 방식으로 처리될 수 있으며, 다른 프로그램들은 문자에 대한 그들 자신의 의미를 정의할 수 있다.
유니코드
아래 표에는 유니코드 문자 데이터베이스에서 공백("WSPACE=Y", "WS") 문자로 정의된 25개의 문자가 나열되어 있다.[1]17은 양방향 작성 알고리즘("양방향 문자 유형=WS")과 일치하는 공백의 정의를 사용하며, "Bidi-WS" 문자로 알려져 있다.나머지 문자도 사용할 수 있지만 이러한 "비디" 유형은 아니다.
참고: 다음 표를 볼 때 사용하는 브라우저와 글꼴에 따라 모든 공간이 제대로 표시되지 않을 수 있다.
이름 | 코드 포인트 | 폭 상자 | 혹시 깨질까? | 인 IDN? | 스크립트 | 블록 | 일반 범주 | 메모들 | |
---|---|---|---|---|---|---|---|---|---|
성격표 | U+0009 | 9 | 네 | 아니요. | 공통의 | 기본 라틴어 | 기타 통제를 하다 | HT, 수평 탭.HTML/XML 명명 엔티티:	 , LaTeX: '\tab', C 탈출: '\t' | |
줄사료 | U+000A | 10 | 줄 바꿈 | 공통의 | 기본 라틴어 | 기타 통제를 하다 | LF, 라인 피드.HTML/XML 명명 엔티티:
 , C 탈출: '\n' | ||
줄표 | U+000B | 11 | 줄 바꿈 | 공통의 | 기본 라틴어 | 기타 통제를 하다 | VT, Vertical 탭.C탈출: '\v' | ||
사료를 만들다 | U+000C | 12 | 줄 바꿈 | 공통의 | 기본 라틴어 | 기타 통제를 하다 | FF, 폼 피드.C탈출: '\f' | ||
마차 반환 | U+000D | 13 | 줄 바꿈 | 공통의 | 기본 라틴어 | 기타 통제를 하다 | CR, 캐리지 리턴.C탈출: '\r' | ||
스페이스 | U+0020 | 32 | 네 | 아니요. | 공통의 | 기본 라틴어 | 구분 기호, 스페이스 | 가장 일반적(일반적인 ASCII 공간) | |
다음 줄 | U+0085 | 133 | 줄 바꿈 | 공통의 | 라틴어-1 보충하다 | 기타 통제를 하다 | NEL, 다음 줄 | ||
깨지지 않는 공간 | U+00A0 | 160 | 아니요. | 아니요. | 공통의 | 라틴어-1 보충하다 | 구분 기호, 스페이스 | 끊기지 않는 공간: U+0020과 동일하지만 선이 끊어질 수 있는 지점은 아니다.HTML/XML 명명 엔티티: ,  라텍스: '\' | |
오함 스페이스 마크 | U+1680 | 5760 | 네 | 아니요. | 오함 | 오함 | 구분 기호, 스페이스 | 오함 텍스트에서 단어 간 분리에 사용된다.일반적으로 수직 텍스트의 수직선 또는 수평 텍스트의 수평선이지만 "stemless" 글꼴의 공백일 수도 있다.오함 글꼴이 필요함. | |
사분면에 | U+2000 | 8192 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | 1엔의 폭.U+2002는 표준적으로 이 문자와 동일하며 U+2002가 선호된다. | |
엠 쿼드 | U+2001 | 8193 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | "머튼 쿼드"라고도 한다.1 em의 폭.U+2003은 표준적으로 이 문자와 동일하며 U+2003이 선호된다. | |
우주에서 | U+2002 | 8194 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | "너트"라고도 한다.1엔의 폭.U+2000 En Quad는 표준적으로 이 문자와 동일하며 U+2002가 선호된다.HTML/XML 명명 엔티티:  , LaTeX: '\enspace' | |
엠 스페이스 | U+2003 | 8195 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | "머튼"이라고도 한다.1 em의 폭.U+2001 Em Quad는 표준적으로 이 문자와 동일하며 U+2003이 선호된다.HTML/XML 명명 엔티티:  , LaTeX: '\quad' | |
em당 3개의 공간 | U+2004 | 8196 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | "thick space"라고도 한다.넓이의 3분의 1이다.HTML/XML 명명 엔티티:  | |
em당 4개의 공간 | U+2005년 | 8197 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | "중간 공간"이라고도 한다.넓이의 4분의 1이다.HTML/XML 명명 엔티티:  | |
em당 6개의 공간 | U+2006 | 8198 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | 넓이의 6분의 1이다.컴퓨터 타이포그래피에서, 때때로 U+2009와 동일시된다. | |
그림의 공간 | U+2007 | 8199 | 아니요. | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | 그림 공간.한 자리 숫자의 너비와 같은, 공백이 있는 글꼴에서.HTML/XML 명명 엔티티:  | |
구두점 공간 | U+2008 | 8200 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | 글꼴의 좁은 문장 부호만큼 넓음, 즉 마침표나 쉼표의 선행 폭.[2]HTML/XML 명명 엔티티:  | |
얇은 공간 | U+2009 | 8201 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | 얇은 공간; 5분의 1(때로는 6분의 1)의 넓이.SI 단위를 사용하여 수행된 조치의 경우 수천 개의 분리기로 사용할 것을 권장한다.U+2002~U+2008과 달리, 그 너비는 유형 설정에서 조정될 수 있다.[3]HTML/XML 명명 엔티티:  ,&ThinSpace , LaTeX: '\' | |
헤어 스페이스 | U+200A | 8202 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | 얇은 공간보다 얇다.HTML/XML 명명 엔티티:    (일부 브라우저에서 작동하지 않음) | |
선분리기 | U+2028 | 8232 | 줄 바꿈 | 공통의 | 일반 구두점 | 구분 기호, 선을 긋다 | |||
단락 구분자 | U+2029 | 8233 | 줄 바꿈 | 공통의 | 일반 구두점 | 구분 기호, 단락 | |||
좁고 깨지지 않는 공간 | U+202F | 8239 | 아니요. | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | 좁은 깨지지 않는 공간.U+00A0 No-Break Space와 기능 유사몽골어와 함께 사용할 때, 그것의 너비는 보통 공간의 3분의 1이다. 다른 맥락에서, 그것의 너비는 때때로 얇은 공간(U+2009)의 너비와 유사하다. | |
중간 수학적 공간 | U+205F | 8287 | 네 | 아니요. | 공통의 | 일반 구두점 | 구분 기호, 스페이스 | MMSP. 수학 공식에 사용된다.em의 18분의 [4]4수학적 타이포그래피에서 공간의 폭은 일반적으로 em의 18분의 1의 적분배수로 주어지며, 4/18 em은 여러 상황에서 사용될 수 있다.[5] 예를 들어 a와 + 사이, +와 b 사이에 +와 b 사이에 다음과 같이 명명된 실체:  | |
이데올로기적 공간 | U+3000 | 12288 | 네 | 아니요. | 공통의 | CJK 기호 그리고 구두점 | 구분 기호, 스페이스 | CJK 문자 셀(전체 폭)만큼 넓음.예를 들어, tai toue에서 사용된다. |
이름 | 코드 포인트 | 폭 상자 | 혹시 깨질까? | 인 IDN? | 스크립트 | 블록 | 일반 범주 | 메모들 | |
---|---|---|---|---|---|---|---|---|---|
몽골모음 분리기 | U+180E | 6158 | 네 | 아니요. | 몽골어 | 몽골어 | 기타 포맷 | MVS. 한 단어의 마지막 두 문자를 다른 모양으로 만들기 위해 몽골어로 사용되는 좁은 공간 문자.[6]이전 버전의 표준에도 있었지만 유니코드 6.3.0에서는 더 이상 공간 문자(즉, Zs 범주)로 분류되지 않는다. | |
0폭 공간 | U+200B | 8203 | 네 | 아니요. | ? | 일반 구두점 | 기타 포맷 | ZWSP, 너비가 0인 공간.명시적 간격을 사용하지 않는 스크립트를 사용할 때 텍스트 처리 시스템에 대한 단어 경계를 나타내는 데 사용된다.그것은 부드러운 하이픈과 유사하며, 후자는 음절 경계를 나타내기 위해 사용되며, 선이 끊어질 때 보이는 하이픈을 표시해야 한다.HTML/XML 명명 엔티티:​ [7][c] | |
0폭 비연속기 | U+200C | 8204 | 네 | 컨텍스트 종속[12] | ? | 일반 구두점 | 기타 포맷 | ZWNJ, 너비가 0인 비조인자.그렇지 않으면 연결될 두 문자 사이에 배치될 때 ZWNJ는 각각 최종 및 초기 형태로 인쇄되도록 한다.HTML/XML 명명 엔티티:‌ | |
제로 폭 조이너 | U+200D | 8205 | 네 | 컨텍스트 종속[13] | ? | 일반 구두점 | 기타 포맷 | ZWJ, 너비가 0인 조인자.그렇지 않으면 연결되지 않는 두 문자 사이에 배치될 때, ZWJ는 그것들이 연결된 형태로 인쇄되도록 한다.결합 양식을 분리하여 표시하는 데도 사용할 수 있다.(ZWNJ와는 달리) 기본적으로 결합이나 결막의 예상 여부에 따라 하나의 글리프로 대체(이모지 및 신할라에서와 같이)를 유도하거나 (데바나가리에서와 같이) 억제할 수 있다.HTML/XML 명명 엔티티:‍ | |
워드 조이너 | U+2060 | 8288 | 아니요. | 아니요. | ? | 일반 구두점 | 기타 포맷 | WJ, 단어 가입자.U+200B와 유사하지만 선이 끊어질 수 있는 지점은 아니다.HTML/XML 명명 엔티티:⁠ | |
0폭 비파괴 공간 | U+FEFF | 65279 | 아니요. | 아니요. | ? | 아랍어 프리젠테이션 양식-B | 기타 포맷 | 0 너비의 중단 없는 공간.주로 바이트 순서 표시로 사용된다.유니코드 3.2에서는 비차단 표시로 사용하는 것이 더 이상 사용되지 않으며 U+2060을 대신 참조하십시오. |
|
이미지 대체
유니코드는 또한 가시적 기호가 표시되어야 하는 상황에서 다양한 공백 문자를 나타내는 데 사용할 수 있는 가시적 문자를 제공한다.
코드 | 십진법 | 이름 | 블록 | 디스플레이 | 설명 |
---|---|---|---|---|---|
U+00B7 | 183 | 중간점 | 라틴-1 보충판 | · | 인터피티드 명명된 도면요소: · |
U+21A1 | 8609 | 아래쪽으로 두 개의 머리 화살표 | 화살표 | ↡ | ECMA-17 / 폼 피드용 ISO 2047 기호(페이지 구분)[15] |
U+2261 | 8810 | 와 동일하다. | 수학적 연산자 | ≡ | 다른 용도 중, 라인 피드를[15] 위한 ECMA-17 / ISO 2047 기호 |
U+237D | 9085 | 쐐기형 열린 상자 | 기타 기술 | ⍽ | NBSP를 나타내는 데 사용됨 |
U+23CE | 9166 | 반송 기호 | 기타 기술 | ⏎ | 줄 바꿈에 들어가는 리턴 키 기호 |
U+2409 | 9225 | 수평표기호 | 사진 제어 | ␉ | 탭 문자의 대체 항목 |
U+240A | 9226 | 라인 피드 기호 | 사진 제어 | ␊ | 라인 피드의 대체품 |
U+240B | 9227 | 수직표기호 | 사진 제어 | ␋ | 세로 탭 대체품(라인 탭) |
U+240C | 9228 | 폼 피드 기호 | 사진 제어 | ␌ | 양식 피드의 대체 요소(페이지 구분) |
U+240D | 9229 | 캐리지 리턴 기호 | 사진 제어 | ␍ | 캐리지 리턴의 대체품 |
U+2420 | 9248 | 공간 기호 | 사진 제어 | ␠ | ASCII 공간의 대체 요소 |
U+2422 | 9250 | 빈 기호 | 사진 제어 | ␢ | 단어 구분 기호로서 BCDIC,[16] EBCDIC,[16] ASCII-1963[16][17] 등에 사용되는 "대체 빈칸"[16]이라고 한다. |
U+2423 | 9251 | 개봉함 | 사진 제어 | ␣ | 적어도 1980년대 이후 공간 문자 수를 명시적으로 표시해야 할 때(예: 펜과 종이로 프로그래밍할 때) 블록 문자 필기에 사용된다.모둘라-2의 교과서(1982년, 1984년, 1985년, 1988년 Springer-Verlag에 의해 출판됨)에서 사용되며,[18] 우주 코드에 명시적인 표시가 필요한 프로그래밍 언어다.Texas Instruments의 TI-8x 시리즈 그래프 계산기의 키패드에도[n 1] 사용된다. 명명된 도면요소: ␣ |
U+2424 | 9252 | 뉴라인 기호 | 사진 제어 |  | 줄 바꿈의 대체품 |
U+25B3 | 9651 | 화이트 업포인트 삼각형 | 기하학적 형상 | △ | ASCII 공간에[15] 대한 ECMA-17 / ISO 2047 기호 |
U+2A5B | 10843 | 논리 또는 중간 줄기가 있는 경우 | 보충적 수학적 연산자 | ⩛ | 다른 용도 중, 수직 탭을 위한 ECMA-17 / ISO 2047 기호(라인 탭)[15] |
U+2AAA | 10922 | 보다 작음 | 보충적 수학적 연산자 | ⪪ | 다른 용도 중, 캐리지 리턴을[15] 위한 ECMA-17 / ISO 2047 기호가 있음 |
U+2AB | 10923 | 보다 큼 | 보충적 수학적 연산자 | ⪫ | 다른 용도 중, 탭 문자에[15] 대한 ECMA-17 / ISO 2047 기호 |
U+3037 | 12343 | 이데오그래픽 전신선 피드 구분 기호 | CJK 기호 문장 부호 | 〷 | 중국어 전신 코드의 코드 9999에 사용된 그래픽으로 라인 피드를 나타냄 |
- ^ 0 '0' 또는 '('0'''
- 정확한 공간
- 케임브리지 Z88은 운영 체제의 디스플레이 드라이버에 의해 "…"로 표시되는 특별한 "정확한 공간"(코드 포인트 160 aka 0xA0)(키 바로 가기 +로 표시 가능)을 제공했다.SPACE[19][20][21]따라서 BBC BASIC과 연계하여 "점 스페이스"로도 알려져 있었다.[20][21]
- 코드 포인트 224 (0xE0)에서 컴퓨터는 또한 특별한 3문자 셀 와이드 SPACE 기호(유니코드의 단일 셀 와이드 U+2420과 아날로그)를 제공했다.[20][21]
공백이 아닌 공백
- 점자 패턴 유니코드 블록은 U+2800 ⠀ 점자 패턴 블랭크(HTML ⠀)를 함유하고 있으며 점자는 돌출되지 않는다.일부 글꼴은 문자를 고정 너비 빈칸으로 표시하지만 유니코드 표준에는 공백으로 작용하지 않는다고 명시되어 있다.[22]
- 유니코드의 한국어 알파벳 커버리지에는 몇 개의 코드 포인트가 포함되어 있는데, 이는 글자가 없음을 나타내므로 다음과 같은 글립자를 표시하지 않는다.
- 유니코드는 한글 호환성 자모 블록(U+3164 ㅤ 한글 주입구(HTML ㅤ)에 한글 주입구 문자를 포함한다.이것은 문자로 분류되지만, 자모가 없는 한글 블록처럼 빈 공간으로 표시된다.KS X 1001 한글에 서열을 결합하여 도입하거나 위치에 문자가 없음을 나타내지만 유니코드의 결합 자모 시스템에서는 사용하지 않는다.[23]
- Unicode's combining jamo system uses similar Hangul Choseong Filler and Hangul Jungseong Filler characters to denote the absence of a letter in initial or medial position within a syllable block, which are included in the Hangul Jamo block (U+115F ᅟ HANGUL CHOSEONG FILLER (HTML ᅟ), U+1160 ᅠ HANGUL JUNGSEONG FILLER (HTML ᅠ)).[24]
- 또한 전각 문자 한글 필러는 전각 문자와 Fullwidth 형태(U+FFA0 ᅠ HALFWIDTH HANGUL FILLER(HTMLᅠ.))에, 때 둘 다 Johab(또는 Wansung)과 N-byte 한글(또는 그 ExtendedBinaryCodedDecimalInterchangeCode상대)에서 IBM-933는 Johab과 EBCDIC공백 포함과 같은 캐릭터들을 포함한 인코딩에서 매핑 사용하다 포함되어 있다.[25][26]
화이트스페이스 및 디지털 타이포그래피
화면 디스플레이
텍스트 편집기, 워드프로세서, 데스크탑 퍼블리싱 소프트웨어는 화면의 공백을 나타내는 방법과 화면이나 열 너비보다 긴 줄 끝에 있는 공간을 표현하는 방법이 다르다.어떤 경우에, 공간은 단순히 빈 공간으로 보여지고, 어떤 경우에는 중간 또는 다른 기호로 표현될 수 있다.공백 생성에는 여러 가지 다른 문자(아래 설명)를 사용할 수 있으며, 문자 이외의 함수(여백 및 탭 설정 등)도 공백에 영향을 줄 수 있다.
가변 폭의 범용 공간
컴퓨터 문자 인코딩에는 일반적인 범용 공간(유니코드 문자 U+0020)이 있는데, 그 넓이는 서체 설계에 따라 달라진다.일반적인 값은 1/5 em에서 1/3 em까지 다양하다(디지털 타이포그래피에서 em은 글꼴의 공칭 크기와 같기 때문에 10 포인트 글꼴의 경우 공간은 아마도 2-3.3 포인트 사이일 것이다).정교한 글꼴은 굵게, 기울임꼴, 작은 캡의 면에 대해 크기가 다를 수 있으며, 종종 합성자는 텍스트의 크기와 중요도에 따라 공간의 폭을 수동으로 조정한다.
이 범용 공간 외에도 특정 폭의 공간을 인코딩할 수 있다.전체 목록은 아래 표를 참조하십시오.
대시 주위의 헤어 스페이스
괄호 분할자로 사용되는 전자 대시와 단어 결합자로 사용될 때 대시는 일반적으로 텍스트와 함께 연속적으로 설정된다.[27]그러나 그러한 대시(dash)는 선택적으로 머리카락 공간, U+200A, 또는 얇은 공간인 U+2009로 둘 수 있다.머리 공간은 숫자 문자 참조를 사용하여 HTML로 쓸 수 있다.  
또는 
또는 명명된 도면요소 
그러나 2016년 현재 브라우저에서는 아직 보편적으로 지원되지 않는다.[update][which?]씬 공간의 이름을 엔티티로 지정함 
및 숫자 참조 
또는 
. 이 공간들은 보통 공간보다 훨씬 얇으며(단일 공간(비비례적) 글꼴은 제외), 머리카락 공간은 둘 중 더 얇다.
전자파 대시 포함 일반 공간 | 왼쪽 — 오른쪽 |
---|---|
전자파 대시 기능이 있는 씬 공간 | 왼쪽 — 오른쪽 |
엠 대시(em dash)가 있는 헤어 공간 | 왼쪽 — 오른쪽 |
Em 대시 포함 공간 없음 | 왼쪽—오른쪽 |
컴퓨터 응용 프로그램
프로그래밍 언어
프로그래밍 언어 구문에서는 토큰을 명시적으로 분리하기 위해 공백이 자주 사용된다.대부분의 언어에서 다중 공백 문자는 하나의 공백 문자(따옴표로 묶인 문자열의 바깥쪽)와 동일하게 취급된다. 이러한 언어를 자유 형식이라고 한다.Haskell, occam, ABC, Python을 포함한 몇몇 언어에서, 공백과 들여쓰기는 구문학적 목적으로 사용된다.Whitespace라고 불리는 풍자 언어에서, 공백 문자는 프로그래밍에 유효한 유일한 문자인 반면, 다른 문자는 무시된다.
과도한 공백 사용, 특히 줄 끝에 있는 공백 후행은 성가신 것으로 간주된다.그러나 공백을 올바르게 사용하면 코드를 읽기 쉽고 그룹 관련 논리를 쉽게 읽을 수 있다.
대부분의 언어는 ASCII 문자만 공백으로 인식하거나 경우에 따라 유니코드 새 줄만 인식하지만 위에 나열된 문자의 대부분은 인식하지 못한다.C 언어는 공백 문자를 "공간, 수평 탭, 새 줄, 수직 탭 및 폼 피드"[28]로 정의한다.HTTP 네트워크 프로토콜은 상태 라인의 공간 문자만, 줄의 끝에 있는 CRLF, 헤더 값의 "선형 공백"과 같이 프로토콜의 다른 부분에서 다른 유형의 공백을 사용하도록 요구한다.[29]
명령줄 사용자 인터페이스
명령 프로세서에 의해 처리되는 명령에서, 예를 들어 스크립트와 입력에서 공간 문자는 명령이나 파라미터의 일부로서 또는 파라미터나 이름 구분자의 두 가지 가능한 기능을 가지고 있기 때문에 문제를 일으킬 수 있다.내포된 공간을 금지하거나 따옴표 문자 사이에 공백이 포함된 이름을 둘러싸는 방법으로 모호성을 방지할 수 있다.
마크업어군
SGML과 같은 일부 마크업 언어는 공백이 쓰여진 대로 보존된다.
XML과 HTML과 같은 웹 마크업 언어는 프로그래머들의 편의를 위해 스페이스 문자를 포함한 공백 문자를 특별히 취급한다.이러한 마크업 언어의 디스플레이 타임 프로세서를 준수하여 읽은 하나 이상의 공간 문자는 의미 문맥에 따라 0 또는 1 공간으로 축소된다.예를 들어, 텍스트 내의 이중(또는 그 이상) 공백은 하나의 공백으로 축소되고, "의 양쪽에 나타나는 공백은 "=
속성 이름과 해당 값을 구분하는 "은 문서의 해석에 영향을 미치지 않는다.요소 끝 태그는 후행 공백을 포함할 수 있으며, XML의 빈 요소 태그는 "" 이전의 공백을 포함할 수 있다./>
". 이러한 언어에서 불필요한 공백은 파일 크기를 증가시키므로 네트워크 전송 속도가 느려질 수 있다.반면에, 불필요한 공백은 또한 눈에 띄지 않게 코드를 표시할 수 있는데, 코드의 코멘트와 유사하지만 코드의 코멘트보다 덜 명백하다.이는 복사하여 붙여넣기함으로써 저질러진 라이선스나 저작권의 침해를 증명하는 것이 바람직할 수 있다.
XML 속성 값에서 공백 문자의 시퀀스는 파서가 문서를 읽을 때 단일 공백으로 처리된다.[30]XML 요소 내용의 공백은 파서에 의해 이런 방식으로 변경되지 않지만 파서로부터 정보를 수신하는 애플리케이션은 요소 내용에 유사한 규칙을 적용하도록 선택할 수 있다.XML 문서 작성자는 다음을 사용할 수 있다.xml:space="preserve"
요소의 속성을 분석기에 지시하여 다운스트림 적용이 해당 요소의 내용에서 공백을 변경하지 않도록 한다.
대부분의 HTML 요소에서 공백 문자 시퀀스는 단어간 구분자로 취급되며, 일반적으로 단어 사이에 공백을 삽입하는 언어로 텍스트를 렌더링할 때 단일 공백 문자로 나타날 수 있다.[31]HTML 렌더러를 준수하는 것은 다음과 같은 몇 가지 규정된 요소 내에서 공백의 보다 리터럴한 처리를 적용하기 위해 필요하다.pre
태그 및 CSS를 적용하기 위해 사용된 요소pre
-공백 처리 방식.그러한 요소에서 공백 문자는 단어간 구분자로 "접속"되지 않을 것이다.
XML과 HTML 모두에서, 비침해 공간 문자는 다른 비'표준' 공간과 함께 접을 수 있는 "whitespace"로 취급되지 않기 때문에 위의 규칙의 적용을 받지 않는다.
파일 이름
이러한 용도는 내장된 공간 코드로 인해 혼동되는 운영 체제 및 응용 프로그램에 대해 작성된 다중 단어 파일 이름과 유사하다. 이러한 파일 이름은 대신 as_in_this_phase라는 단어 구분 기호로 밑줄(_)을 사용한다.
또 다른 그러한 기호는 U+2422 ␢ BLACK SIVAL이었다.이것은 컴퓨터 프로그래밍 초기에 코딩 양식에 글을 쓸 때 사용되었다.키펀치 운영자들은 즉시 이 기호를 "명확한 공간"[16]으로 인식했다.BCDIC,[16] EBCDIC,[16] ASCII-1963에서 사용되었다.[16]
참고 항목
참조
- ^ "The Unicode Standard". Unicode Consortium.
- ^ "Character design standards – space characters". Character design standards. Microsoft. 1998–1999. Archived from the original on August 23, 2000. Retrieved 2009-05-18.
- ^ 유니코드 표준 5.0, 인쇄판, 페이지 205
- ^ "General Punctuation" (PDF). The Unicode Standard 5.1. Unicode Inc. 1991–2008. Retrieved 2009-05-13.
- ^ Sargent, Murray III (2006-08-29). "Unicode Nearly Plain Text Encoding of Mathematics (Version 2)". Unicode Technical Note #28. Unicode Inc. pp. 19–20. Retrieved 2009-05-19.
- ^ Gillam, Richard (2002). Unicode Demystified: A Practical Programmer's Guide to the Encoding Standard. Addison-Wesley. ISBN 0-201-70052-2.
- ^ a b Hickson, Ian. "12.5 Named character references". HTML Standard. WHATWG.
- ^ Wolfram. "\[NegativeThickSpace]". Wolfram Language Documentation.
- ^ Wolfram. "\[NegativeMediumSpace]". Wolfram Language Documentation.
- ^ Wolfram. "\[NegativeThinSpace]". Wolfram Language Documentation.
- ^ Wolfram. "\[NegativeVeryThinSpace]". Wolfram Language Documentation.
- ^ Faltstrom, P., ed. (August 2010). "Zero Width Non-Joiner". The Unicode Code Points and Internationalized Domain Names for Applications (IDNA). IETF. sec. A.1. doi:10.17487/RFC5892. RFC 5892. Retrieved September 4, 2019.
- ^ Faltstrom, P., ed. (August 2010). "Zero Width Joiner". The Unicode Code Points and Internationalized Domain Names for Applications (IDNA). IETF. sec. A.2. doi:10.17487/RFC5892. RFC 5892. Retrieved September 4, 2019.
- ^ "Unicode Standard Annex #44, Unicode Character Database".
- ^ a b c d e f European Computer Manufacturers Association (1968-11-28). Graphic Representation of the Control Characters of the ECMA 7-Bit Coded Character Set for Information Interchange (PDF). ECMA-17.
- ^ a b c d e f g h Mackenzie, Charles E. (1980). Coded Character Sets, History and Development. The Systems Programming Series (1 ed.). Addison-Wesley Publishing Company, Inc. pp. 41, 47, 52, 102–103, 117, 119, 130, 132, 141, 148, 150–151, 212, 424. ISBN 978-0-201-14460-4. LCCN 77-90165. Retrieved 2016-05-22. [1]
- ^ "American Standard Code for Information Interchange, ASA X3.4-1963". American Standards Association (ASA). 1963-06-17.
- ^ 니클라우스 위스, 모둘라-2의 프로그래밍
- ^ "Cambridge Z88 User Guide". 4.7 (4th ed.). Cambridge Computer Limited. 2016 [1987]. Basic concepts - The keyboard. Archived from the original on 2016-12-12. Retrieved 2016-12-12.
- ^ a b c "Cambridge Z88 User Guide". 4.0 (4th ed.). Cambridge Computer Limited. 1987. Appendix D. Archived from the original on 2016-12-12. Retrieved 2016-12-12.
- ^ a b c "Cambridge Z88 User Guide". 4.7 (4th ed.). Cambridge Computer Limited. 2015 [1987]. Appendix D. Archived from the original on 2016-12-12. Retrieved 2016-12-12.
- ^ 유니코드 차트 U+2800, 점자 패턴
- ^ Chung, Jaemin (2017-03-30). Proposal to add an informative note to U+3164 HANGUL FILLER (PDF). Unicode Consortium. UTC L2/17-081.
- ^ Hangul Jamo (PDF). Unicode Consortium. 2020-10-25.
- ^ "ibm-933_P110-1995". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ "ibm-933_P110-1995 (lead bytes 0E84)". ICU Demonstration - Converter Explorer. International Components for Unicode.
- ^ 다양한 대시 유형의 사용은 예를 들어, § 6.80, 6.83–6.86의 시카고 매뉴얼에 설명되어 있다.
- ^ http://www.open-std.org/jtc1/sc22/wg14/www/docs/n1548.pdf 섹션 6.4, 단락 3
- ^ Fielding, R.; et al. (June 1999), "2.2 Basic Rules", Hypertext Transfer Protocol—HTTP/1.1, RFC 2616
- ^ "3.3.3 Attribute-Value Normalization". Extensible Markup Language (XML) 1.0 (Fifth Edition). World Wide Web Consortium.
- ^ "9.1 Whitespace". W3CHTML 4.01 Specification. World Wide Web Consortium.