lroot 2022. 5. 16. 17:09
728x90
반응형

문자도 정수로 표현

- 어떤 문자를 컴퓨터 내부에서 표현하기 위해 특정 정수 값을 정의

- A는 65 (ex. A->65(인코딩) 65->A(디코딩)

- 문자세트 : 각 문자를 얼마로 표현할 것인지 코드 값을 모아둔 것을 문자세트(character set)라 함

ex. ASCII, EUC-KR, UTF-8, UTF-16

 

참고

character set : 문자를 숫자로 변환한 값의 세트

encoding : 문자가 숫자로 변환되는 것

ASCIICODE : 알파벳과 숫자 특수 문자등을 1바이트에 표현하는데 사용하는 문자세트

UNICODE : 전 세계 표준으로 만든 문자 세트

UTF-8 : 1바이트에서 4바이트까지 다양하게 문자를 표현할 수 있음

UTF-16 : 2바이트로 문자를 표현

 

자바에서의 문자 표현

- 자바는 문자를 나타내기 위해 전세계 표준인 UNICODE를 사용

- UTF-16 인코딩을 사용(모든 문자를 2바이트로 표시)

 

문자형 변수 선언과 사용

- 문자를 위한 데이터 타입 char ch = 'A';

- 내부적으로 숫자로 표현되므로 숫자를 넣어도 문자가 출력될 수 있음 

ex. char ch2 = 66;

 

주의

'A' : 문자, char

"A" : 문자, string

 

예제)

public class CharacterTest {

public static void main(String args[]) {

char ch1 = 'A';
System.out.println(ch1);
System.out.println((int)ch1);

char ch2 = 66;
System.out.println(ch2);
System.out.println((char)ch2);
System.out.println((int)ch2);

int ch3 = 67;
System.out.println(ch3);
System.out.println((char)ch3);

         }
}