CS/컴퓨터 구조

[컴퓨터 구조] 2-2 0과 1로 문자를 표현하는 방법

서니션 2024. 5. 9. 13:36
728x90
반응형
이 글을 혼자 공부하는 컴퓨터구조 + 운영체제 (한빛미디어) 책을 읽고 혼자 공부한 내용입니다.
잘못 이해한 부분이 있을 수 있고, 문제가 있는 부분 댓글로 알려주시면 수정하겠습니다.

 

문자 집합과 인코딩

 

컴퓨터가 인식하고 표현할 수 있는 문자의 모음이 문자 집합

문자를 0과 1로 변환해야 비로소 컴퓨터가 이해할 수 있고, 이 과정이 문자 인코딩

인코딩의 반대, 즉 0과 1로 이루어진 문자 코드를 사람이 이해할 수 있는 문자로 변환하는 과정은 문자 디코딩


아스키 코드

 

초창기 문자 집합 중 하나로, 영어 알파벳과 아라비아 숫자, 그리고 특수 문자를 포함

8비트 중 1 비트는 패리티 비트(오류 검출을 위해 사용되는 비트)이기 때문에 7비트만 사용

 

한글을 표현 못함


EUC-KR

 

완성형 인코딩 방식 : 초성, 중성, 종성의 조합으로 이루어진 완성된 하나의 글자에 고유한 코드를 부여하는 인코딩 방식

조합형 인코딩 방식 : 초성을 위한 비트열, 중성을 위한 비트열, 종성을 위한 비트열을 할당하여 그것들의 조합으로 하나의 글자 코드를 완성하는 인코딩 방식

 

2,350개 정도의 한글 단어를 표현 가능 (많은건 아님)


유니코드와 UTF-8

 

유니코드는 여러 나라의 문자를 광범위하게 표현할 수 있는 통일된 문자 집합

유니코드의 부여된 값 == 유니코드 코드 포인트

728x90
반응형