본문 바로가기

이론/컴퓨터 구조

데이터) 0과 1로 숫자 / 문자를 표현하는 방법

728x90
반응형

정보단위

bit(비트):

  • 0과 1을 표현하는 가장 작은 정보 단위
  • 2^n가지의 정보 표현 가능
1byte 8bit
1kB 1,000byte
1MB 1,000kB
1GB 1,000MB
1TB 1,000GB

c.f) 이전 단위를 1024개씩 묶은 단위는 kiB, MiB, GiB, ...

 

워드(word)

  • CPU가 한 번에 처리할 수 있는 정보의 크기 단위

 

이진법: 0과 1로 숫자 표현하기

  • 숫자가 1을 넘어가는 시점에 자리올림
    • 1 = 1
    • 2 = 10
    • 3 = 11
    • 4 = 100
    • 5 = 101
    • 5 = 110
    • 0b1000
  • 보수 표현하기: 모든 0과 1을 뒤집고 1을 더한 값
    • 1 1
    • 0 0
    • 0 1

 

16진법

  • 숫자가 15를 넘어가는 시점에 자리올림

  • ox15

 

이진수 => 16진수 변환

 

16진수 => 이진수

 

문자 집합과 인코딩

  • 문자 집합: 컴퓨터가 이해할 수 있는 문자의 모음
  • 인코딩: 코드화하는 과정, 문자를 0과 1로 이루어진 문자 코드로 변환
  • 디코딩: 코드를 해석하는 과정, 0과 1로 표현된 문자 코드로 변환

아스키 코드: 7비트로 하나의 문자 표현 (1비트는 오류 검출을 위해 사용되는 parity bit)

 

한글 인코딩: 완성형 vs 조합형 인코딩

  • 알파벳을 이어 쓰면 단어가 되는 영어와 반면에 한글은 조합이 필요함
  • 완성형 / 조합형 두 가지 방법이 있음

EUC - KR

  • 완성형 인코딩
  • 글자 하나 하나에 2바이트 크기의 코드 부여 (2byte == 16bit = 4자리 16진수)

utf - 8

  • 유니코드
  • 통일된 문자 집합
728x90
반응형