Language/Python

Python - 문자열(str)/바이트(bytes) 시퀀스와 인코딩(encoding)/디코딩(decoding)

TechNote.kr 2019. 11. 28. 23:26
728x90

문자열(str) :

사람이 인지 가능한 문자의 형태.

Python에서는 유니코드 문자를 기반으로 문자열 표시.

(유니코드 문자를 나타내는 하나하나의 문자의 단위 원소를 코드 포인트라고 함.)

 


바이트(bytes) 시퀀스 :

기계가 처리하는 문자의 형태.

문자를 표현하는 실제 바이트. 

 


인코딩(encoding) :

유니코트 문자로 표현되는 문자열을 바이트 시퀀스로 변환

 

디코딩(decoding) :

바이트 시퀀스를 유니코드 문자로 변환

 

 

 

 

728x90