프로그래머가 작성한 소스 프로그램(또는 소스 파일)은 텍스트 파일(text file)로 저장
1. 텍스트 문자는 아스키코드로 저장
- 컴퓨터는 1,0 만을 저장하므로 문자는 미리 정의된 2진 비트(코드)로 표현
2. 한글의 경우는 유니코드로 저장
컴퓨터 시스템 내부의 정보 (디스크 파일, 메모리상의 데이터)는 모두 동일하게 비트로 표시
- 해석하는 내용(context)에 의해 구분
- 정수, 부동소수, 문자열
<ASCII코드와 유니코드의 차이점>
ASCII코드
- American Standard Code for Information Interchange
- 미국에서 표준화한 정보교환용 7비트 부호체계
- 000부터 127까지 총 128개의 부호가 사용
- 1영문/숫자 1글자는 1바이트
- 컴퓨터 초창기부터 사용되어 왔기에, 호환성이 아주 좋다.
Unicode
- 31 비트 코드, 대부분 21비트로 표현
- 한글/한자 1글자는 2바이트
- 웹페이지를 유니코드로 만들 때에는 UTF-8 유니코드를 사용한다. (만약 UTF-8 유니코드는 아스키 코드와 영문 영여게서 100프로 호환된다. 만약 UTF-8 유니코드 문서에 한글 등이 전혀 없고, 영문과 숫자로만 이루어졌다면 그파일은 아스키코드와 동일함.)
'Computer Structure > 컴퓨터 시스템' 카테고리의 다른 글
컴파일 시스템 동작 이해 (0) | 2019.09.26 |
---|---|
컴파일 시스템(Compile System) (0) | 2019.09.26 |
기계어 변환 (0) | 2019.09.25 |
컴퓨터 시스템의 구성 (0) | 2019.09.25 |
Processor VS Process (0) | 2019.09.25 |