바이너리(Binary)
2진법을 의미하며 1과 0만을 사용하는 수를 나타내는 진법입니다.
그리고 컴퓨터는 데이터를 2진법을 사용해 저장하고 사용합니다.
비트(Bit)와 바이트(Byte)
컴퓨터의 연산장치는 2진수 체계(바이너리)로 연산합니다.
2진수의 0 혹은 1 하나의 수를 비트(Bit)라고 하고
8개의 비트를 모은 것, 즉 8자리의 2진값을 바이트(Byte)라고 하빈다
컴퓨터는 바이트를 최소 단위로 하여 2진수를 처리(전송, 연산, 저장 및 호출)합니다.
✅ 이해를 돕기 위한 예시:
숫자 3은 2진수로 나타내면 11, 즉 2자리 수(2비트)이지만 실제로 컴퓨터 내에서는 최소 1바이트, 즉 8자리 2진값 00000011로 간주됩니다.
다양한 자료(데이터)의 표현
1바이트에는 0부터 255(00000000부터 11111111)까지 2의 8승 개의 값을 저장할 수 있습니다.
255보다 큰 수를 저장하고 싶다면?
바이트의 수를 늘리면 됩니다. 2바이트는 16비트이므로 2의 16승 개의, 즉 0부터 65,535까지의 수를 나타낼 수 있습니다.
음수는 어떻게 나타낼까?
음수는 2의 보수로 표현합니다. 2의 보수는 조금 어려울 수도 있는데, 반드시 이해하거나 기억해야 하는 부분은 아닙니다. 그냥 이러한 방법이 있구나 정도로만 보고 넘어가도 됩니다.
2의 보수를 구하는 방법은 각 비트의 0을 1로, 1을 0으로 바꾼 후 1을 더해주면 됩니다.
✅ 이해를 돕기 위한 예시:
00000001의 2의 보수를 구하는 방법은 아래와 같습니다.
1) 0을 1로, 1을 0으로 바꿈.. : 11111110 2) 1을 더해줌............... : 11111111
이런 이상한 방식으로 표현하는 이유는 컴퓨터가 연산을 쉽게 하기 위해서입니다. 이 방식으로 음수를 표현하면 음수와 음수, 혹은 음수와 양수 간의 덧셈뺄셈을 간편하게 할 수 있습니다.
(-1) + (-1) 은 11111111(8비트) + 11111111(8비트) 으로 표현할 수 있고 이것을 그냥 2진수로 간주하여 값을 더하면 111111110(9비트)가 됩니다. 한자리가 늘어났죠. 현재 1바이트(8비트)를 기준으로 연산을 하고 있으므로 이 늘어난 가장 앞자리 비트를 무시해버리면 11111110(8비트)가 되고 이 값은 -2를 나타내는 값이 됩니다.
이 방식을 사용하면 첫번째 자리의 값은 양수인 경우 언제나 0, 음수인 경우 언제나 1이 되는 특징이 있습니다.
문자는 어떻게 나타낼까?
문자와 숫자 사이 변환 값을 약속해 놓고 문자를 수로써 저장하고 읽어옵니다.
가장 처음 만들어진 인코딩*인 ASCII코드 (아스키) 테이블을 예로 들어 살펴봅시다.
인코딩
어떤 정보를 특정한 규칙에 따라 변환하는 과정을 말합니다. 예를 들어, 텍스트 정보를 컴퓨터가 이해할 수 있는 이진 코드로 변환하는 것이 '인코딩' 과정이라고 할 수 있습니다.
디코딩
인코딩된 정보를 다시 원래의 형태로 변환하는 과정을 말합니다.
ASCII 테이블은 0부터 127까지 수를 사용해 영문 대소문자와 문장부호, 몇몇 특수 문자를 가지고 있습니다.
✅ 이해를 돕기 위한 예시:
a를 ASCII로 저장하면 위 테이블에 따라 숫자 97에 해당하는 1바이트 2진수 01100001가 저장됩니다.
위 테이블에 없는 문자나 기호(한글및 외래어나 특수문자)를 저장하려면 ASCII가 아닌 다른 방식을 통해서 문자를 2진수로 변경하여 저장할 수 있습니다. 대표적으로 Unicode 방식이 있습니다.
* 여러가지 문자열 인코딩 종류 : ASCII, UNICODE, ANSI, EUC-KR, MS949, UTF-8 ... 등등
지금까지 우리는 양수, 음수 그리고 문자를 컴퓨터가 어떻게 2진법으로 표현하는 지를 배웠는데요,
컴퓨터는 01100001이 ASCII로 a를 나타내는지 숫자 97을 나타내는지, 11111111이 양수 127을 나타내는지 음수 -1을 나타내는지, 0000001 0000001이 2바이트로 저장된 257인지 아니면 1바이트로 저장된 1과 또다른 1을 나타내는지 어떻게 구별 할 수 있을까요?
이를 알려 주는 것이 자료형입니다.
자료형(데이터 타입)
자료형(Data Type 혹은 Type)이란 컴퓨터에 저장된 2진수를 어떻게 해석해야 하는지를 나타내는 방법
자료형보다는 타입이라는 말로 더많이 쓰입니다.
✅ 이해를 돕기 위한 예시:
다음과 같은 가상의 4바이트 메모리가 있습니다. 0이나 1을 32개까지 담을 수 있습니다.
00000000 00000000 00000000 00000000
이 메모리에 'abcd'라는 데이터를 ASCII타입으로 기록해 봅시다. 2진수로 97, 98, 99, 100가 각 바이트에 기록됩니다.
01100001 01100010 01100011 01100100
메모리가 꽉차버렸습니다. 근데 위 메모리를 보면.. ASCII를 기록했다는 표시가 어디에도 없죠.
이처럼 메모리에는 데이터의 형식을 기록하지 않습니다. 이 말은 컴퓨터가 이 데이터를 읽어올 때 해당 데이터를 알맞게 해석해야 한다는 뜻입니다.
이를 위해 프로그래밍 언어에는 자료형이 존재하고 각 자료형은 바이트의 길이가 지정되어 있습니다.
즉 프로그램은 타입을 사용해서 메모리의 값을 해석합니다.
'STUDY > for Developer' 카테고리의 다른 글
[IT] 진수 계산법 (0) | 2023.11.16 |
---|---|
[POSTMAN] 파일전송 테스트 하기 (0) | 2023.11.02 |
[Wireshark] 패킷 분석 툴 와이어샤크 사용방법 (0) | 2023.10.18 |
[Wireshark] failed to set hardware filter to promiscuous mode 에러 (0) | 2023.10.16 |
[POSTMAN] 포스트맨 SSL Error 해결방법 (0) | 2023.10.13 |