프로그램(Program)
- 컴퓨터에서 실행할 수 있는 파일을 통칭.
- 아직 파일을 실행하지 않은 상태. 정적인 상태.
- 일반적으로 프로그램은 하나 이상의 프로세스를 갖고, 하나의 프로세스는 반드시 하나 이상의 스레드를 가짐.
프로세스(Process)
- 프로그램이 돌아가고 있는 상태. 즉, 컴퓨터에서 작업 중인 프로그램.
- 메모리에 올라와 CPU 자원을 할당받아 실행되고 있는 프로그램의 인스턴스(독립적인 개체)
- 운영체제로부터 시스템 자원을 할당받는 작업의 단위
- 할당받는 시스템 자원의 예
- CPU 시간
- 운영되기 위해 필요한 주소 공간
- Code, Data, Stack, Heap 구조로 되어 있는 독립된 메모리 영역
- 할당받는 시스템 자원의 예
프로세스 특징
- 각각 독립된 메모리 영역(Code, Data, Stack, Heap)을 할당받는다.
- Code
- 실행할 프로그램의 코드 저장
- CPU는 코드 영역에 저장된 명령어들을 하나씩 처리.
- Data
- 코드에서 선언한 전역 변수와 정적 변수가 저장되는 영역.
- 코드가 실행되면서 사용하는 변수나 파일들의 자원을 모아놓음.
- Stack
- 프로세스에서 순간적으로 처리해야
- 호출한 함수가 종료되면 되돌아올 메모리의 주소, 함수 안에 선언된 지역 변수, 매개변수, 리턴 값 등이 저장됨.
- 함수 호출 시 해당 정보들을 기록(push)하고, 종료되면 제거(pop)한다. 이를 위해 LIFO(Last In First Out) 메커니즘을 사용하는 stack 자료구조 사용.
- 메모리의 높은 주소에서 낮은 주소로 할당되는 방식으로 사용됨.
- 컴파일 시점에 크기 결정. 무한하게 할당할 수 없다(스택 깊이에 대한 제한 조건 존재).
- stack 영역 초과 시 stack overflow 에러 발생.
- 스레드별로 소유 => 독립적인 함수 호출이 가능
독립적인 함수 호출 = 독립적인 실행 흐름을 소유.
- Heap
- 동적으로 할당되는 데이터 저장
- 프로그래머가 직접 공간을 할당, 해제하는 메모리 공간
- 런타임에 크기가 결정
- FIFO(First In First Out)
- 메모리의 낮은 주소에서 높은 주소로 할당
- Code
- 기본적으로 프로세스 당 최소 1개의 스레드(메인 스레드)를 갖는다.
- 각 프로세스는 별도의 주소 공간에서 실행되며, 한 프로세스는 다른 프로세스의 변수나 자료구조에 접근 불가하다.
- 한 프로세스가 다른 프로세스의 자원에 접근하려면 프로세스 간의 통신(IPC, inter-process communication)을 사용해야 한다.
스레드(Thread)
- 프로세스 내에서 실행되는 여러 흐름의 단위
- 프로세스의 특정한 수행 경로
- 프로세스가 할당받은 자원을 이용하는 실행의 단위
스레드의 특징
- 프로세스 내에서 각각 stack만 따로 할당받고, Code, Data, Heap 영역은 공유한다.
- 스레드는 한 프로세스 내에서 동작되는 여러 실행의 흐름으로, 프로세스 내의 주소 공간이나 자원들(힙 공간 등)을 같은 프로세스 내의 스레드들끼리 공유하며 실행된다.
- 각각의 스레드는 별도의 레지스터와 스택을 갖고 있지만, 힙 메모리는 서로 읽고 쓸 수 있다.
- 한 스레드가 프로세스 자원을 변경하면, 다른 이웃 스레드(sibiling thread)도 그 변경 결과를 즉시 볼 수 있다.
프로세스 vs 스레드
- 프로세스는 서로 자원을 공유하지 않지만 스레드는 공유한다.
멀티 프로세스
- 하나의 응용 프로그램을 여러 개의 프로세스로 구성하여 각 프로세스가 하나의 작업을 처리하도록 하는 것.
- 장점
- 여러 개의 자식 프로세스 중 하나에 문제가 발생해도 다른 자식 프로세스는 영향을 받지 않는다.
- 단점
- Context Switching에서의 캐쉬 메모리 초기화 등 무거운 작업으로 인한 오버헤드
- 프로세스 간 통신을 하기 위해서는 IPC를 통해야 함.
- 프로세스 간 공유하는 메모리가 없어서 Context Switching이 발생하면 데이터를 처음부터 불러와야 함.
멀티 스레드
- 하나의 응용 프로그램을 여러 개의 스레드로 구성하고 각 스레드가 하나의 작업을 처리하도록 하는 것.
- 윈도우나 리눅스 등 많은 OS에서 멀티 프로세싱도 지원하지만 멀티 스레딩을 기본으로 하고 있다.
- 장점
- 시스템 자원 소모 감소(자원의 효율성)
: 프로세스를 생성하여 자원을 할당하는 시스템 콜이 줄어서 자원을 효율적으로 관리할 수 있다. - 시스템 처리량 감소(처리 비용)
: 스레드 간 데이터를
- 시스템 자원 소모 감소(자원의 효율성)
- 단점
- Thread-Safety에 문제가 없는지 확실한 설계가 필요
- 디버깅이 까다롭다
- 동기화(자원을 공유하기 때문)나 교착 상태 발생 가능성
- 프로세스 밖에서는 해당 스레드를 제어할 수 없다
- 하나의 스레드에 문제가 발생하면 프로세스 전체에 영향
[참고]
https://gmlwjd9405.github.io/2018/09/14/process-vs-thread.html
'CS > OS' 카테고리의 다른 글
[운영체제/OS] CPU Scheduling (0) | 2024.04.16 |
---|