가비지 컬렉션(Garbage Collection, 이하 GC)는 자바의 메모리 관리 방법 중의 하나로 JVM(자바 가상 머신)의Heap 영역에서동적으로 할당했던 메모리중필요 없게 된 메모리 객체(garbage)를 모아 주기적으로 제거하는 프로세스를 말한다.
어떤 인스턴스가 생성되어 메모리 공간을 차지한 상태에서 해당 인스턴스가 프로그램에서 사용되지 않게 되었다면(null 처리 되었거나 해당 인스턴스를 참조하는 부분이 없다면) 해당 인스턴스가 Garbage가 된다. 이런 불필요한 메모리 낭비를 방지하기 위해서 개발자가 직접 인스턴스를 찾아서 제거하는 것이 아니라,JVM이 불필요한 메모리를 정리해주는 기능이 Garbage Collection 이다.
Java 프로세스가 한정된 메모리를 효율적으로 사용할수 있게 하고,개발자 입장에서 메모리 관리, 메모리 누수(Memory Leak) 문제에서 대해 관리하지 않아도 되어 오롯이개발에만 집중할 수 있다는 장점이 있다
가비지 컬렉션에도단점이 존재한다.
자동으로 처리해준다 해도메모리가 언제 해제되는지 정확하게 알 수 없어 제어하기 힘들며,가비지 컬렉션(GC)이 동작하는 동안에는다른 동작을 멈추기때문에오버헤드가 발생되는 문제점이 있다.
이를 전문적인 용어로Stop-The-World라 한다.
Info
STW (Stop The World) GC를 수행하기 위해 JVM이 프로그램 실행을 멈추는 현상을 의미. GC가 작동하는 동안 GC 관련 Thread를 제외한 모든 Thread는 멈추게 되어 서비스 이용에 차질이 생길 수 있다. 따라서 이 시간을 최소화 시키는 것이 쟁점이다.
이로 인해 GC가 너무 자주 실행되면 소프트웨어 성능 하락의 문제가 되기도 하다.
이런 특성에 따라 실시간 성이 매우 강조되는 포로그램일 경우 가비지 컬렉터(GC)에게 메모리를 맞기는 것은 맞지 않을 수 있다.
따라서 어플리케이션의 사용성을 유지하면서 효율적이게 GC를 실행하는 최적화 작업이 개발자의 숙제가 된다.
예를들어 JVM 메모리에서는 객체들은 실질적으로 Heap영역에서 생성되고 Method Area이나 Stack Area 에서는 Heap Area에 생성된 객체의 주소만 참조하는 형식으로 구성된다.
하지만 이렇게 생성된 Heap Area의 객체들이 메서드가 끝나는 등의 특정 이벤트들로 인하여 Heap Area 객체의 메모리 주소를 가지고 있는 참조 변수가 삭제되는 현상이 발생하면, 위의 그림에서의빨간색 객체와 같이 Heap영역에서 어디서든참조하고 있지 않은 객체(Unreachable)들이 발생하게 된다.
가비지 컬렉션이 될 대상 객체를식별(Mark)하고제거(Sweep)하며 객체가 제거되어 파편화된 메모리 영역을 앞에서부터채워나가는 작업(Compaction)을 수행하게 된다.
Mark 과정: 먼저Root Space로부터 그래프 순회를 통해 연결된 객체들을 찾아내어 각각 어떤 객체를 참조하고 있는지 찾아서 마킹한다.
Sweep 과정: 참조하고 있지 않은 객체 즉 Unreachable 객체들을 Heap에서 제거한다.
Compact 과정: Sweep 후에 분산된 객체들을 Heap의 시작 주소로 모아 메모리가 할당된 부분과 그렇지 않은 부분으로 압축한다.(가비지 컬렉터 종류에 따라 하지 않는 경우도 있음)
Info
[ GC의 Root Space ] Mark And Sweep 방식은 루트로 부터 해당 객체에 접근이 가능한지가 해제의 기준이 된다. JVM GC에서의 Root Space는 Heap 메모리 영역을 참조하는 method area, static 변수, stack, native method stack이 되게 된다.출처 : ☕ 가비지 컬렉션 동작 원리 & GC 종류 💯 총정리
JVM의힙(heap)영역은 동적으로 레퍼런스 데이터가 저장되는 공간으로서,가비지 컬렉션에 대상이 되는 공간이다.
Heap영역은 처음 설계될 때 다음의 2가지를 전제 (Weak Generational Hypothesis)로 설계되었다.
대부분의 객체는 금방 접근 불가능한 상태(Unreachable)가 된다.
오래된 객체에서 새로운 객체로의 참조는 아주 적게 존재한다.
즉, 객체는 대부분 일회성되며, 메모리에 오랫동안 남아있는 경우는 드물다는 것이다.
이러한 특성을 이용해 JVM 개발자들은 보다 효율적인 메모리 관리를 위해, 객체의 생존 기간에 따라 물리적인 Heap 영역을 나누게 되었고Young 과 Old 총 2가지 영역으로 설계하였다. (초기에는 Perm 영역도 존재하였지만 Java 8부터 제거되었다)
출처 : ☕ 가비지 컬렉션 동작 원리 & GC 종류 💯 총정리
Young 영역(Young Generation)
새롭게 생성된 객체가 할당(Allocation)되는 영역
대부분의 객체가 금방 Unreachable 상태가 되기 때문에, 많은 객체가 Young 영역에 생성되었다가 사라진다.
Young 영역에 대한 가비지 컬렉션(Garbage Collection)을 Minor GC라고 부른다.
Old 영역(Old Generation)
Young영역에서 Reachable 상태를 유지하여 살아남은 객체가 복사되는 영역
Young 영역보다 크게 할당되며, 영역의 크기가 큰 만큼 가비지는 적게 발생한다.
Old 영역에 대한 가비지 컬렉션(Garbage Collection)을 Major GC 또는 Full GC라고 부른다.
위 그림에서, Old 영역이 Young 영역보다 크게 할당되는 이유는 Young 영역의 수명이 짧은 객체들은 큰 공간을 필요로 하지 않으며 큰 객체들은 Young 영역이 아니라 바로 Old 영역에 할당되기 때문이다.
또 다시 힙 영역은 더욱 효율적인 GC를 위해Young 영역을3가지 영역(Eden, survivor 0, survivor 1)으로 나눈다.
출처 : ☕ 가비지 컬렉션 동작 원리 & GC 종류 💯 총정리
Eden
new를 통해 새로 생성된 객체가 위치.
정기적인 쓰레기 수집 후 살아남은 객체들은 Survivor 영역으로 보냄
Survivor 0 / Survivor 1
최소 1번의 GC 이상 살아남은 객체가 존재하는 영역
Survivor 영역에는 특별한 규칙이 있는데, Survivor 0 또는 Survivor 1 둘 중 하나에는 꼭 비어 있어야 하는 것이다.
Info
[ Java 8 에서의 Permanent ] Permanent는 직역하면 영구적인 세대의 의미로서, 생성된 객체들의 정보의 주소값이 저장된 공간이다.클래스 로더에 의해 load되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이고 JVM에 의해 사용된다.Java 7 까지는 힙 영역에 존재했지만 Java 8 버전 이후에는 Native Method Stack에 편입되게 된다.
가비지 컬렉션(Garbage Collection, 이하 GC)는 자바의 메모리 관리 방법 중의 하나로 JVM(자바 가상 머신)의Heap 영역에서동적으로 할당했던 메모리중필요 없게 된 메모리 객체(garbage)를 모아 주기적으로 제거하는 프로세스를 말한다.
어떤 인스턴스가 생성되어 메모리 공간을 차지한 상태에서 해당 인스턴스가 프로그램에서 사용되지 않게 되었다면(null 처리 되었거나 해당 인스턴스를 참조하는 부분이 없다면) 해당 인스턴스가 Garbage가 된다. 이런 불필요한 메모리 낭비를 방지하기 위해서 개발자가 직접 인스턴스를 찾아서 제거하는 것이 아니라,JVM이 불필요한 메모리를 정리해주는 기능이 Garbage Collection 이다.
Java 프로세스가 한정된 메모리를 효율적으로 사용할수 있게 하고,개발자 입장에서 메모리 관리, 메모리 누수(Memory Leak) 문제에서 대해 관리하지 않아도 되어 오롯이개발에만 집중할 수 있다는 장점이 있다
가비지 컬렉션에도단점이 존재한다.
자동으로 처리해준다 해도메모리가 언제 해제되는지 정확하게 알 수 없어 제어하기 힘들며,가비지 컬렉션(GC)이 동작하는 동안에는다른 동작을 멈추기때문에오버헤드가 발생되는 문제점이 있다.
이를 전문적인 용어로Stop-The-World라 한다.
Info
STW (Stop The World) GC를 수행하기 위해 JVM이 프로그램 실행을 멈추는 현상을 의미. GC가 작동하는 동안 GC 관련 Thread를 제외한 모든 Thread는 멈추게 되어 서비스 이용에 차질이 생길 수 있다. 따라서 이 시간을 최소화 시키는 것이 쟁점이다.
이로 인해 GC가 너무 자주 실행되면 소프트웨어 성능 하락의 문제가 되기도 하다.
이런 특성에 따라 실시간 성이 매우 강조되는 포로그램일 경우 가비지 컬렉터(GC)에게 메모리를 맞기는 것은 맞지 않을 수 있다.
따라서 어플리케이션의 사용성을 유지하면서 효율적이게 GC를 실행하는 최적화 작업이 개발자의 숙제가 된다.
예를들어 JVM 메모리에서는 객체들은 실질적으로 Heap영역에서 생성되고 Method Area이나 Stack Area 에서는 Heap Area에 생성된 객체의 주소만 참조하는 형식으로 구성된다.
하지만 이렇게 생성된 Heap Area의 객체들이 메서드가 끝나는 등의 특정 이벤트들로 인하여 Heap Area 객체의 메모리 주소를 가지고 있는 참조 변수가 삭제되는 현상이 발생하면, 위의 그림에서의빨간색 객체와 같이 Heap영역에서 어디서든참조하고 있지 않은 객체(Unreachable)들이 발생하게 된다.
가비지 컬렉션이 될 대상 객체를식별(Mark)하고제거(Sweep)하며 객체가 제거되어 파편화된 메모리 영역을 앞에서부터채워나가는 작업(Compaction)을 수행하게 된다.
Mark 과정: 먼저Root Space로부터 그래프 순회를 통해 연결된 객체들을 찾아내어 각각 어떤 객체를 참조하고 있는지 찾아서 마킹한다.
Sweep 과정: 참조하고 있지 않은 객체 즉 Unreachable 객체들을 Heap에서 제거한다.
Compact 과정: Sweep 후에 분산된 객체들을 Heap의 시작 주소로 모아 메모리가 할당된 부분과 그렇지 않은 부분으로 압축한다.(가비지 컬렉터 종류에 따라 하지 않는 경우도 있음)
Info
[ GC의 Root Space ] Mark And Sweep 방식은 루트로 부터 해당 객체에 접근이 가능한지가 해제의 기준이 된다. JVM GC에서의 Root Space는 Heap 메모리 영역을 참조하는 method area, static 변수, stack, native method stack이 되게 된다.출처 : ☕ 가비지 컬렉션 동작 원리 & GC 종류 💯 총정리
JVM의힙(heap)영역은 동적으로 레퍼런스 데이터가 저장되는 공간으로서,가비지 컬렉션에 대상이 되는 공간이다.
Heap영역은 처음 설계될 때 다음의 2가지를 전제 (Weak Generational Hypothesis)로 설계되었다.
대부분의 객체는 금방 접근 불가능한 상태(Unreachable)가 된다.
오래된 객체에서 새로운 객체로의 참조는 아주 적게 존재한다.
즉, 객체는 대부분 일회성되며, 메모리에 오랫동안 남아있는 경우는 드물다는 것이다.
이러한 특성을 이용해 JVM 개발자들은 보다 효율적인 메모리 관리를 위해, 객체의 생존 기간에 따라 물리적인 Heap 영역을 나누게 되었고Young 과 Old 총 2가지 영역으로 설계하였다. (초기에는 Perm 영역도 존재하였지만 Java 8부터 제거되었다)
출처 : ☕ 가비지 컬렉션 동작 원리 & GC 종류 💯 총정리
Young 영역(Young Generation)
새롭게 생성된 객체가 할당(Allocation)되는 영역
대부분의 객체가 금방 Unreachable 상태가 되기 때문에, 많은 객체가 Young 영역에 생성되었다가 사라진다.
Young 영역에 대한 가비지 컬렉션(Garbage Collection)을 Minor GC라고 부른다.
Old 영역(Old Generation)
Young영역에서 Reachable 상태를 유지하여 살아남은 객체가 복사되는 영역
Young 영역보다 크게 할당되며, 영역의 크기가 큰 만큼 가비지는 적게 발생한다.
Old 영역에 대한 가비지 컬렉션(Garbage Collection)을 Major GC 또는 Full GC라고 부른다.
위 그림에서, Old 영역이 Young 영역보다 크게 할당되는 이유는 Young 영역의 수명이 짧은 객체들은 큰 공간을 필요로 하지 않으며 큰 객체들은 Young 영역이 아니라 바로 Old 영역에 할당되기 때문이다.
또 다시 힙 영역은 더욱 효율적인 GC를 위해Young 영역을3가지 영역(Eden, survivor 0, survivor 1)으로 나눈다.
출처 : ☕ 가비지 컬렉션 동작 원리 & GC 종류 💯 총정리
Eden
new를 통해 새로 생성된 객체가 위치.
정기적인 쓰레기 수집 후 살아남은 객체들은 Survivor 영역으로 보냄
Survivor 0 / Survivor 1
최소 1번의 GC 이상 살아남은 객체가 존재하는 영역
Survivor 영역에는 특별한 규칙이 있는데, Survivor 0 또는 Survivor 1 둘 중 하나에는 꼭 비어 있어야 하는 것이다.
Info
[ Java 8 에서의 Permanent ] Permanent는 직역하면 영구적인 세대의 의미로서, 생성된 객체들의 정보의 주소값이 저장된 공간이다.클래스 로더에 의해 load되는 Class, Method 등에 대한 Meta 정보가 저장되는 영역이고 JVM에 의해 사용된다.Java 7 까지는 힙 영역에 존재했지만 Java 8 버전 이후에는 Native Method Stack에 편입되게 된다.