////
Search
Duplicate
⛸️

3. 타입과 추상화

일단 컴퓨터를 조작하는 것이 추상화를 구축하고, 조작하고 추론하는 것에 관한 모든 것이라는 것을 깨닫고 나면 컴퓨터 프로그램을 작성하기 위한 전제 조건은 추상화를 정확하게 다루는 능력이라는 것이 명확해진다. - 키스 데블린
실생활의 복잡한 교통수단인 지하철을 우리가 어렵지 않게 잘 사용할 수 있는 이유는 뭘까? 단순하고 직관적으로 역 간의 네트워크를 표현하는 지하철 노선도가 있기 때문이다.
전 세계 어디를 가더라도 지하철 노선도는 유사한 형태를 띠기 때문에 한 도시의 지하철 노선도를 이해하면 다른 도시의 지하철 노선도 역시 쉽게 이해할 수 있다.
지하철을 이용하는 승객의 목적은 하나의 역에서 다른 역으로 이동하는 것이다. 따라서 승객이 원하는 것은 어떤 역에서 탑승하고 환승하는지, 그리고 어떤 역을 거쳐야 가장 쉽고 빠르게 목적지에 도착할 수 있는지다.
지하철 노선도 디자인에서 가장 중요한 것은 역과 역 사이의 연결성을 얼마나 직관적으로 표현했느냐다.
정보 디자인의 아이콘이 된 해리 벡의 지하철 노선도는 승객이 꼭 알아야 하는 사실만 정확하게 표현하고 몰라도 되는 정보는 무시함으로써 이해하기 쉽고 단순하여 승객의 목적에 부합할 수 있었다.
해리 벡의 가장 위대한 업적은 지하철 노선도를 추상화한 것이다.

추상화를 통한 복잡성 극복

진정한 의미에서의 추상화란 현실에서 출발하되 불필요한 부분을 도려내가면서 사물의 본질을 드러나게 하는 과정이라고 할 수 있다.
추상화의 목적은 불필요한 부분을 무시함으로써 현실에 존재하는 복잡성을 극복하는 것이다. 추상화는 복잡한 현실을 단순화하기 위해 사용하는 인간의 가장 기본적인 인지 수단이라고 할 수 있다.
훌륭한 추상화는 목적에 부합하는 것이어야 한다. 어떤 추상화도 의도된 목적이 아닌 다른 목적으로 사용된다면 오도될 수 있다. 추상화의 수준, 이익, 가치는 목적에 의존적이다.
리처드 파인만의 말처럼 현상은 복잡하다. 법칙은 단순하다. 버릴 게 무엇인지 알아내라.
이 책에서는 추상화를 다음과 같이 정의한다.
어떤 양상, 세부 사항, 구조를 좀 더 명확하게 이해하기 위해 특정 절차나 물체를 의도적으로 생략하거나 감춤으로써 복잡도를 극복하는 방법이다.
복잡성을 다루기 위해 추상화는 두 차원에서 이뤄진다.
첫 번째 차원은 구체적인 사물들 간의 공통점은 취하고 차이점은 버리는 일반화를 통해 단순하게 만드는 것이다.
두 번째 차원은 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거함으로써 단순하게 만드는 것이다.
모든 경우에 추상화의 목적은 복잡성을 이해하기 쉬운 수준으로 단순화하는 것이라는 점을 기억하자.
객체지향 패러다임은 객체라는 추상화를 통해 현실의 복잡성을 극복한다. 객체지향 패러다임을 이용해 유용하고 아름다운 어플리케이션을 개발하기 위한 첫걸음은 추상화의 두 차원을 올바르게 이해하고 적용하는 것이다.

객체지향과 추상화

모두 트럼프일 뿐

앨리스는 하트 여왕과 최초로 마주치는 장면에는 저마다 각각의 고유한 특징을 지닌 여러 객체들이 등장한다.
하지만 앨리스는 이런 복잡함을 모두 트럼프라는 하나의 개념으로 단순화해서 바라본다. 즉 트럼프라는 유사성을 기반으로 추상화해서 바라보고 있는 것이다.

그룹으로 나누어 단순화하기

앨리스는 정원이라는 장소에 등장하는 여러 객체를 트럼프와 토끼라는 그룹으로 나누어 이해했다.
이 두 개의 렌즈를 통해 정원을 바라보는 것은 정원에 내재된 복잡성을 효과적으로 감소시킨다.

개념

앨리스가 기껏해야 트럼프에 불과해라고 말했을 때 앨리스의 뇌리를 스쳐 지나간 것은 정원에 있는 인물들을 트럼프와 토끼라는 두 개의 그룹으로 나눌 수 있다는 사실이다.
앨리스는 인물들의 차이점을 의도적으로 무시하고 공통점만을 강조함으로써 트럼프라는 그룹에 속할 수 있는 인물들을 취사선택한 것이다.
이처럼 차이점이라는 복잡성을 무시하고 공통점만을 취해 트럼프라는 개념으로 단순화한 것은 추상화의 일종이다.
객체지향 패러다임의 중심에는 구체적이고 실제적인 객체가 존재하지만 수많은 객체들을 개별 단위로 취급하기에 인간이 지닌 인지능력은 턱없이 부족하다.
따라서 사람들은 본능적으로 공통적인 특성을 기준으로 객체를 여러 그룹으로 묶어 동시에 다뤄야 하는 가짓수를 줄임으로써 상황을 단순화하려고 노력한다.
이처럼 공통점을 기반으로 객체들을 묶기 위한 그릇을 개념이라고 한다. 개념이란 일반적으로 우리가 인식하고 있는 다양한 사물이나 객체에 적용할 수 있는 아이디어나 관념을 뜻한다.
개념을 이용하면 객체를 여러 그룹으로 분류할 수 있다.
앨리스는 정원의 객체들을 토끼트럼프라는 두 개의 개념으로 분류한 것이다.
결국 각 객체는 특정한 개념을 표현하는 그룹의 일원으로 포함된다. 하트 여왕트럼프라는 개념 그룹의 일원이고 하얀 토끼토끼라는 개념 그룹의 일원이다.
이처럼 어떤 객체에 어떤 개념을 적용하는 것이 가능해서 개념 그룹의 일원이 될 때 객체를 그 개념의 인스턴스라고 한다.
따라서 객체를 다음과 같이 정의할 수도 있다.
객체란 특정한 개념을 적용할 수 있는 구체적인 사물을 의미한다. 개념이 객체에 적용됐을 때 객체를 개념인스턴스라고 한다.

개념의 세 가지 관점

일반적으로 객체의 분류 장치로서 개념을 이야기할 때는 아래의 세 가지 관점을 함께 언급한다.
심볼(symbol): 개념을 가리키는 간략한 이름이나 명칭
내연(intension): 개념의 완전한 정의를 나타내며 내연의 의미를 이용해 객체가 개념에 속하는지 여부를 확인할 수 있다.
외연(extension): 개념에 속하는 모든 객체의 집합
먼저 심볼이란 개념을 가리키는 이름이다.
내연이란 개념의 의미를 나타낸다. 앨리스의 이야기에선 몸이 납작하고 두 손과 두 발이 네모난 몸 모서리게 달린 트럼프에 대한 설명이 내연이다.
내연은 개념을 객체에게 적용할 수 있는지 여부를 판단하기 위한 조건이라는 점을 주목해야 한다.
하얀 토끼는 트럼프의 내연을 만족하지 못하기 때문에 트럼프가 될 수 없다.
외연은 개념에 속하는 객체들, 즉 개념의 인스턴스들이 모여 이뤄진 집합을 가리킨다.
앨리스의 이야기에선 트럼프에 속하는 여러 객체들, 토끼에 속하는 하얀 토끼가 있겠다.
어찌보면 분류(classification)에서 클래스(class)가 나오게 되었는지도 모르겠다.

객체를 분류하기 위한 틀

외연의 관점에서 어떤 객체에게 어떤 개념을 적용할 수 있다는 것은 동일한 개념으로 구성된 객체 집합에 해당 객체를 포함시킨다는 것을 의미한다.
어떤 객체와 마주했을 때 객체에게 적용할 개념을 결정하는 것은 결국 해당 객체를 개념이 적용된 객체 집합의 일원으로 맞아들인다는 것을 의미한다.
어떤 객체가 개념에 적합하지 않을 경우 해당 객체는 해당 개념의 객체 집합에 포함되지 않을 것이다. 객체에 어떤 개념을 적용할 것인지를 결정하는 것은 결국 개념에 따라 분류하는 것과 유사하다.
따라서 분류란 특정한 객체를 특정한 개념의 객체 집합에 포함시키거나 포함시키지 않는 작업을 의미한다.
객체를 적절한 개념에 따라 분류하지 못한 어플리케이션은 유지보수가 어렵고 변화에 쉽게 대처하지 못한다. 반면 객체를 적절한 개념에 따라 분류한 어플리케이션은 유지보수가 용이하고 변경에 유연하게 대처할 수 있다.

분류는 추상화를 위한 도구다

개념은 객체들의 복잡성을 극복하기 위한 추상화 도구다.
추상화를 사용함으로써 우리는 극도로 복잡한 이 세상을 그나마 제어 가능한 수준으로 단순화할 수 있는 것이다.

타입

타입은 개념이다

공학자들은 개념을 대체할 수 있는 좀 더 세련되어 보이는 용어를 수학으로부터 차용해왔고 그것이 바로 타입이다.
타입의 정의는 개념의 정의와 완전히 동일하다. 타입은 공통점을 기반으로 객체를 묶기 위한 틀이다. 타입은 개념과 마찬가지로 심볼, 내연, 외연을 이용해 서술할 수 있으며 타입에 속하는 객체들을 인스턴스라고 한다.

데이터 타입

타입은 데이터가 어떻게 사용되느냐에 관한 것이다. 숫자형 데이터가 숫자형인 이유는 빼거나 더하거나 곱하거나 나눌 수 있기 때문이다.
타입에 속한 데이터를 메모리에 어떻게 표현하는지는 외부로부터 철저하게 감춰진다. 데이터 타입의 표현은 연산 작업을 수행하기에 가장 효과적인 형태가 선택되며 개발자는 그런 표현 방식을 몰라도 지장이 없다.
이 책은 프로그래밍 언어 관점에서 데이터 타입을 다음과 같이 정의한다.
데이터 타입은 메모리 안에 저장된 데이터의 종류를 분류하는 데 사용하는 메모리 집합에 관한 메타데이터다.
데이터에 대한 분류는 암시적으로 어떤 종류의 연산이 해당 데이터에 대해 수행될 수 있는지를 결정한다.

객체와 타입

객체는 데이터인가? 아니다. 객체에서 가장 중요한 것은 행동이다. 상태는 행동의 결과로 초래된 사이드 이펙트를 쉽게 표현하기 위해 도입한 추상적인 개념일 뿐이다.
즉 객체가 협력을 위해 어떤 책임을 지녀야 하는지 결정하는 것이 객체지향 설계의 핵심이다.
따라서 앞에 데이터 타입에 대한 두 조언을 객체의 타입에도 동일하게 적용된다.
첫째, 어떤 객체가 어떤 타입에 속하는지를 결정하는 것은 객체가 수행하는 행동이다. 어떤 객체들이 동일한 행동을 수행한다면 그 객체들은 동일한 타입으로 분류될 수 있다.
둘째, 객체의 내부적인 표현은 외부로부터 철저하게 감춰진다. 객체의 행동을 가장 효과적으로 수행할 수만 있다면 객체 내부의 상태를 어떤 방식으로 표현하더라도 무방하다.

행동이 우선이다

즉, 객체가 어떤 행동을 하느냐에 따라 객체의 타입이 달라진다. 두 번째 조언에 따르면 객체의 타입은 객체의 내부 표현과는 아무런 상관이 없다.
따라서 내부 표현 방식이 아무리 다르더라도 외부에서 동일하게 행동하는 것으로 보인다면 그 객체들은 동일한 타입이다. 결과적으로 동일한 책임을 수행하는 일련의 객체들은 동일한 타입에 속한다고 말할 수 있다.
결론적으로 객체의 타입을 결정하는 것은 객체의 행동뿐이다. 객체가 어떤 데이터를 보유하고 있는지는 타입을 결정하는 데 아무런 영향도 미치지 않는다.
같은 타입에 속한 객체는 행동만 동일하다면 서로 다른 상태를 가질 수 있다. 여기서 동일한 행동이란 동일한 책임을 의미하며 동일한 책임이란 동일한 메시지 수신을 의미한다.
따라서 동일한 타입에 속한 객체들은 내부의 데이터 표현 방식이 다르더라도 동일한 메시지를 수신하고 이를 처리할 수 있다. 다만 내부의 표현 방식이 다르기 때문에 처리하는 방식도 다를 수 밖에 없다.
이것은 다형성에 의미를 부여한다. 다형성이란 동일한 요청에 대하여 서로 다른 방식으로 응답할 수 있는 능력을 뜻한다.
데이터 내부 표현 방식과 무관하게 행동만이 객체를 결정짓는 고려 대상이라는 사실은 외부에 데이터를 감춰야 한다는 것을 의미한다. 따라서 훌륭한 객체지향 설계는 외부에 행동만을 제공하고 데이터는 행동 뒤에 감춘다.
이 원칙을 캡슐화라고 한다. 공용 인터페이스 뒤로 데이터를 캡슐화하라는 오래된 격언은 객체를 행동에 따라 분류하기 위해 지켜야하는 기본적인 원칙이다.
행동에 따라 객체를 분류하기 위해서는 객체가 내부적으로 관리해야 하는 데이터가 아닌 객체가 외부에 제공하는 행동을 먼저 생각해야 한다.
객체가 외부에 제공하는 행동을 먼저 결정하고 그 책임을 수행하는 데 필요한 데이터를 나중에 결정한 후, 데이터를 책임을 수행하는 데 필요한 외부 인터페이스 뒤로 캡슐화해야 한다.
흔히 책임-주도 설계라고 부르는 이 객체지향 설계 방법은 데이터를 먼저 생각하는 데이터 주도 설계 방법의 단점을 개선하기 위해 고안되었다.
객체를 결정하는 것은 행동이다. 데이터는 단지 행동에 종속되는 추상적인 개념일 뿐이다. 이것이 객체를 객체답게 만드는 가장 핵심적인 원칙이다.

타입의 계층

트럼프 계층

객체가 동일한 타입으로 분류되기 위해서는 공통의 행동을 가져야 한다. 그러나 등장인물들의 외양은 트럼프와 유사하지만 행동 자체는 트럼프와 완벽하게 동일하진 않다.
우리는 앞서 트럼프 타입의 정의, 즉 내연을 납작 엎드릴 수 있고 뒤집어질 수 있으며 걸을 때마다 몸이 종이처럼 좌우로 펄럭이는 존재로 정의했다.
일반적으로 트럼프 카드는 납작 엎드리고 뒤집어질 순 있지만 걸어다닐 수는 없다.
따라서 우리는 트럼프 타입으로 불렸던 객체들을 좀 더 정확하게 트럼프 인간이라는 타입으로 분류하는 것이 옳다.
트럼프 타입의 객체는 납작 엎드릴 수 있고 뒤집어질 수 있다. 트럼프 인간 타입의 객체는 납작 엎드릴 수 있고 뒤집어질 수 있으며 걸을 때마다 몸이 좌우로 펄럭인다.
트럼프 인간 타입의 객체는 트럼프 타입의 객체의 모든 행동을 할 수 있을 뿐만 아니라 추가로 걸어다닐 수까지 있다.
다시 말해 트럼프 인간은 트럼프의 일종이지만 일반적인 트럼프 카드보다 좀 더 특화된 행동을 하는 트럼프인 것이다.
외연이라는 객체 집합에서 트럼프와 트럼프 인간 타입을 살펴보자. 트럼프 인간은 트럼프다. 따라서 모든 트럼프 인간은 동시에 트럼프이기도 하다.
이것은 트럼프 인간 타입에 속하는 객체는 트럼프 타입의 객체에도 함께 속해야 한다는 것을 의미한다.
이 관점에서 트럼프는 트럼프 인간을 포괄하는 좀 더 일반적인 개념이다. 트럼프 인간은 트럼프보다 좀 더 특화된 행동을 하는 특수한 개념이다.
이 두 개념 사이의 관게를 일반화/특수화 관계라고 한다.

일반화/특수화 관계

여기서 알 수 있듯이 타입과 타입 사이에는 일반화/특수화 관계가 존재할 수 있다.
여기서 중요한 것은 객체지향에서 일반화/특수화 관계를 결정하는 것은 객체의 상태를 표현하는 데이터가 아니라 행동이라는 것이다.
어떤 객체가 다른 객체보다 더 일반적인 상태를 표현하거다 더 특수한 상태를 표현한다고 해서 두 객체의 타입 간에 일반화/특수화 관계가 성립하는 것은 아니다.
행동의 관점에서 더 일반적인 타입이란 무엇이고 더 특수한 타입이란 무엇인가?
일반적인 타입이란 특수한 타입이 가진 모든 행동들 중에서 일부 행동만을 가리키는 타입을 가리킨다.
특수한 타입이란 일반적인 타입이 가진 모든 행동들을 포함하지만 거기에 더해 자신만의 해동을 추가하는 타입을 가리킨다.
따라서 일반적인 타입은 특수한 타입보다 더 적은 수의 행동을 가지고 특수한 타입은 일반적인 타입보다 더 많은 수의 행동을 가진다.
여기서 주의해야 할 점은 타입의 내연을 의미하는 행동의 가짓수와 외연을 의미하는 집합의 크기는 서로 반대라는 사실이다.
일반적인 타입은 특수한 타입보다 더 적은 내연을 가지지만 외연은 더 크다.
특수한 타입은 더 많은 내연을 가지지만 외연은 더 작다.

슈퍼타입과 서브타입

일반적인 타입을 슈퍼타입이라 하고 좀 더 특수한 타입을 서브타입이라고 한다.
두 타입 간의 관계가 행동에 의해 결정된다는 점을 다시 한번 강조한다. 즉 어떤 타입이 다른 타입의 서브 타입이 되기 위해서는 행위적 호환성을 만족시켜야 한다.
일반적으로 서브타입은 슈퍼타입의 행위와 호환되기 때문에 서브타입은 슈퍼타입을 대체할 수 있어야 한다.
슈퍼타입의 행동은 서브타입에 자동으로 상속된다.

일반화는 추상화를 위한 도구다

앞서 말했던 추상화의 두 번째 차원은 중요한 부분을 강조하고자 불필요한 세부 사항을 제거시켜 단순하게 만드는 것이다.
일반화/특수화 계층은 객체지향 패러다임에서 추상화의 두 번째 차원을 적절하게 활용하는 대표적인 예다.
앨리스의 입장에서 트럼프 인간이 할 수 있는 특수한 행동은 불필요했다. 따라서 앨리스는 그 시점에 중요한 사항인 트럼프가 가지는 내연에만 집중하고 불필요한 트럼프 인간의 특성을 제거하여 상황을 단순하게 만들었다.
여기서 두 가지 추상화 기법이 동시에 사용되었다는 점에 주목하자. 하나는 정원에 있던 등장인물들의 차이점은 배제하고 공통점만을 강조함으로써 이들의 공통 타입인 트럼프 인간으로 분류했다는 것이다.
다른 하나는 트럼프 인간을 좀 더 단순한 관점에서 바라보기 위해 불필요한 특성을 배제하고 좀 더 포괄적인 의미를 가진 트럼프로 일반화했다는 것이다.
이처럼 객체지향 패러다임을 통해 세상을 바라보는 거의 대부분의 경우에 분류일반화/특수화 기법을 동시에 적용하게 된다.

정적 모델

타입의 목적

타입을 사용하는 이유는 인간의 인지 능력으로는 시간에 따라 동적으로 변하는 객체의 복잡성을 극복하는 것이 너무 어렵기 때문이다.
앞선 예제에서 앨리스는 어떤 행동을 수행할 때마다 변한다. 앨리스라고 하는 객체의 상태는 변하지만 앨리스를 다른 객체와 구별할 수 있는 식별성은 동일하게 유지된다.
따라서 우리는 머릿속에 앨리스가 가질 수 있는 모든 경우의 키를 저장해두는 대신, 앨리스의 키가 임의의 값을 가질 수 있다는 사실만을 생각함으로써 복잡도를 제어할 수 있다.
타입은 시간에 따라 동적으로 변하는 앨리스의 상태를 시간과 무관한 정적인 모습으로 다룰 수 있게 해준다.
즉, 타입은 앨리스의 상태에 복잡성을 부과하는 시간이라는 요소를 제거함으로써 시간에 독립적인 정적인 모습으로 앨리스를 생각할 수 있게 해준다.

그래서 결국 타입은 추상화다

이런 관점에서 타입은 추상화다. 어떤 시점에 앨리스에 관해 생각할 때, 불필요한 시간이라는 요소와 상태 변화라는 요소를 제거하고 정적인 관점에서 앨리스의 모습을 묘사하는 것을 가능하게 해준다.
타입은 추상화다. 타입을 이용하면 객체의 동적인 특성을 추상화할 수 있다. 결국 타입은 시간에 따른 객체의 상태가 변경된다는 사실을 단순화할 수 있는 효과적인 방법인 것이다.

동적 모델과 정적 모델

객체를 생각할 때 우리는 두 모델을 동시에 고려한다.
하나는 객체가 특정 시점에 구체적으로 어떤 상태를 가지느냐다.
이를 객체의 스냅샷이라 한다. UML에서 스냅샷객체 다이어그램이라고도 불린다. 스냅샷처럼 실제고 객체가 생명주기 동안 어떻게 변하고 행동하는지를 포착하는 것을 동적 모델이라고도 한다.
다른 하나는 객체가 가질 수 있는 모든 상태와 모든 행동을 시간에 독립적으로 표현하는 것이다.
이런 모델을 타입 모델이라고 한다. 이 모델은 동적으로 변하는 객체의 상태가 아닌 객체가 속한 타입의 정적인 모습을 표현하기 때문에 정적 모델이라고도 한다.
객체지향 어플리케이션을 설계하고 구현하기 위해서는 객체 관점의 동적 모델과 객체를 추상화한 타입 관점의 정적 모델을 적절히 혼용해야 한다.
동적 모델과 정적 모델의 구분은 실제로 프로그래밍이라는 행위와도 관련이 깊다.
프로그래밍 언어를 통해 클래스를 작성하는 시점에는 시스템을 정적인 관점에서 접근하는 것이다.
실제로 어플리케이션을 실행해 객체의 상태 변경을 추적하고 디버깅하는 동안에는 객체의 동적인 모델을 탐험하고 있는 것이다.

클래스

객체지향 프로그래밍 언어에서 정적인 모델은 클래스를 이용해 구현된다. 따라서 타입을 구현하는 가장 보편적인 방법은 클래스인 것이다.
타입을 구현하는 것이다. 클래스와 타입은 같은 개념이 아니다.
타입은 객체를 분류하기 위해 사용하는 개념이다. 반면 클래스는 단지 타입을 구현할 수 있는 여러 구현 메커니즘 중 하나일 뿐이다.
객체를 분류하는 기준은 타입이며 타입을 나누는 기준은 객체가 수행하는 행동이라는 사실을 기억하자.
객체를 분류하기 위해 타입을 결정한 후, 프로그래밍 언어를 이용해 타입을 구현할 수 있는 한 가지 방법이 클래스라는 사실을 아는 것만으로도 충분하다.
궁극적으로 객체지향에서 중요한 것은 동적으로 변하는 객체의 상태상태를 변경하는 행위다.
클래스는 타입을 구현하기 위해 프로그래밍 언어에서 제공하는 구현 메커니즘에 불과하다는 것을 기억하자.