일단 컴퓨터를 조작하는 것이 추상화를 구축하고, 조작하고 추론하는 것에 관한 모든 것이라는 것을 깨닫고 나면 컴퓨터 프로그램을 작성하기 위한 전제 조건은 추상화를 정확하게 다루는 능력이라는 것이 명확해진다.
- 키스 데블린
•
실생활의 복잡한 교통수단인 지하철을 우리가 어렵지 않게 잘 사용할 수 있는 이유는 뭘까? 단순하고 직관적으로 역 간의 네트워크를 표현하는 지하철 노선도가 있기 때문이다.
•
전 세계 어디를 가더라도 지하철 노선도는 유사한 형태를 띠기 때문에 한 도시의 지하철 노선도를 이해하면 다른 도시의 지하철 노선도 역시 쉽게 이해할 수 있다.
•
지하철을 이용하는 승객의 목적은 하나의 역에서 다른 역으로 이동하는 것이다. 따라서 승객이 원하는 것은 어떤 역에서 탑승하고 환승하는지, 그리고 어떤 역을 거쳐야 가장 쉽고 빠르게 목적지에 도착할 수 있는지다.
•
지하철 노선도 디자인에서 가장 중요한 것은 역과 역 사이의 연결성을 얼마나 직관적으로 표현했느냐다.
•
정보 디자인의 아이콘이 된 해리 벡의 지하철 노선도는 승객이 꼭 알아야 하는 사실만 정확하게 표현하고 몰라도 되는 정보는 무시함으로써 이해하기 쉽고 단순하여 승객의 목적에 부합할 수 있었다.
◦
해리 벡의 가장 위대한 업적은 지하철 노선도를 추상화한 것이다.
추상화를 통한 복잡성 극복
•
진정한 의미에서의 추상화란 현실에서 출발하되 불필요한 부분을 도려내가면서 사물의 본질을 드러나게 하는 과정이라고 할 수 있다.
•
추상화의 목적은 불필요한 부분을 무시함으로써 현실에 존재하는 복잡성을 극복하는 것이다. 추상화는 복잡한 현실을 단순화하기 위해 사용하는 인간의 가장 기본적인 인지 수단이라고 할 수 있다.
•
훌륭한 추상화는 목적에 부합하는 것이어야 한다. 어떤 추상화도 의도된 목적이 아닌 다른 목적으로 사용된다면 오도될 수 있다. 추상화의 수준, 이익, 가치는 목적에 의존적이다.
◦
리처드 파인만의 말처럼 현상은 복잡하다. 법칙은 단순하다. 버릴 게 무엇인지 알아내라.
•
이 책에서는 추상화를 다음과 같이 정의한다.
◦
어떤 양상, 세부 사항, 구조를 좀 더 명확하게 이해하기 위해 특정 절차나 물체를 의도적으로 생략하거나 감춤으로써 복잡도를 극복하는 방법이다.
◦
복잡성을 다루기 위해 추상화는 두 차원에서 이뤄진다.
▪
첫 번째 차원은 구체적인 사물들 간의 공통점은 취하고 차이점은 버리는 일반화를 통해 단순하게 만드는 것이다.
▪
두 번째 차원은 중요한 부분을 강조하기 위해 불필요한 세부 사항을 제거함으로써 단순하게 만드는 것이다.
◦
모든 경우에 추상화의 목적은 복잡성을 이해하기 쉬운 수준으로 단순화하는 것이라는 점을 기억하자.
•
객체지향 패러다임은 객체라는 추상화를 통해 현실의 복잡성을 극복한다. 객체지향 패러다임을 이용해 유용하고 아름다운 어플리케이션을 개발하기 위한 첫걸음은 추상화의 두 차원을 올바르게 이해하고 적용하는 것이다.
객체지향과 추상화
모두 트럼프일 뿐
•
앨리스는 하트 여왕과 최초로 마주치는 장면에는 저마다 각각의 고유한 특징을 지닌 여러 객체들이 등장한다.
•
하지만 앨리스는 이런 복잡함을 모두 트럼프라는 하나의 개념으로 단순화해서 바라본다. 즉 트럼프라는 유사성을 기반으로 추상화해서 바라보고 있는 것이다.
그룹으로 나누어 단순화하기
•
앨리스는 정원이라는 장소에 등장하는 여러 객체를 트럼프와 토끼라는 그룹으로 나누어 이해했다.
•
이 두 개의 렌즈를 통해 정원을 바라보는 것은 정원에 내재된 복잡성을 효과적으로 감소시킨다.
개념
•
앨리스가 기껏해야 트럼프에 불과해라고 말했을 때 앨리스의 뇌리를 스쳐 지나간 것은 정원에 있는 인물들을 트럼프와 토끼라는 두 개의 그룹으로 나눌 수 있다는 사실이다.
•
앨리스는 인물들의 차이점을 의도적으로 무시하고 공통점만을 강조함으로써 트럼프라는 그룹에 속할 수 있는 인물들을 취사선택한 것이다.
◦
이처럼 차이점이라는 복잡성을 무시하고 공통점만을 취해 트럼프라는 개념으로 단순화한 것은 추상화의 일종이다.
•
객체지향 패러다임의 중심에는 구체적이고 실제적인 객체가 존재하지만 수많은 객체들을 개별 단위로 취급하기에 인간이 지닌 인지능력은 턱없이 부족하다.
•
따라서 사람들은 본능적으로 공통적인 특성을 기준으로 객체를 여러 그룹으로 묶어 동시에 다뤄야 하는 가짓수를 줄임으로써 상황을 단순화하려고 노력한다.
•
이처럼 공통점을 기반으로 객체들을 묶기 위한 그릇을 개념이라고 한다. 개념이란 일반적으로 우리가 인식하고 있는 다양한 사물이나 객체에 적용할 수 있는 아이디어나 관념을 뜻한다.
•
개념을 이용하면 객체를 여러 그룹으로 분류할 수 있다.
◦
앨리스는 정원의 객체들을 토끼와 트럼프라는 두 개의 개념으로 분류한 것이다.
•
결국 각 객체는 특정한 개념을 표현하는 그룹의 일원으로 포함된다. 하트 여왕은 트럼프라는 개념 그룹의 일원이고 하얀 토끼는 토끼라는 개념 그룹의 일원이다.
◦
이처럼 어떤 객체에 어떤 개념을 적용하는 것이 가능해서 개념 그룹의 일원이 될 때 객체를 그 개념의 인스턴스라고 한다.
•
따라서 객체를 다음과 같이 정의할 수도 있다.
◦
객체란 특정한 개념을 적용할 수 있는 구체적인 사물을 의미한다. 개념이 객체에 적용됐을 때 객체를 개념의 인스턴스라고 한다.
개념의 세 가지 관점
•
일반적으로 객체의 분류 장치로서 개념을 이야기할 때는 아래의 세 가지 관점을 함께 언급한다.
◦
심볼(symbol): 개념을 가리키는 간략한 이름이나 명칭
◦
내연(intension): 개념의 완전한 정의를 나타내며 내연의 의미를 이용해 객체가 개념에 속하는지 여부를 확인할 수 있다.
◦
외연(extension): 개념에 속하는 모든 객체의 집합
•
먼저 심볼이란 개념을 가리키는 이름이다.
•
내연이란 개념의 의미를 나타낸다. 앨리스의 이야기에선 몸이 납작하고 두 손과 두 발이 네모난 몸 모서리게 달린 트럼프에 대한 설명이 내연이다.
◦
내연은 개념을 객체에게 적용할 수 있는지 여부를 판단하기 위한 조건이라는 점을 주목해야 한다.
◦
하얀 토끼는 트럼프의 내연을 만족하지 못하기 때문에 트럼프가 될 수 없다.
•
외연은 개념에 속하는 객체들, 즉 개념의 인스턴스들이 모여 이뤄진 집합을 가리킨다.
◦
앨리스의 이야기에선 트럼프에 속하는 여러 객체들, 토끼에 속하는 하얀 토끼가 있겠다.
•
어찌보면 분류(classification)에서 클래스(class)가 나오게 되었는지도 모르겠다.
객체를 분류하기 위한 틀
•
외연의 관점에서 어떤 객체에게 어떤 개념을 적용할 수 있다는 것은 동일한 개념으로 구성된 객체 집합에 해당 객체를 포함시킨다는 것을 의미한다.
•
어떤 객체와 마주했을 때 객체에게 적용할 개념을 결정하는 것은 결국 해당 객체를 개념이 적용된 객체 집합의 일원으로 맞아들인다는 것을 의미한다.
◦
어떤 객체가 개념에 적합하지 않을 경우 해당 객체는 해당 개념의 객체 집합에 포함되지 않을 것이다. 객체에 어떤 개념을 적용할 것인지를 결정하는 것은 결국 개념에 따라 분류하는 것과 유사하다.
•
따라서 분류란 특정한 객체를 특정한 개념의 객체 집합에 포함시키거나 포함시키지 않는 작업을 의미한다.
•
객체를 적절한 개념에 따라 분류하지 못한 어플리케이션은 유지보수가 어렵고 변화에 쉽게 대처하지 못한다. 반면 객체를 적절한 개념에 따라 분류한 어플리케이션은 유지보수가 용이하고 변경에 유연하게 대처할 수 있다.
분류는 추상화를 위한 도구다
•
개념은 객체들의 복잡성을 극복하기 위한 추상화 도구다.
•
추상화를 사용함으로써 우리는 극도로 복잡한 이 세상을 그나마 제어 가능한 수준으로 단순화할 수 있는 것이다.
타입
타입은 개념이다
•
공학자들은 개념을 대체할 수 있는 좀 더 세련되어 보이는 용어를 수학으로부터 차용해왔고 그것이 바로 타입이다.
•
타입의 정의는 개념의 정의와 완전히 동일하다. 타입은 공통점을 기반으로 객체를 묶기 위한 틀이다. 타입은 개념과 마찬가지로 심볼, 내연, 외연을 이용해 서술할 수 있으며 타입에 속하는 객체들을 인스턴스라고 한다.
데이터 타입
•
타입은 데이터가 어떻게 사용되느냐에 관한 것이다. 숫자형 데이터가 숫자형인 이유는 빼거나 더하거나 곱하거나 나눌 수 있기 때문이다.
•
타입에 속한 데이터를 메모리에 어떻게 표현하는지는 외부로부터 철저하게 감춰진다. 데이터 타입의 표현은 연산 작업을 수행하기에 가장 효과적인 형태가 선택되며 개발자는 그런 표현 방식을 몰라도 지장이 없다.
•
이 책은 프로그래밍 언어 관점에서 데이터 타입을 다음과 같이 정의한다.
◦
데이터 타입은 메모리 안에 저장된 데이터의 종류를 분류하는 데 사용하는 메모리 집합에 관한 메타데이터다.
◦
데이터에 대한 분류는 암시적으로 어떤 종류의 연산이 해당 데이터에 대해 수행될 수 있는지를 결정한다.
객체와 타입
•
객체는 데이터인가? 아니다. 객체에서 가장 중요한 것은 행동이다. 상태는 행동의 결과로 초래된 사이드 이펙트를 쉽게 표현하기 위해 도입한 추상적인 개념일 뿐이다.
•
즉 객체가 협력을 위해 어떤 책임을 지녀야 하는지 결정하는 것이 객체지향 설계의 핵심이다.
•
따라서 앞에 데이터 타입에 대한 두 조언을 객체의 타입에도 동일하게 적용된다.
◦
첫째, 어떤 객체가 어떤 타입에 속하는지를 결정하는 것은 객체가 수행하는 행동이다. 어떤 객체들이 동일한 행동을 수행한다면 그 객체들은 동일한 타입으로 분류될 수 있다.
◦
둘째, 객체의 내부적인 표현은 외부로부터 철저하게 감춰진다. 객체의 행동을 가장 효과적으로 수행할 수만 있다면 객체 내부의 상태를 어떤 방식으로 표현하더라도 무방하다.
행동이 우선이다
•
즉, 객체가 어떤 행동을 하느냐에 따라 객체의 타입이 달라진다. 두 번째 조언에 따르면 객체의 타입은 객체의 내부 표현과는 아무런 상관이 없다.
◦
따라서 내부 표현 방식이 아무리 다르더라도 외부에서 동일하게 행동하는 것으로 보인다면 그 객체들은 동일한 타입이다. 결과적으로 동일한 책임을 수행하는 일련의 객체들은 동일한 타입에 속한다고 말할 수 있다.
•
결론적으로 객체의 타입을 결정하는 것은 객체의 행동뿐이다. 객체가 어떤 데이터를 보유하고 있는지는 타입을 결정하는 데 아무런 영향도 미치지 않는다.
•
같은 타입에 속한 객체는 행동만 동일하다면 서로 다른 상태를 가질 수 있다. 여기서 동일한 행동이란 동일한 책임을 의미하며 동일한 책임이란 동일한 메시지 수신을 의미한다.
◦
따라서 동일한 타입에 속한 객체들은 내부의 데이터 표현 방식이 다르더라도 동일한 메시지를 수신하고 이를 처리할 수 있다. 다만 내부의 표현 방식이 다르기 때문에 처리하는 방식도 다를 수 밖에 없다.
•
이것은 다형성에 의미를 부여한다. 다형성이란 동일한 요청에 대하여 서로 다른 방식으로 응답할 수 있는 능력을 뜻한다.
•
데이터 내부 표현 방식과 무관하게 행동만이 객체를 결정짓는 고려 대상이라는 사실은 외부에 데이터를 감춰야 한다는 것을 의미한다. 따라서 훌륭한 객체지향 설계는 외부에 행동만을 제공하고 데이터는 행동 뒤에 감춘다.
◦
이 원칙을 캡슐화라고 한다. 공용 인터페이스 뒤로 데이터를 캡슐화하라는 오래된 격언은 객체를 행동에 따라 분류하기 위해 지켜야하는 기본적인 원칙이다.
•
행동에 따라 객체를 분류하기 위해서는 객체가 내부적으로 관리해야 하는 데이터가 아닌 객체가 외부에 제공하는 행동을 먼저 생각해야 한다.
◦
객체가 외부에 제공하는 행동을 먼저 결정하고 그 책임을 수행하는 데 필요한 데이터를 나중에 결정한 후, 데이터를 책임을 수행하는 데 필요한 외부 인터페이스 뒤로 캡슐화해야 한다.
◦
흔히 책임-주도 설계라고 부르는 이 객체지향 설계 방법은 데이터를 먼저 생각하는 데이터 주도 설계 방법의 단점을 개선하기 위해 고안되었다.
•
객체를 결정하는 것은 행동이다. 데이터는 단지 행동에 종속되는 추상적인 개념일 뿐이다. 이것이 객체를 객체답게 만드는 가장 핵심적인 원칙이다.
타입의 계층
트럼프 계층
•
객체가 동일한 타입으로 분류되기 위해서는 공통의 행동을 가져야 한다. 그러나 등장인물들의 외양은 트럼프와 유사하지만 행동 자체는 트럼프와 완벽하게 동일하진 않다.
•
우리는 앞서 트럼프 타입의 정의, 즉 내연을 납작 엎드릴 수 있고 뒤집어질 수 있으며 걸을 때마다 몸이 종이처럼 좌우로 펄럭이는 존재로 정의했다.
◦
일반적으로 트럼프 카드는 납작 엎드리고 뒤집어질 순 있지만 걸어다닐 수는 없다.
•
따라서 우리는 트럼프 타입으로 불렸던 객체들을 좀 더 정확하게 트럼프 인간이라는 타입으로 분류하는 것이 옳다.
◦
트럼프 타입의 객체는 납작 엎드릴 수 있고 뒤집어질 수 있다. 트럼프 인간 타입의 객체는 납작 엎드릴 수 있고 뒤집어질 수 있으며 걸을 때마다 몸이 좌우로 펄럭인다.
•
트럼프 인간 타입의 객체는 트럼프 타입의 객체의 모든 행동을 할 수 있을 뿐만 아니라 추가로 걸어다닐 수까지 있다.
◦
다시 말해 트럼프 인간은 트럼프의 일종이지만 일반적인 트럼프 카드보다 좀 더 특화된 행동을 하는 트럼프인 것이다.
•
외연이라는 객체 집합에서 트럼프와 트럼프 인간 타입을 살펴보자. 트럼프 인간은 트럼프다. 따라서 모든 트럼프 인간은 동시에 트럼프이기도 하다.
◦
이것은 트럼프 인간 타입에 속하는 객체는 트럼프 타입의 객체에도 함께 속해야 한다는 것을 의미한다.
•
이 관점에서 트럼프는 트럼프 인간을 포괄하는 좀 더 일반적인 개념이다. 트럼프 인간은 트럼프보다 좀 더 특화된 행동을 하는 특수한 개념이다.
•
이 두 개념 사이의 관게를 일반화/특수화 관계라고 한다.
일반화/특수화 관계
•
여기서 알 수 있듯이 타입과 타입 사이에는 일반화/특수화 관계가 존재할 수 있다.
•
여기서 중요한 것은 객체지향에서 일반화/특수화 관계를 결정하는 것은 객체의 상태를 표현하는 데이터가 아니라 행동이라는 것이다.
◦
어떤 객체가 다른 객체보다 더 일반적인 상태를 표현하거다 더 특수한 상태를 표현한다고 해서 두 객체의 타입 간에 일반화/특수화 관계가 성립하는 것은 아니다.
•
행동의 관점에서 더 일반적인 타입이란 무엇이고 더 특수한 타입이란 무엇인가?
◦
일반적인 타입이란 특수한 타입이 가진 모든 행동들 중에서 일부 행동만을 가리키는 타입을 가리킨다.
◦
특수한 타입이란 일반적인 타입이 가진 모든 행동들을 포함하지만 거기에 더해 자신만의 해동을 추가하는 타입을 가리킨다.
•
따라서 일반적인 타입은 특수한 타입보다 더 적은 수의 행동을 가지고 특수한 타입은 일반적인 타입보다 더 많은 수의 행동을 가진다.
•
여기서 주의해야 할 점은 타입의 내연을 의미하는 행동의 가짓수와 외연을 의미하는 집합의 크기는 서로 반대라는 사실이다.
◦
일반적인 타입은 특수한 타입보다 더 적은 내연을 가지지만 외연은 더 크다.
◦
특수한 타입은 더 많은 내연을 가지지만 외연은 더 작다.
슈퍼타입과 서브타입
•
일반적인 타입을 슈퍼타입이라 하고 좀 더 특수한 타입을 서브타입이라고 한다.
•
두 타입 간의 관계가 행동에 의해 결정된다는 점을 다시 한번 강조한다. 즉 어떤 타입이 다른 타입의 서브 타입이 되기 위해서는 행위적 호환성을 만족시켜야 한다.
◦
일반적으로 서브타입은 슈퍼타입의 행위와 호환되기 때문에 서브타입은 슈퍼타입을 대체할 수 있어야 한다.
•
슈퍼타입의 행동은 서브타입에 자동으로 상속된다.
일반화는 추상화를 위한 도구다
•
앞서 말했던 추상화의 두 번째 차원은 중요한 부분을 강조하고자 불필요한 세부 사항을 제거시켜 단순하게 만드는 것이다.
◦
일반화/특수화 계층은 객체지향 패러다임에서 추상화의 두 번째 차원을 적절하게 활용하는 대표적인 예다.
•
앨리스의 입장에서 트럼프 인간이 할 수 있는 특수한 행동은 불필요했다. 따라서 앨리스는 그 시점에 중요한 사항인 트럼프가 가지는 내연에만 집중하고 불필요한 트럼프 인간의 특성을 제거하여 상황을 단순하게 만들었다.
•
여기서 두 가지 추상화 기법이 동시에 사용되었다는 점에 주목하자. 하나는 정원에 있던 등장인물들의 차이점은 배제하고 공통점만을 강조함으로써 이들의 공통 타입인 트럼프 인간으로 분류했다는 것이다.
•
다른 하나는 트럼프 인간을 좀 더 단순한 관점에서 바라보기 위해 불필요한 특성을 배제하고 좀 더 포괄적인 의미를 가진 트럼프로 일반화했다는 것이다.
•
이처럼 객체지향 패러다임을 통해 세상을 바라보는 거의 대부분의 경우에 분류와 일반화/특수화 기법을 동시에 적용하게 된다.
정적 모델
타입의 목적
•
타입을 사용하는 이유는 인간의 인지 능력으로는 시간에 따라 동적으로 변하는 객체의 복잡성을 극복하는 것이 너무 어렵기 때문이다.
•
앞선 예제에서 앨리스는 어떤 행동을 수행할 때마다 변한다. 앨리스라고 하는 객체의 상태는 변하지만 앨리스를 다른 객체와 구별할 수 있는 식별성은 동일하게 유지된다.
◦
따라서 우리는 머릿속에 앨리스가 가질 수 있는 모든 경우의 키를 저장해두는 대신, 앨리스의 키가 임의의 값을 가질 수 있다는 사실만을 생각함으로써 복잡도를 제어할 수 있다.
•
타입은 시간에 따라 동적으로 변하는 앨리스의 상태를 시간과 무관한 정적인 모습으로 다룰 수 있게 해준다.
◦
즉, 타입은 앨리스의 상태에 복잡성을 부과하는 시간이라는 요소를 제거함으로써 시간에 독립적인 정적인 모습으로 앨리스를 생각할 수 있게 해준다.
그래서 결국 타입은 추상화다
•
이런 관점에서 타입은 추상화다. 어떤 시점에 앨리스에 관해 생각할 때, 불필요한 시간이라는 요소와 상태 변화라는 요소를 제거하고 정적인 관점에서 앨리스의 모습을 묘사하는 것을 가능하게 해준다.
•
타입은 추상화다. 타입을 이용하면 객체의 동적인 특성을 추상화할 수 있다. 결국 타입은 시간에 따른 객체의 상태가 변경된다는 사실을 단순화할 수 있는 효과적인 방법인 것이다.
동적 모델과 정적 모델
•
객체를 생각할 때 우리는 두 모델을 동시에 고려한다.
•
하나는 객체가 특정 시점에 구체적으로 어떤 상태를 가지느냐다.
◦
이를 객체의 스냅샷이라 한다. UML에서 스냅샷은 객체 다이어그램이라고도 불린다. 스냅샷처럼 실제고 객체가 생명주기 동안 어떻게 변하고 행동하는지를 포착하는 것을 동적 모델이라고도 한다.
•
다른 하나는 객체가 가질 수 있는 모든 상태와 모든 행동을 시간에 독립적으로 표현하는 것이다.
◦
이런 모델을 타입 모델이라고 한다. 이 모델은 동적으로 변하는 객체의 상태가 아닌 객체가 속한 타입의 정적인 모습을 표현하기 때문에 정적 모델이라고도 한다.
•
객체지향 어플리케이션을 설계하고 구현하기 위해서는 객체 관점의 동적 모델과 객체를 추상화한 타입 관점의 정적 모델을 적절히 혼용해야 한다.
◦
동적 모델과 정적 모델의 구분은 실제로 프로그래밍이라는 행위와도 관련이 깊다.
▪
프로그래밍 언어를 통해 클래스를 작성하는 시점에는 시스템을 정적인 관점에서 접근하는 것이다.
▪
실제로 어플리케이션을 실행해 객체의 상태 변경을 추적하고 디버깅하는 동안에는 객체의 동적인 모델을 탐험하고 있는 것이다.
클래스
•
객체지향 프로그래밍 언어에서 정적인 모델은 클래스를 이용해 구현된다. 따라서 타입을 구현하는 가장 보편적인 방법은 클래스인 것이다.
•
타입을 구현하는 것이다. 클래스와 타입은 같은 개념이 아니다.
◦
타입은 객체를 분류하기 위해 사용하는 개념이다. 반면 클래스는 단지 타입을 구현할 수 있는 여러 구현 메커니즘 중 하나일 뿐이다.
•
객체를 분류하는 기준은 타입이며 타입을 나누는 기준은 객체가 수행하는 행동이라는 사실을 기억하자.
•
객체를 분류하기 위해 타입을 결정한 후, 프로그래밍 언어를 이용해 타입을 구현할 수 있는 한 가지 방법이 클래스라는 사실을 아는 것만으로도 충분하다.
•
궁극적으로 객체지향에서 중요한 것은 동적으로 변하는 객체의 상태와 상태를 변경하는 행위다.
◦
클래스는 타입을 구현하기 위해 프로그래밍 언어에서 제공하는 구현 메커니즘에 불과하다는 것을 기억하자.