/////
Search
Duplicate
3️⃣

스트림과 컬렉션

자바의 컬렉션스트림 모두 연속된 요소 형식의 값을 저장하는 자료구조의 인터페이스를 제공한다.
여기서 연속된이라는 표현은 순서와 상관없이 아무 값에나 접근하는 것이 아닌, 순차적으로 값에 접근한다는 것을 의미한다.
이제 컬렉션스트림의 차이를 알아보자.
시각적인 차이
DVD에 어떤 영화가 저장되어 있다고 할때, DVD에 전체 자료구조가 저장되어 있으므로 DVD도 컬렉션이다.
이번에는 DVD가 아니라 인터넷 스트리밍으로 같은 비디오를 시청한다고 하자. 여기서 스트리밍, 즉 스트림이 등장했다.
스트리밍으로 재생할 때는 몇 프레임을 미리 내려받는다. 그러면 스트림의 다른 대부분의 값을 처리하지 않은 상태에서 내려받은 프레임부터 재생할 수 있다.
데이터를 언제 계산하느냐가 컬렉션스트림가장 큰 차이다.
컬렉션은 현재 자료구조가 포함하는 모든 값을 메모리에 저장하는 자료구조다. 즉 컬렉션의 모든 요소는 컬렉션에 추가하기 전에 계산되어야 한다.
스트림은 이론적으로 요청할 때만 요소를 계산하는 고정된 자료구조다. 이러한 스트림의 특성은 프로그래밍에 큰 도움을 준다.
여기서 사용자가 요청하는 값만 스트림에서 추출한다는 것이 핵심이다. 물론 사용자 입장에서는 이런 변화는 알 수 없다.
결과적으로 스트림생산자소비자 관계를 형성하는데 스트림은 게으르게 만들어지는 컬렉션과 같다.
즉, 사용자(소비자)가 데이터를 요청할 때만 값을 계산한다.
⇒ 경영학에서는 이를 요청 중심 제조라고 부른다. 주문이 들어오면 제품을 생산한다.
반면 컬렉션은 적극적으로 생성된다.
⇒ 경영학에서는 이를 생산자 중심이라고 부른다. 주문이 들어오든 말든 일단 만들어놓고 판다.

1. 딱 한 번만 탐색할 수 있다.

반복자와 마찬가지로 스트림도 한 번만 탐색할 수 있다. 즉 탐색된 스트림의 요소는 소비되어진다.
한 번 탐색한 요소를 다시 탐색하려면 초기 데이터 소스에서 새로운 스트림을 다시 만들어야 한다.
⇒ 만일 데이터 소스가 I/O 채널이라면 소스를 반복 사용할 수 없으므로 새로운 스트림을 만들 수 없다.
List<String> title = Arrays.asList("Java8", "In", "Action"); Stream<String> s = title.stream(); s.forEach(System.out::println)); // title의 각 단어를 출력 s.forEach(System.out::println)); // java.lang.illegalStateException: 스트림이 이미 소비되었거나 닫힘
Java
복사
스트림은 단 한 번만 소비할 수 있다는 점을 명심하자.

2. 외부 반복과 내부 반복

컬렉션과 스트림의 또 다른 차이점은 데이터 반복 처리 방법이다.
컬렉션 인터페이스를 사용하려면 사용자가 직접 요소를 반복시켜야 한다.
이를 외부 반복이라고 한다. 반면 스트림 라이브러리는 내부 반복을 사용한다. 함수에 어떤 작업을 수행할지만 지정하면 모든 것이 알아서 처리된다.
List<String> names = new ArrayList<>(); for(Dish dish: menu) { // 메뉴 리스트를 명시적으로 순차 반복한다. name.add(dish.getName()); // 이름을 추출해서 리스트에 추가한다. }
Java
복사
for-each 구문은 반복자를 사용하는 불편함을 어느정도 해소해준다. for-each를 이용하면 Iterator 객체를 이용하는 것보다 더 쉽게 컬렉션을 반복시킬 수 있다.
다음은 위 for-each문의 내부 구현이다.
List<String> names = new ArrayList<>(); Iterator<String> iterator = menu.iterator(); while(iterator.hasNext()) { Dish dish = iterator.next(); name.add(dish.getName()); }
Java
복사
다음은 스트림의 내부 반복을 사용한 방법이다.
List<String> names = menu.stream() .map(Dish::getName) .collect(toList());
Java
복사
내부 반복은 외부 반복과 어떤 점이 다르며 어떤 이득을 줄까?
내부 반복을 사용하면 작업을 투명하게 병렬적으로 처리하거나 최적화된 다양한 순서로 처리가 가능하다.
외부 반복에서는 병렬성을 스스로 관리해야 한다.
외부 반복을 사용하면 How 중심의 코드를 짜게 되지만, 내부 반복을 이용하면 What 중심의 코드를 짤 수 있다.
⇒ 더 직관적이며 병렬성을 쉽게 사용할 수 있게 제공해준다.