Chapter 11: 실무에서 사용하는 도구들

Tableau, Power BI, Looker와 같은 도구 소개

Excel에서 더 정교한 데이터 분석 도구로 넘어가면, 강력한 비즈니스 인텔리전스(BI) 및 대시보드 도구들을 접하게 됩니다. 이러한 도구들은 데이터베이스와 연결되고, 대용량 데이터를 처리하며, 데이터를 시각적으로 생동감 있게 표현하는 인터랙티브 시각화를 제공합니다.

가장 인기 있는 대시보드 도구들을 살펴보고, 각각의 장점, 유사점, 차이점을 이해해봅시다.

Tableau

Tableau는 시장에서 가장 강력한 데이터 시각화 도구 중 하나로 평가받고 있습니다. 2003년에 설립되어 조직이 데이터를 시각화하고 이해하는 방식을 혁신했습니다.

주요 기능:

  • 다양한 차트 유형을 지원하는 뛰어난 시각화 기능
  • 직관적인 드래그 앤 드롭 인터페이스
  • 강력한 데이터 탐색 및 인사이트 발견 기능
  • 거의 모든 데이터 소스에 연결 가능
  • 데스크톱, 서버, 클라우드 배포 옵션
  • 탄탄한 커뮤니티 및 방대한 학습 리소스

Excel 사용자 관점: Excel에서 차트를 만드는 것을 즐겼다면 Tableau의 시각화 접근 방식을 분명히 좋아할 것입니다. 인터페이스가 약간 비슷한 느낌이 나며, 필드를 선택해 ‘선반(Shelf)’에 올리는 방식은 Excel에서 차트를 만드는 과정과 유사합니다. 그러나 Tableau는 훨씬 더 다양한 시각화 옵션과 인터랙티브 기능을 제공합니다.

Tableau의 계산 언어는 Excel 사용자가 친숙하게 느낄 수 있으며, SUM, AVERAGE, IF 문과 같은 유사한 함수들을 사용하지만 문법은 다소 다릅니다.

Power BI

Microsoft의 Power BI는 특히 Microsoft 제품을 사용하는 조직 내에서 빠르게 인기를 얻고 있는 도구입니다. 경쟁력 있는 가격에 종합적인 BI 기능을 제공합니다.

주요 기능:

  • Excel, Azure 등 다른 Microsoft 제품과의 원활한 통합
  • 사용자 지정 계산식을 위한 DAX (Data Analysis Expressions)
  • 데이터 변환을 위한 Power Query (Excel과 동일한 기술)
  • AI 기반 인사이트 및 자연어 질의 기능
  • 데스크톱, 서비스(클라우드), 모바일 버전 제공
  • 매월 기능 업데이트

Excel 사용자 관점: Power BI는 Excel 사용자에게 가장 익숙한 전환 경로를 제공합니다. Power BI의 Power Query는 Excel과 동일하며, 시각화 개념 또한 Excel의 차트와 유사합니다. Excel의 피벗 테이블을 사용해본 경험이 있다면, Power BI의 데이터 모델링 및 시각화 방식이 친숙하게 느껴질 것입니다.

Power BI의 DAX는 Excel의 수식 개념을 확장하지만, 연관된 테이블 간의 계산 방식에는 중요한 차이가 있습니다.

Looker (Google Cloud)

Looker는 BI에 대해 색다른 접근 방식을 제공합니다. 조직 전체에서 비즈니스 메트릭을 일관되게 정의하는 시맨틱 모델링 계층에 중점을 둡니다.

주요 기능:

  • 중앙 집중형 데이터 모델 생성을 위한 LookML
  • 강력한 데이터 거버넌스 기능
  • 애플리케이션에 대시보드를 통합할 수 있는 임베디드 분석 기능
  • 인사이트 공유를 위한 협업 기능
  • 클라우드 기반 아키텍처
  • Google Cloud Platform과의 통합

Excel 사용자 관점: Looker는 Tableau나 Power BI보다 Excel 사용자에게 더 큰 도약이 필요합니다. LookML이라는 코드 기반 언어로 데이터 모델을 정의해야 하며, Excel처럼 시각적인 인터페이스는 아닙니다. 하지만 데이터 모델이 설정되면 시각화 생성은 비교적 간단해집니다.

Looker Studio (구 Google Data Studio)

Looker Studio는 모든 기술 수준의 사용자를 위해 설계된 Google의 무료 데이터 시각화 및 리포팅 도구입니다.

주요 기능:

  • 무료로 사용 가능
  • Google Analytics, Google Ads 등과의 쉬운 통합
  • 공유 가능하고 협업 가능한 리포트
  • 빠른 시작을 위한 템플릿 갤러리 제공
  • 웹사이트에 리포트 임베딩 가능
  • 다양한 데이터 소스를 위한 커뮤니티 커넥터 지원

Excel 사용자 관점: Looker Studio는 Excel 사용자에게 비교적 쉬운 학습 곡선을 제공합니다. 인터페이스가 직관적이고, 시각화 개념도 익숙하게 느껴집니다. 큰 비용을 들이지 않고 Excel을 넘어서는 첫걸음을 떼기에 적합한 도구입니다.

그 외 주목할 만한 도구

다른 주요 대시보드 도구들도 있습니다:

  • Qlik Sense: 모든 데이터 요소 간 관계를 유지하는 연관 엔진으로 유명
  • Domo: 비즈니스 사용자 중심의 클라우드 기반 플랫폼
  • Sisense: 인칩 처리 기술을 통해 대규모 복잡한 데이터셋을 효율적으로 처리

비교: 언제 어떤 도구를 사용할 것인가?

적절한 대시보드 도구를 선택하는 것은 필요성, 기술 수준, 조직 환경에 따라 다릅니다. 다음은 의사 결정을 돕기 위한 비교입니다:

Power BI: Microsoft 중심 조직에 적합

Power BI가 적합한 경우:

  • 조직이 Microsoft 제품을 광범위하게 사용 중인 경우
  • 비용 효율적이면서도 좋은 시각화 기능이 필요한 경우
  • 팀이 Excel에 익숙하고 비슷한 경험을 원하는 경우
  • 다양한 소스(예: Excel 파일)에서 데이터를 통합해야 하는 경우
  • AI 기반 인사이트 및 자연어 질의가 필요한 경우

예시 시나리오: Excel 스프레드시트와 SQL Server 데이터베이스를 주로 사용하는 재무 부서가 예산 추적 및 재무 리포트를 위한 대시보드를 만들고자 할 때 Power BI는 친숙한 인터페이스, Excel 통합성, 합리적인 라이선스 비용으로 탁월한 선택입니다.

Tableau: 고급 시각화가 필요한 경우

Tableau가 적합한 경우:

  • 고급 시각화가 주요 요구사항인 경우
  • 커스터마이징 가능한 인터랙티브 대시보드가 필요한 경우
  • 데이터 탐색 및 인사이트 발견이 중요한 경우
  • 다양한 데이터 소스를 결합해야 하는 경우
  • 비용보다 기능이 더 중요한 경우

예시 시나리오: 마케팅 분석팀이 웹 분석, CRM, 마케팅 자동화 플랫폼 데이터를 결합하여 고객 여정에 대한 복잡한 시각화를 만들어야 할 때 Tableau는 탁월한 시각화 기능과 강력한 데이터 결합 능력으로 이상적입니다.

Looker: 엔터프라이즈 데이터 거버넌스에 적합

Looker가 적합한 경우:

  • 조직 전반에서 일관된 메트릭 정의가 중요한 경우
  • 비즈니스 로직을 위한 중앙 시맨틱 계층이 필요한 경우
  • LookML을 다룰 수 있는 개발자가 있는 경우
  • 애플리케이션 내 임베디드 분석이 필요한 경우
  • Google Cloud Platform을 많이 사용하는 경우

예시 시나리오: 대형 e-commerce 기업이 “활성 고객”이나 “고객 생애 가치” 같은 메트릭을 모든 부서에서 일관되게 사용해야 할 때 Looker의 시맨틱 모델링 계층은 한 번 정의한 메트릭을 모든 대시보드에서 재사용할 수 있게 해줍니다.

Looker Studio: 단순하고 무료 대시보드에 적합

Looker Studio가 적합한 경우:

  • 기본적인 대시보드가 필요한데 비용이 부담스러운 경우
  • 이미 Google Analytics 등의 Google 서비스를 사용 중인 경우
  • 데이터 규모가 중간 수준인 경우
  • 리포트를 웹사이트에 공개하거나 공유해야 하는 경우
  • 대시보드 초심자로서 학습을 시작하고 싶은 경우

예시 시나리오: 소규모 사업자가 웹사이트 성과 및 온라인 광고 결과를 추적하는 대시보드를 만들고자 할 때, Looker Studio는 무료이며 Google Analytics와 직접 통합되고 사용이 쉬워 매우 적합합니다.

SQL이 대시보드의 백엔드에서 작동하는 방식

대시보드 도구는 시각적인 인터페이스를 제공하지만, 그 뒤에서는 SQL이 데이터 조회 및 처리를 담당하는 경우가 많습니다. 이 관계를 이해하면 더 효율적이고 효과적인 대시보드를 만들 수 있습니다.

SQL과 대시보드의 연결

대시보드 도구와 상호작용할 때 일반적으로 다음과 같은 단계가 진행됩니다:

  1. 연결(Connection): 도구가 드라이버 또는 API를 통해 데이터베이스에 연결
  2. 쿼리 생성(Query Generation): 필드를 드래그하거나 필터를 적용하면 SQL 쿼리가 자동 생성
  3. 쿼리 실행(Query Execution): 생성된 SQL 쿼리가 데이터베이스 서버에서 실행됨
  4. 데이터 반환(Data Retrieval): 결과가 대시보드 도구로 반환됨
  5. 시각화(Visualization): 반환된 데이터를 기반으로 시각화 구성

예시:

대시보드 동작: 올해의 제품 카테고리별 총 매출을 보여주는 막대 차트 생성

생성된 SQL:

SELECT 
    product_category,
    SUM(sales_amount) AS total_sales
FROM 
    sales
WHERE 
    sale_date BETWEEN '2025-01-01' AND '2025-12-31'
GROUP BY 
    product_category
ORDER BY 
    total_sales DESC;

대시보드 동작: 특정 지역만 필터링

업데이트된 SQL:

SELECT 
    product_category,
    SUM(sales_amount) AS total_sales
FROM 
    sales
WHERE 
    sale_date BETWEEN '2025-01-01' AND '2025-12-31'
    AND region = 'Northeast'
GROUP BY 
    product_category
ORDER BY 
    total_sales DESC;

도구별 SQL 처리 방식

Power BI

Power BI는 두 가지 주요 모드로 데이터베이스와 작동합니다:

  1. Import 모드: 데이터를 Power BI의 메모리 내 엔진으로 가져와 내부에서 시각화 처리 (Excel의 Power Pivot과 유사)
  2. DirectQuery 모드: 실시간으로 SQL 쿼리를 생성하고 실행하여 항상 최신 데이터를 표시하지만 성능은 낮을 수 있음

Power BI는 또한 직접 SQL 쿼리를 작성해 데이터베이스와 연결하는 기능을 제공합니다.

Tableau

Tableau는 SQL 생성 효율성이 높은 것으로 유명합니다:

  1. Live 연결: 실시간 쿼리 생성 및 실행 (Power BI의 DirectQuery와 유사)
  2. Extract 모드: 데이터를 Tableau 전용 포맷으로 추출해 성능 향상 (Power BI의 Import와 유사)

“Show Me” 기능은 선택된 필드에 따라 적절한 시각화를 제안하며, 그에 맞는 SQL을 자동 생성합니다.

Looker

Looker는 LookML이라는 고유 언어로 접근합니다:

  1. LookML 정의: 차원, 측정값, 관계를 정의
  2. SQL 생성: 사용자가 시각화를 생성할 때 Looker가 SQL을 자동 생성
  3. 쿼리 최적화: 파생 테이블, 증분 처리 등 SQL 최적화 기능 내장

SQL 이해의 이점

대시보드 도구의 시각적 인터페이스만 사용하더라도 SQL을 이해하면 다음과 같은 장점이 있습니다:

  1. 성능 최적화: SQL 생성 방식을 알면 성능이 뛰어난 대시보드를 설계할 수 있음
  2. 문제 해결: 데이터가 예상대로 표시되지 않을 때 SQL을 통해 원인을 파악 가능
  3. 고급 커스터마이징: 시각적 인터페이스로 불가능한 복잡한 작업을 SQL로 처리 가능
  4. 데이터 준비: 대시보드 생성을 위한 뷰나 저장 프로시저 작성 가능

실제 예시: SQL에서 대시보드까지

시나리오: 판매 성과 대시보드

리테일 회사에서 판매 성과 대시보드를 만든다고 가정해 봅시다. SQL 데이터베이스에는 주문, 고객, 제품, 영업사원 테이블이 있습니다.

Step 1: SQL 쿼리 작성

SELECT 
    p.category AS product_category,
    c.region AS customer_region,
    r.name AS sales_rep,
    EXTRACT(MONTH FROM o.order_date) AS month,
    EXTRACT(YEAR FROM o.order_date) AS year,
    SUM(o.quantity * o.unit_price) AS total_sales,
    COUNT(DISTINCT o.order_id) AS order_count,
    COUNT(DISTINCT o.customer_id) AS customer_count
FROM 
    orders o
JOIN 
    customers c ON o.customer_id = c.customer_id
JOIN 
    products p ON o.product_id = p.product_id
JOIN 
    sales_reps r ON o.sales_rep_id = r.sales_rep_id
WHERE 
    o.order_date BETWEEN '2024-01-01' AND '2024-12-31'
GROUP BY 
    p.category,
    c.region,
    r.name,
    EXTRACT(MONTH FROM o.order_date),
    EXTRACT(YEAR FROM o.order_date);

Step 2: 대시보드 도구에서 데이터베이스 연결

Power BI 기준:

  1. SQL 데이터베이스에 연결
  2. 위 쿼리를 직접 사용하거나 관련 테이블 선택
  3. 테이블 간 관계 설정 (모델 뷰)

Step 3: 시각화 생성

  • 월별 매출 추세 라인 차트
  • 제품 카테고리별 매출 막대 차트
  • 고객 지역별 매출 지도 시각화
  • 상위 영업사원 테이블

Step 4: 인터랙티브 요소 추가

  • 날짜 범위 선택기
  • 제품 카테고리 필터
  • 지역 필터
  • 영업사원 드롭다운

Step 5: 성능 최적화

  • 자주 사용하는 메트릭에 대한 뷰 생성
  • 대용량 데이터셋에 대해 증분 새로고침 사용
  • 데이터베이스 테이블에 인덱스 추가
  • 일별/월별/분기별로 사전 집계된 데이터 사용 고려

결론

Tableau, Power BI, Looker와 같은 대시보드 도구는 조직이 데이터를 시각화하고 분석하는 방식을 혁신했습니다. Excel은 여전히 유용하지만, 이러한 전문 도구들은 대시보드 생성, 데이터 연결, 인터랙티브 분석 측면에서 훨씬 더 강력한 기능을 제공합니다.

이러한 도구의 백엔드에서 SQL이 어떻게 작동하는지를 이해하면, 더 효율적인 대시보드를 만들 수 있고 데이터베이스 관리와 데이터 시각화 사이의 간극을 메울 수 있습니다.

다음 장에서는 데이터, 데이터베이스, SQL, 대시보드가 현대 분석 워크플로우에서 어떻게 유기적으로 연결되는지 살펴보며, 원시 데이터에서 인사이트로 이어지는 여정을 완성하겠습니다.