질문 45
웹 사이트 트래픽 분석을 스타 스키마에 저장할 엔터프라이즈 데이터 웨어하우스를 Azure Synapse Analytics에서 설계하고 있습니다.
웹사이트 방문에 대한 팩트 테이블을 만들 계획입니다. 이 테이블은 약 5GB가 될 것입니다.
테이블에 사용할 배포 유형과 인덱스 유형을 추천해야 합니다. 솔루션은 가장 빠른 쿼리 성능을 제공해야 합니다.
어떤 것을 추천하나요? 답변하려면 답변 영역에서 적절한 옵션을 선택하세요.
참고: 정답을 선택할 때마다 1점의 가치가 있습니다.


설명
박스 1: 해시
다음과 같은 경우 해시 분산 테이블을 사용하는 것이 좋습니다:
디스크의 테이블 크기가 2GB를 초과합니다.
테이블에는 삽입, 업데이트 및 삭제 작업이 자주 발생합니다.
상자 2: 클러스터된 컬럼 저장소
클러스터된 컬럼스토어 테이블은 최고 수준의 데이터 압축과 최고의 전반적인 쿼리 성능을 모두 제공합니다.
참조:
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables-distribu
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables-index
주제 1, Litware, Inc.
사례 연구
이것은 사례 연구입니다. 사례 연구에는 별도의 시간이 정해져 있지 않습니다. 각 사례를 완료하는 데 원하는 만큼의 시험 시간을 사용할 수 있습니다. 그러나 이 시험에는 추가 사례 연구 및 섹션이 있을 수 있습니다. 주어진 시간 내에 이 시험에 포함된 모든 문제를 완료할 수 있도록 시간을 관리해야 합니다.
사례 연구에 포함된 질문에 답하려면 사례 연구에 제공된 정보를 참조해야 합니다. 사례 연구에는 사례 연구에 설명된 시나리오에 대한 자세한 정보를 제공하는 전시물 및 기타 리소스가 포함될 수 있습니다. 각 질문은 이 사례 연구의 다른 질문과 독립적입니다.
이 사례 연구가 끝나면 검토 화면이 나타납니다. 이 화면에서는 시험의 다음 섹션으로 이동하기 전에 답을 검토하고 변경할 수 있습니다. 새 섹션을 시작한 후에는 이 섹션으로 돌아갈 수 없습니다.
사례 연구를 시작하려면
이 사례 연구의 첫 번째 질문을 표시하려면 다음 버튼을 클릭합니다. 질문에 답하기 전에 왼쪽 창에 있는 버튼을 사용하여 사례 연구의 콘텐츠를 탐색하세요. 이러한 버튼을 클릭하면 비즈니스 요구 사항, 기존 환경 및 문제 진술과 같은 정보가 표시됩니다. 사례 연구에 전체 정보 탭이 있는 경우에는 표시되는 정보가 후속 탭에 표시되는 정보와 동일하다는 점에 유의하세요. 질문에 답할 준비가 되면 질문 버튼을 클릭하여 질문으로 돌아갑니다.
개요
는 미국 전역에 300개의 편의점을 소유 및 운영하고 있습니다. 이 회사는 다양한 포장 식품과 음료는 물론 샌드위치, 피자 등 다양한 조리 식품을 판매합니다.
라이트웨어에는 결제 시 회원 번호를 입력하면 특정 품목에 대해 매일 할인을 받을 수 있는 로열티 클럽이 있습니다.
Litware는 Microsoft Power BI를 사용하여 데이터를 분석하는 것을 선호하는 비즈니스 분석가와 Azure 데이터브릭스 노트북에서 데이터를 분석하는 것을 선호하는 데이터 과학자를 고용하고 있습니다.
요구 사항
비즈니스 목표
Litware는 다음 요구 사항을 충족하기 위해 Azure에서 새 분석 환경을 만들고자 합니다:
스토어 전반의 재고 수준을 확인합니다. 데이터는 가능한 한 실시간에 가깝게 업데이트되어야 합니다.
과거 데이터에 대한 임시 분석 쿼리를 실행하여 로열티 클럽 할인이 할인된 제품의 매출을 증가시키는지 여부를 파악합니다.
4시간마다 판매 데이터의 과거 수요를 기반으로 준비된 식품의 생산량을 매장 직원에게 알립니다.
기술 요구 사항
Litware는 다음과 같은 기술 요구 사항을 식별합니다:
비즈니스 목표를 달성하는 데 필요한 다양한 Azure 서비스 수를 최소화하세요.
가능하면 서비스형 플랫폼(PaaS) 제품을 사용하고 Litware에서 관리해야 하는 가상 머신을 프로비저닝할 필요가 없도록 하세요.
분석 데이터 저장소는 회사의 온-프레미스 네트워크 및 Azure 서비스에서만 액세스할 수 있도록 하세요.
가능하면 Azure AD(Azure Active Directory) 인증을 사용하세요.
보안을 설계할 때는 최소 권한 원칙을 적용하세요.
분석 데이터 저장소에 데이터를 로드하기 전에 Azure Data Lake Storage Gen2에서 인벤토리 데이터를 스테이징합니다. Litware는 데이터가 더 이상 사용되지 않으면 Data Lake Storage에서 일시적인 데이터를 제거하려고 합니다.
수정된 날짜가 14일보다 오래된 파일은 제거해야 합니다.
이러한 유형의 데이터는 분석과 관련이 없으므로 비즈니스 분석가가 전화번호와 같은 고객 연락처 정보에 액세스할 수 없도록 제한하세요.
손상 또는 실수로 삭제된 경우 1시간 이내에 분석 데이터 저장소의 사본을 신속하게 복원할 수 있어야 합니다.
계획된 환경
Litware는 다음과 같은 환경을 구현할 계획입니다:
애플리케이션 개발팀은 매장 번호, 날짜, 시간, 제품 ID, 고객 충성도 번호, 가격, 할인 금액 등의 실시간 판매 데이터를 판매 시점 관리(POS) 시스템으로부터 수신하고 Azure의 데이터 저장소로 데이터를 출력하기 위해 Azure 이벤트 허브를 만듭니다.
이름, 연락처 정보 및 로열티 번호를 포함한 고객 데이터는 SaaS 애플리케이션인 Salesforce에서 제공되며 8시간에 한 번씩 Azure로 가져올 수 있습니다. 소스 테이블에서 행 수정 날짜는 신뢰할 수 없습니다.
제품 ID, 이름 및 카테고리를 포함한 제품 데이터는 Salesforce에서 제공되며 8시간에 한 번씩 Azure로 가져올 수 있습니다. 소스 테이블에서 행 수정 날짜는 신뢰할 수 없습니다.
일일 재고 데이터는 개인 네트워크에 위치한 Microsoft SQL 서버에서 가져옵니다.
Litware는 현재 5TB의 과거 판매 데이터와 100GB의 고객 데이터를 보유하고 있습니다. 향후 1년간 매월 약 100GB의 새로운 데이터가 생성될 것으로 예상하고 있습니다.
Litware는 4시간마다 얼마나 많은 준비된 식품을 생산해야 하는지에 대한 계산 결과를 매장 직원에게 제공하는 맞춤형 애플리케이션인 FoodPrep을 구축합니다.
Litware는 온-프레미스 네트워크와 Azure 간에 Azure ExpressRoute 또는 VPN을 구현할 계획이 없습니다.
댓글 남기기