(AWS Project) BigData with Hadoop 05 - Hive Script 연습 예제

I. Getting Started
- 처음 이 페이지를 방문했다면, 반드시 사전작업을 완료하기를 바란다.
II. What to do now
Hive Script를 제출하는 방법에 대해 준비하였다.- 를러스터를 생성할 때 단계를 지정하거나 마스터 노드에 연결하고 로컬 파일 시스템에서 스크립트를 생성하고 명렁어를 사용하여 실행할 수 있다.
III. 데이터와 스크립트에 대한 이해
- 본 튜토리얼에서 사용하는 샘플 데이터와 스크립트는 Amazon S3에서 사용이 가능하다.
- 샘플 데이터는 일련의 Amazon CloudFront 액세스 로그 파일이다.
- CloudFront 및 로그 파일 형식에 대한 자세한 정보는 다음을 확인한다.
- Amazon CloudFront Developer Guide
- 데이터의 위치는 아래와 같이 저장된다.
s3://region.elasticmapreduce.samples/cloudfront/
- 여기에서
region은 사용자의region이다.
(1) 스크립트 제출 시
- script를 제출할 때 위치를 입력하면 스크립트가 클라우드 프런트/데이터 부분을 추가하기 때문에 생략한다.
CloudFront로그 파일의 각 항목은 다음과 같은 형식으로 단일 사용자 요청에 대한 세부 정보를 제공한다.
2014-07-05 20:00:00 LHR3 4260 10.0.0.15 GET eabcd12345678.cloudfront.net /test-image-1.jpeg 200 - Mozilla/5.0%20(MacOS;%20U;%20Windows%20NT%205.1;%20en-US;%20rv:1.9.0.9)%20Gecko/2009040821%20IE/3.0.9
