(AWS Project) BigData with Hadoop 04 - Allow SSH Access
Page content
I. Getting Started
- 처음 이 페이지를 방문했다면, 반드시 사전작업을 완료하기를 바란다.
II. What to do now
Client
에서SSH
를 통해 클러스터에 접근하는 방법에 대해 다룬다.
(1) Warning
- 보안 그룹은 클러스터에 대한 인바운드 및 아웃바운드 트래픽을 제어하는 가상 방화벽 역할을 한다.
- 첫 번째 클러스터를 생성하면 Amazon EMR은 마스터 인스턴스, ElasticMapReduce-master와 연결된 기본 Amazon EMR 관리 Security Group 및 핵심 노드 및 태스크 노드와 연결된 Security Group ElasticMapReduce-slave를 생성한다.
Warning: 공용 서브넷의 마스터 인스턴스에 대한 기본 EMR 관리 보안 그룹 ElasticMapReduce-master는 모든 소스(IPv4 0.0.0/0)에서 포트 22의 인바운드 트래픽을 허용하는 규칙으로 사전 구성된다. 이는 마스터 노드에 대한 초기 SSH 클라이언트 연결을 단순화하기 위한 것이다. 보안 이슈가 생길 우려가 있기 때문에 AWS는 이 인바운드 규칙을 편집하여 신뢰할 수 있는 소스의 트래픽만 제한하거나 액세스를 제한하는 사용자 지정 보안 그룹을 지정해야 한다.
- 보안 그룹을 수정하는 것에 관한 것은 본 튜토리얼에서는 다루지 않지만, 모든 소스의 인바운드 트래픽을 허용하지 않는 것이 좋다는 것만 이해하자.
- 현재로써는 그럴일이 없지만, 만약 또한 다른 사용자가 권장 사항에 따라 이 규칙을 제거하기 위해
ElasticMapReduce-master Security Group
을 편집한 경우 다음 단계에 SSH를 사용하여 클러스터에 액세스할 수 없다. - 보안 그룹과 관련된 문서 가이드는 다음을 참조한다.
(2) Change
ElasticMapReduce-master Security Group에 대한 SSH
를 사용하여 공용 액세스를 허용하는 인바운드 규칙을 제거하고, 제한된 규칙으로 접근하도록 허용한다.- 다음 절차는
ElasticMapReduce-master
보안 그룹이 이전에 편집되지 않았다고 가정한다. - 또한
Security Group
을 편집하려면 클러스터가 있는VPC
의Security Group
을 관리할 수 있는 루트 사용자 또는IAM
주체로AWS
에 로그인해야 한다. IAM User
에 관한 정책을 확인하려면 다음 문서를 확인하자.
III. Practice with Editing
- 먼저 Amazon EMR console에 접속한다.
- 둘째, 지난시간에 만든
Cluster
를 선택한다. - 셋째,
Cluster
의 이름을 선택한다. - 넷째,
Security and Access
항목에서 링크를 클릭한다.
- 다섯째,
보안그룹 ID
를 클릭하는데ElasticMapReduce-master
를 선택한다.
- 여섯째,
Inbound
를 선택한 후Edit
을 클릭한다.
-
일곱번째,
만약에
다음과 같은Settings
가 되어 있다면x
icon을 클릭한 후 다음 항목을 삭제한다.- Type: SSH
- Port: 22
- Source: Custom 0.0.0.0/0
-
여덟번째, 스크롤을 내린 후
Rule
을 추가한다.
- 아홉번째,
Type
항목에서SSH
를 클릭한다.- 자동적으로 Protocol에서는
TCP
,Port Range
에서는22
를 클릭한다.
- 자동적으로 Protocol에서는
- For Source,
My IP
를 클릭한다.- 이렇게 하면 클라이언트 컴퓨터의 IP 주소가 자동으로 원본 주소로 추가된다.
- 또는 사용자 정의 신뢰할 수 있는 클라이언트 IP 주소 범위를 추가하고 규칙 추가를 선택하여 다른 클라이언트에 대한 추가 규칙을 만들 수 있다.
- 많은 네트워크 환경에서 IP 주소는 동적으로 할당되므로, 신뢰할 수 있는 클라이언트의 IP 주소를 업데이트하기 위해 정기적으로 Security Group 규칙을 편집해야 할 수 있다.
- 열번째, 마지막으로 추가된 규칙을 저장 후
SSH
규칙이 추가 변경된 것을 확인한다.
IV. What’s next
- 다음에 진행해야 하는
Tutorial
은Hive Script
를EMR
클러스터에서 실행하여 데이터 처리를 진행해본다.