Linux 기본 명령어
Page content
개요
- 기본 문법을 다뤄봅니다. (추가적으로 올리고 싶을 때마다 정리해서 올릴 예정입니다.)
unzip
- 만약에 여러개의
zip
파일을 받는다면 어떻게 해야할까? - 다음과 같이 할 수도 있다.
$ unzip a.zip b.zip c.zip d.zip
- 코드가 조금 길어지는 것 같다. 간단하게 하면 다음과 같이 할 수도 있다.
- 캐글 대회 데이터를 직접 응용하도록 한다.
$ kaggle competitions download -c sf-crime
Warning: Looks like you're using an outdated API Version, please consider updating (server 1.5.10 / client 1.5.4)
Downloading test.csv.zip to /content
48% 9.00M/18.7M [00:00<00:00, 52.3MB/s]
100% 18.7M/18.7M [00:00<00:00, 74.0MB/s]
Downloading sampleSubmission.csv.zip to /content
0% 0.00/2.35M [00:00<?, ?B/s]
100% 2.35M/2.35M [00:00<00:00, 157MB/s]
Downloading train.csv.zip to /content
41% 9.00M/22.1M [00:00<00:00, 33.6MB/s]
100% 22.1M/22.1M [00:00<00:00, 63.4MB/s]
- 이번에는 목록을 확인한다.
$ ls
sampleSubmission.csv.zip test.csv.zip train.csv.zip
- 이제
.zip
파일을 해제하도록 한다.
$ unzip '*.zip'
Archive: train.csv.zip
inflating: train.csv
Archive: test.csv.zip
inflating: test.csv
Archive: sampleSubmission.csv.zip
inflating: sampleSubmission.csv
3 archives were successfully processed.
- 실제 파이썬 코드를 확인해서 데이터 크기를 확인한다.
import os
DATA_PATH = "./"
for file in os.listdir(DATA_PATH):
if 'csv' in file and 'zip' not in file:
print(file.ljust(30) + str(round(os.path.getsize(file) / 1000000, 2)) + 'MB')
test.csv 91.0MB
sampleSubmission.csv 75.05MB
train.csv 127.43MB
pwd
- pwd는 Print Working Directory의 약자로써, 현재 작업중인 경로의 정보를 출력하는 명령어이다.
$ pwd
/Users/username
Reference
Chris Jean, Unzip Multiple Files from Linux Command Line Retrieved from https://chrisjean.com/unzip-multiple-files-from-linux-command-line/