Linux 기본 명령어

Page content

개요

  • 기본 문법을 다뤄봅니다. (추가적으로 올리고 싶을 때마다 정리해서 올릴 예정입니다.)

unzip

  • 만약에 여러개의 zip 파일을 받는다면 어떻게 해야할까?
  • 다음과 같이 할 수도 있다.
$ unzip a.zip b.zip c.zip d.zip
  • 코드가 조금 길어지는 것 같다. 간단하게 하면 다음과 같이 할 수도 있다.
  • 캐글 대회 데이터를 직접 응용하도록 한다.
$ kaggle competitions download -c sf-crime
Warning: Looks like you're using an outdated API Version, please consider updating (server 1.5.10 / client 1.5.4)
Downloading test.csv.zip to /content
 48% 9.00M/18.7M [00:00<00:00, 52.3MB/s]
100% 18.7M/18.7M [00:00<00:00, 74.0MB/s]
Downloading sampleSubmission.csv.zip to /content
  0% 0.00/2.35M [00:00<?, ?B/s]
100% 2.35M/2.35M [00:00<00:00, 157MB/s]
Downloading train.csv.zip to /content
 41% 9.00M/22.1M [00:00<00:00, 33.6MB/s]
100% 22.1M/22.1M [00:00<00:00, 63.4MB/s]
  • 이번에는 목록을 확인한다.
$ ls
sampleSubmission.csv.zip  test.csv.zip  train.csv.zip
  • 이제 .zip 파일을 해제하도록 한다.
$ unzip '*.zip'
Archive:  train.csv.zip
  inflating: train.csv               

Archive:  test.csv.zip
  inflating: test.csv                

Archive:  sampleSubmission.csv.zip
  inflating: sampleSubmission.csv    

3 archives were successfully processed.
  • 실제 파이썬 코드를 확인해서 데이터 크기를 확인한다.
import os 
DATA_PATH = "./"
for file in os.listdir(DATA_PATH):
  if 'csv' in file and 'zip' not in file:
    print(file.ljust(30) + str(round(os.path.getsize(file) / 1000000, 2)) + 'MB')
test.csv                      91.0MB
sampleSubmission.csv          75.05MB
train.csv                     127.43MB

pwd

  • pwd는 Print Working Directory의 약자로써, 현재 작업중인 경로의 정보를 출력하는 명령어이다.
$ pwd
/Users/username

Reference

Chris Jean, Unzip Multiple Files from Linux Command Line Retrieved from https://chrisjean.com/unzip-multiple-files-from-linux-command-line/