Startup Data scientist Blog

データ分析系のテック情報を発信します

UNIX シェルを使ったファイル操作

data という名前の新しいディレクトリを作成します。

mkdir data

 

wget コマンドを使用して、Gitからデータセットをダウンロード

wrangling-shell/main/NASA-logs-1995.txt
wrangling-shell/main/NASA-software-API.txt

 

cdコマンドで作成したディレクトリに移動

cd data

 

lsコマンドでファイルがダウンロード出来ているのか確認

ls

NASA-software-API.txt ファイルと NASA-logs-1995.txt ファイルが表示される。

 

 

Head と tail コマンド

tailコマンドによりファイルの最後の 5 行を表示する。-n フラグを指定してコマンド tail コマンドを入力する。

tail -n 5  NASA-software-API.txt

 

headコマンドによりファイルの先頭の5行を表示する。-n フラグを指定してコマンド headコマンドを入力する。

head -n 5 NASA-software-API.txt

 

nlコマンド

フィルターコマンド。テキストファイルを行番号付きで出力する。

nl -s = NASA-software-API.txt

 

Output

697=SSC-00424 SSC 2013-09-06T00:00:00.000 "General Public" "SSC Site Status Mobile Application"
698=GSC-14732-1 GSFC 2004-06-09T00:00:00.000 "Open Source" "Tool For Interactive Plotting, Sonification, And 3D Orbit Display (TIPSOD)"
699=GSC-14730-1 GSFC 2004-06-09T00:00:00.000 "Open Source" "Space Physics Data Facility Web Services"
700=GSC-14726-1 GSFC 2004-06-09T00:00:00.000 "Open Source" "Earth Observing System (EOS) Clearinghouse (ECHO)"

 

nl -b a NASA-software-API.txt

 

Output

703  GSC-14726-1 GSFC 2004-06-09T00:00:00.000 "Open Source" "Earth Observing System (EOS) Clearinghouse (ECHO)"

 

 

wcコマンド

ファイル内の文字の数をカウントする。

wc NASA-software-API.txt

 

Output

703    8917   81115 NASA-software-API.txt

このファイルには行数 703、単語数 8,917、文字数 81,115 が含まれているということを意味する。