インデックスとスライス
長い文章から「何文字目を取り出す」「一部を切り取る」といった、データの抽出テクニックを学びます。
1. 0から始まる「インデックス」
Pythonは文字のひとつひとつに 0番 から背番号を振っています。
word = "PYTHON"
print(word[0]) # 最初の文字
print(word[1]) # 2番目の文字
print(word[-1]) # 最後の文字
print(word[-2]) # 後ろから2番目
▶ 出力結果
P Y N O
2. 自由自在に切り抜く「スライス」
[開始 : 終了] と書くことで、指定した範囲を一気に抜き出せます。「終わりの番号は含まない」ことに注意!
date = "20240401"
year = date[0:4] # 0〜3番目(4は含まない)
month = date[4:6] # 4〜5番目
day = date[6:8] # 6〜7番目
print(year, "年", month, "月", day, "日")
▶ 出力結果
2024 年 04 月 01 日
3. 実用テク:後ろから切り取る
file = "document.pdf"
# 後ろから4文字を抜く(拡張子を取得)
extension = file[-4:]
print(extension)
# 最初から後ろ4文字の手前まで(ファイル名部分)
filename_only = file[:-4]
print(filename_only)
▶ 出力結果
.pdf document
