UnicodeDecodeError: ‘utf-8’ codec can’t decode byte

はじめに

Pythonで機械学習の勉強をはじめるようになって、ファイルを読み込むことが多くなった。

その際、UTF-8フォーマットじゃないと何かと

 UnicodeDecodeError: 'utf-8' codec can't decode byte

というエラーに陥ることになってしまったので、手順をまとめる

nkfコマンドのinstall

macでデフォルトで入っていないのでbrewコマンドでinstallする

brew install nkf 

変換

まずは作業前

 

変換コマンド

nkf -w --overwrite data.csv

文字コードが代わり、エラーは出なくなった。