python3 -m venv .venv(最初のみ) source .venv/bin/activate ←仮想環境に入る これでpip installができる deactivate ←仮想環境から出るコマンドの表示と実行 →python:インタープリターを選択 →VSコードでも仮想環境に入ることができる
今まで扱っていたデータは(例)アヤメの種類分別 では3種類の正解データがそれぞれ50種類均等にあったが,今回行う客船沈没事故での生存予測では正解データである死亡者データが549件,生存者データが342件と正解データの件数の比率に差が生じている. このようなデータを不均衡データという.
・決定木モデルは他のモデルに比べ,外れ値の影響を受けにくい.
例えば生存者データが5%,死亡者データが95%であった場合,モデルは法則など関係なくとりあえず死亡とすれば正解してしまうため,よくない.
明日以降は例題のコードを一から打つのではなく,修正だけしていく