モデルを作成してKaggleなどのコンペにsubmitする方法は、沢山の方が丁寧にレクチャーしてくれてて、そこまでは出来るんだけど、なんせスコアが改善されないんよ。特徴量エンジニアリングが上手に出来ないんよ。
数学の知識やデータ分析のスキルがないのに小手先でプログラムをイジったら一気にスコアが上がった!!というのを期待しているし、データを眺めている時間が圧倒的に少ないのはよく分かっている。
自分のスキルが無いくせに
特徴量を見つけてくれるのがAIなんじゃないん??
何から何までお膳立てしてあげなきゃダメなの??
なんてずっと思っていたけど、理想的なものを見つけてしまった!!
AutoML(自動機械学習):「機械学習モデルの設計や構築を自動化してくれる」
これよこれ!!こういうのを待っていたのよ!!!
ド素人なので、クラウドで有料のサービスではなく、インストールして無料で触れるものがないかと探していたら、Pycaretというライブラリーを見つけた。
同時にいつもお世話になっている我妻 幸長さんの「【AutoML】自動化された機械学習を学ぼう! 【PyCaret / Google Colab / Kaggle】」講座をudemyで購入した。
とても分かりやすい講義で一通りPycaretの使い方が分かった。
Pycaretの感想は、与えたデータに対して「どのモデルだとどれくらいの結果が出ますよ~」という検証してくれるくらいのものかなと思う。なので当然トレーニングデータをそのまま学習させてsubmitしてもランキングは全くよろしくない^^;
やはり、欠損値の処理とか特徴量を見つけ出すというのは人間がやらなきゃダメみたい。
まぁ、そりゃそうか。。。
GoogleのAutoMLとかはもっといろんなことをやってくれるのかもしれないし、Pycaretも将来はもっと人間がすることは減るのかもしれないけど、現時点ではそんな印象だった。
それでも、今の僕にとってPycaretはとてもありがたいライブラリなので、いろいろ試してみようと思う。