リリースノート@分析ツールnehan
※マニュアル「nehanで始める快適な分析生活」はこちら
これまでの教師あり学習機能は、1データ1機械学習モデル、が基本でした。
下記、サンプルデータのタイタニック号データにて、生存/死亡を推定するモデルを構築し、モデルの精度検証を行っている様子。
では、別のケースとして、サンプルデータの自動車メーカー別車データについて、車体金額を車体サイズから推定するモデルを検討してみます。
当然、メーカーごとに車体金額と車体サイズの関係性は違うので、メーカーごとに予測モデルを構築するのがベストでしょう。
が、これまでのnehanだと、メーカーごとにデータを分け、それぞれモデルを構築しようとすると、下記のような面倒なプロセスを作らないといけませんでした。
そこで、列のデータをグループとして扱い、そのグループごとに機械学習モデルを構築する機能をリリースしました。
この機能を用いて、上記の課題に取り組むと、下記のようにシンプルなノード構成で実現できます。
ノードの設定は、下記のように、各教師あり学習ノードの設定のオプションにて「グループごとにモデルを作成する」に列をセットするだけです。
中には、データが1行しかないメーカーもあり、そうなると当然モデルは作成できないのですが、このエラーをオプションでスキップすることもできます。
スキップされたグループを確認することもできます。この場合、下記4車種がデータが1行しかなく、モデルが構築できなかったとわかります。
機械学習や統計手法を用いた傾向分析や相関分析は、各グループごとにざっと傾向を見たいシーンもあります。
そういう場合でもこの機能は役立つと思いますので、ご活用ください。