リリースノート@分析ツールnehan
データソース、ビジュアライズ、データ処理における不具合の修正を行いました。
まだ具体的なスケジュールは決まっておりませんが、機械学習機能のリニューアルを進めております。
下記、実装予定機能を初公開いたします。(あくまで予定である点ご了承ください)
大きくは現状の課題を解決することにあります。
現状提供している精度最大化βは設定が面倒だったり、モデルが一つしか選べなかったりと、精度を突き詰めるにはやや力不足です。
また、出力結果の解釈もしづらく、改善に対すてアプローチしづらい状況です。
そのため、大きくは下記の2点を柱としてリニューアルを行います。
下記、カテゴリごとに機能をまとめてみました。
目的変数と説明変数を設定し実行するだけで、下記の処理を全自動で行います。
また、最大化する精度指標を選べるオプションも用意します。
オートMLの性能は、Google BigQuery MLとも比較し、遜色ない精度を確認。また、Kaggleにもチャレンジし、一定の成果を収めております。
既存のモデルタイプごとに分かれている機械学習ノードを一つに統合し、マニュアルMLノードとして提供予定です。
オートMLが全自動に対して、個別で自由に設定ができる機能となります。
大きくは
を用意し、例えばモデルタイプを複数選択することで、精度比較を実施できます。
ある意味、予測精度最大化βの進化版に当たります。
別ノードにて、機能2で試したモデルをアンサンブルすることができるようになります。
複数のモデルタイプをアンサンブルしてもいいですし、異なるランダムシードで構築したモデルをアンサンブルしてもいいですし。
各精度指標や、分類であれば混合行列、など当然見るべきものがグラフィカルに見えるようになります。
また、学習曲線やROC曲線などの補足指標も見えるようになります。
合わせて、
が観察できるようにもなります。
下記、プロトタイプ段階のものですが、公開いたします。
前処理工程の可視化
各特徴量の影響度と、特徴量の要素別の影響を可視化
さてさて、いかがでしょうか。
こんなことはできるのか、などのご質問やご要望ありましたが、遠慮なくリクエストください。
どうぞよろしくお願いいたします。