リリースノート@分析ツールnehan

[2022.06.30リリースノート]不具合修正と機械学習リニューアルの予定機能公開

不具合修正

データソース、ビジュアライズ、データ処理における不具合の修正を行いました。


機械学習リニューアルの予定機能公開

まだ具体的なスケジュールは決まっておりませんが、機械学習機能のリニューアルを進めております。

下記、実装予定機能を初公開いたします。(あくまで予定である点ご了承ください)

リニューアルの思想

大きくは現状の課題を解決することにあります。

現状提供している精度最大化βは設定が面倒だったり、モデルが一つしか選べなかったりと、精度を突き詰めるにはやや力不足です。

また、出力結果の解釈もしづらく、改善に対すてアプローチしづらい状況です。

そのため、大きくは下記の2点を柱としてリニューアルを行います。

  • オートMLの提供
  • 学習モデルの解釈性向上

下記、カテゴリごとに機能をまとめてみました。

機能1:オートMLノード(仮称)

目的変数と説明変数を設定し実行するだけで、下記の処理を全自動で行います。

  • 前処理
    • 数値の外れ値処理
    • 欠損値処理
    • 特徴量生成
    • 数値列の変換
    • 文字列の変換
    • 特徴量選択
  • モデル構築とパラメータチューニング
    • LightGBM
    • ランダムフォレスト
    • SVM
    • CatBoost
  • モデルアンサンブル
  • 交差検証

また、最大化する精度指標を選べるオプションも用意します。

オートMLの性能は、Google BigQuery MLとも比較し、遜色ない精度を確認。また、Kaggleにもチャレンジし、一定の成果を収めております。

機能2:マニュアルMLノード(仮称)

既存のモデルタイプごとに分かれている機械学習ノードを一つに統合し、マニュアルMLノードとして提供予定です。

オートMLが全自動に対して、個別で自由に設定ができる機能となります。

大きくは

  • 目的変数、説明変数設定パート
  • モデルタイプ選択パート
  • モデルパラメータ設定パート
  • 前処理設定パート
  • 交差検証設定パート

を用意し、例えばモデルタイプを複数選択することで、精度比較を実施できます。

ある意味、予測精度最大化βの進化版に当たります。

機能3:アンサンブルノード(仮称)

別ノードにて、機能2で試したモデルをアンサンブルすることができるようになります。

複数のモデルタイプをアンサンブルしてもいいですし、異なるランダムシードで構築したモデルをアンサンブルしてもいいですし。

機能4:ボニートくんによる機械学習モデルの可視化

各精度指標や、分類であれば混合行列、など当然見るべきものがグラフィカルに見えるようになります。

また、学習曲線やROC曲線などの補足指標も見えるようになります。

合わせて、

  • 内部的にどう前処理されたか
  • ベストモデルに対してどの列のどの要素が寄与しているのか

が観察できるようにもなります。

下記、プロトタイプ段階のものですが、公開いたします。

前処理工程の可視化

 

各特徴量の影響度と、特徴量の要素別の影響を可視化

 

さてさて、いかがでしょうか。

こんなことはできるのか、などのご質問やご要望ありましたが、遠慮なくリクエストください。

どうぞよろしくお願いいたします。

コーポレートTOPへ

Contact