よくある質問 (FAQ)
1. 混同行列 (Confusion Matrix)の読み方は?
混同行列は、学習済み分類器のパフォーマンスを評価するためのツールです。解釈の方法は以下の通りです:
- 行列のレイアウト
- 行 (Rows) は予測クラスを表します。これは、学習済み分類器がサンプルに対して予測した内容です。
- 列 (Columns) は実際のクラスを表します。これは、ソースデータ内でサンプルに割り当てられたラベルです。
- 主要な要素
- 対角線 (青色で網掛け): 真陽性 (True Positives) と 真陰性 (True Negatives) を表し、モデルがクラスを正しく予測した箇所です。
- 真陽性 (True Positive): モデルが陽性クラスを正しく予測した場合。
- 真陰性 (True Negative): モデルが陰性クラスを正しく予測した場合。
- 白いセル (対角線外): 偽陽性 (False Positives) と 偽陰性 (False Negatives) を表し、誤分類を示します。多クラスモデルでは、これらのセルは特定のクラス間の混同を浮き彫りにします。
- 対角線 (青色で網掛け): 真陽性 (True Positives) と 真陰性 (True Negatives) を表し、モデルがクラスを正しく予測した箇所です。
- 周辺情報
- 最下行 (Class Marginals): 各クラスの精度(緑色)とエラー率(赤色)を表示します。
- 右下隅: モデル全体の精度(緑色)と全体のエラー率(赤色)を表示します。
- 軸ラベルの相関
- X軸の番号は、Y軸のクラスラベルに対応しています。例えば、Y軸に「fan-balance (1)」がある場合、X軸の「1」は同じクラスを表します。
- データ表現
- 行列内の各数値は、セクション3.4および3.6に表示されるヒストグラムからのデータのセグメントまたはブロックに対応しています。
2. 良い混同行列とはどのようなものですか?
理想的には、良い混同行列は、白いセル(誤分類や誤った予測を示す)の数値が可能な限り小さくなっています。
注意
混同行列は、モデルの強みと、モデルが苦戦している可能性のある領域に関する貴重な洞察を提供し、分類器をさらに改良するのに役立ちます。
3. 複雑さ(Complexity)の数値はどのように解釈すべきですか?
複雑さの数値は、MCU/MPU上でのモデルのリソース消費量を測定するのに役立ちます。モデルはまだ最適化可能であるため、これらの数値は最終的なものではありません。例えば、前述のセクション3.9の決定重要度プロット(decision significance plot)では、重要な周波数帯域のほとんどが50 Hz未満の範囲にあることがわかります。これを知ることで、フィルターを使用して特徴量計算で50 Hz未満の周波数のみを使用し、リソース(乗算演算)を節約できます。
注意
プロジェクト作成段階でターゲットプロセッサを事前に選択した場合、トップモデルはそのプロセッサに適合するものになります。つまり、モデルのリソース消費量は、そのターゲットプロセッサの使用可能なリソースの範囲内に収まります。
4. One-vs-One分類戦略とは何ですか?
One-vs-One分類戦略は、機械学習モデル、特に多クラス分類タスクで使用されます。このアプローチでは:
- データセット内のクラスのペアごとに個別のバイナリ分類器(二値分類器)がトレーニングされます。
- 例えば、3つのクラス(A、B、C)がある場合、モデルは3つの分類器をトレーニングします:A対B用、A対C用、B対C用です。
- 予測中、モデルはすべてのペアワイズ分類器を評価し、投票メカニズムまたはその他の集計戦略に基づいて最終的なクラスを決定します。
この戦略は、複雑な多クラス問題をより単純なバイナリ分類タスクに分解するのに役立ち、決定構造の解釈が容易になります。