ナイーブベイズを実装した

上から、真の出力確率、潜在変数と出力のサンプル(潜在変数1個あたり5個の出力を出している)、訓練データ(潜在変数と出力の対)、そのデータで学習した後の出力確率、それを元に別の出力系列から潜在変数を推測したもの。3本の一番上が真の潜在変数で、真ん中がそこからの出力、一番下が出力だけを見て潜在変数を推測したものだ。出力確率がこれだけきれいに別れていると推測もきれいに全部正解。

しかしやっぱり出力確率が大きく重なっていたりすると判別ミスが起きる。

学習データを多くしてみたけど、そもそもどちらのクラスタからでも出力される出力(青と紫)の所はうまく判別しろって言われても情報が足りなくて無理だよねぇ。