決定木の交互作用による弱エッジの有効活用を考える:聖杯システムは身近にある(3)



決定木で分析を行う際、よく見かけるのがデータを放り込み、そのままの設定で木を成長させるというものだ。

そして何の工夫もないまま生成させた木に対して独善的な解釈を加えていく。


実際、上記のような使い方しかできないツールも多く、ツール開発者側も分析の本質を理解していないと言わざるを得ない。


あるツールがバージョンアップされたとき、分岐させる変数を自由に選択できなくなっていたので、提供会社に問い合わせたことがあった。

対応してくれた女性はリサーチに詳しく丁寧に受け答えしてくれてはいたが、言葉の端々で「何をそんなに文句いってるんだ、こいつ?」的な空気が電話口から伝わってきた。

それほどシンプルな分析でありながら使いこなせていないデータサイエンティストが多いのだろう。

(幸い、オプションの奥の方に希望の設定はあったが。)


ニューラルネットワークや自己組織化特徴マップなどの他の分析手法に対して決定木が優れている点は、解釈容易性である。

その特徴を活かすためには、分析者はデータに対する事前仮説をしっかりと持っておくことが重要だ。

データを放り込んだらあとはツールが何か出してくれるだろう、という姿勢では意味のある分析結果は絶対に得られない。

こういうレベルの人物に現在のビッグデータブームにのってドヤ顔でデータマイニングを語られると、これから真摯にデータマイニングを学ぼうと考えている人材をミスリードしてしまうのではと危惧してしまう。


システムトレードでも同様に、堅牢なシステムを構築しようと考えるならば、分岐させるべき変数にはマーケットメカニズムに基づく確固たる事前仮説を用意しておこう。


私にはその信念があったからこそ、土屋氏のセミナーの、ほぼ全員が聞き逃してしまったであろう決定木モデルに(もしかしたら唯一?)反応できたのだろう。

その時だけは、長年データマイニングに従事してきたことに感謝したものだった。

サブコンテンツ

トレード歴:18年
パフォーマンス:
年利30~60%を10年以上継続中
職業:データサイエンティスト
居住地:東京
年齢:40歳前後

イベント投資の第一人者「夕凪」さんの思考と技術に渾身が鋭く切り込む音声対談。 明日から直接使えるテクニックや専業トレーダーとしての心得など、何度も繰り返し聞いて欲しい内容が満載。 トレードスクールの座談会として実施した企画でもあるので、その熱の籠もった雰囲気も同時に楽しんで欲しい。

このつづきはメルマガにて!

「トレードスクール需要調査」
次期開催希望者10名/15名でオリエンテーション開催
スクールカリキュラムのご案内 過去のトレードスクールの模様

「HITPカリキュラムのご案内」
次期開催希望者1名/2名でオリエンテーション開催
オリエンテーション仮申し込み

HITPメンバーブログ

Factatics_Fund
現役トレーダーが熱く語るハイレベルトレード術
週株!TAのイベントトレード研究所
イベント投資(株主優待投資法など)を検証研究しているブログ

このページの先頭へ