08.集計資料作成
データを効果的に分析するためには、適切なフォーマットにのっとって集計資料を作成する必要があります。
ここでは“使える”基礎資料を、ステップを追って作成していきましょう。(私の昔の資料を引っ張り出してきましたので、今回は“日経225先物”のデータを使用します。)
1.前提事項の調査
銘柄名や期間、レコード数など、集計すべきデータの前提条件を記述する。

2.集計項目の洗い出し
集計すべき項目を考えられるだけ洗い出す。
あまり深く考えず、思いつくものからどんどん出してゆく。同時に用する単語も定義していくこと。(自分が使う資料なので、自分がわかりやすい名称にする。)そして集計していくうちにまた新たな項目が想起されるので、思いついた時点で再度追加する。
Ex. 期間最高値/期間最安値/始終最大値幅/始終最大上昇値…陽線数/陰線数/同値数/連続陽線数/終値連続上昇数/終値連続下降数…始終/高安/始高/始安/終高/終安…
Ex. 「始高」→ 高値 - 始値:1日の高値から始値を引いた値幅
3.類似項目の分類
洗い出された項目を、意味合いの近いもの同士をまとめる。
人間はパターン認識を容易にするため、脳の中で無意識に入力データの分類を行っている。たとえば人の顔を認識するために、似たような顔の記憶領域は脳の中で互いに近くにあるとされている。したがって有意義な知見を得るためには、その作業を脳の外でやっておくことが有効である。(KJ法のコンセプトも実はここにある。野口悠紀雄氏は『超・発想法』の中で完全否定していたが。)
Ex.
「期間最高値/期間最安値」
「陽線数/同値数/陰線数」
「始終/高安/始高/始安/終高/終安」
:
:
4.集計値の算出
前回の「データの尺度」や知るべき統計値などを考慮して、項目別に統計値を算出する。

5.グラフ化
統計値を自分なりに消化しやすくするためにグラフを作成しビジュアル化する。
類似の項目は、過誤をなくし比較しやすいように目盛りを合わせる。

6.一覧性の確保
類似項目をできるだけ一覧で見られるように配置する。
アイデアは対象を比較することによって出てくることが多分にあるため。(影の暗さは光の存在によって認識可能であり、男の力強さは女との比較において際立つ。)

作成した基礎資料はこれからのシステム構築や運用を行う際の、自分だけの宝の地図となります。しかし、その資料を本当の宝の地図とするためには自分の手を一生懸命動さなければなりません。他人の書いた地図では決して自分が求める宝物は手に入れることができませんから。(ちなみに私は6の例で示した程度の密度の資料を300枚以上作成しました。)
そしてこの資料はプリントアウトして、いつでも見られる場所においておき、暇があれば眺めましょう。(ちなみに私は会社員をやっていた頃、資料を常にかばんの中に入れて満員の通勤電車の中や、仕事の休み時間に会社の周りをグルグル散歩をしながら眺めて夢想していました。傍目にどう思われていたかはあまり想像したくありませんが…。)