色の使い方
「色」は、脳の視覚野において、ミリ秒でその違いに反応できる視覚属性である。色は、使う「目的」によって使い方が異なる。そのため、自分は何のために色を使おうとしているのかを意識することが大切である。
・シーケンシャルカラー
データの値の多寡を1つの色の明度で表現するもの。連続したデータの値の多寡を表す。
・ダイバージェントカラー
任意の中間点からのレンジを設け、その中間点を起点として2色のシーケンシャルカラーで表現しているもの。中間点を使いポジティブやネガティブ、プラスやマイナスなど2つの種類の幅を表す時に使う。
・カテゴリカルカラー
異なる分類や区分を色で表現するもの。比較する分類・区分が多いと必然的に多色になってしまい、見る人にビジーな印象を与えてしまう。解決策として、分析したいカテゴリを厳選して色を付与するという方法がある。
・ハイライトカラー
目立たせたい情報、注意を引かなければいけない情報がある時にその部分だけに使うもの。
色のベストプラクティスは、使う色の数を減らすことである。様々な研究から、人間が一度認識できる色の数は8色までと言われている。ビジネス向けには4色以下に抑える。色を使おうとしない引き算の発想が大切である。
適切な配色比率の目安は、ベースカラー:70〜80%、メインカラー:10〜20%、強調カラー:5%
データタイプ
データを効果的に視覚化するには、データタイプを知り、扱っているデータはどのデータタイプに当てはまるのかを理解する必要がある。データタイプによって、各視覚属性との相性に傾向があり、それを知っておくことでチャートの選択が効率的・効果的になる。
- カテゴリカルデータ:「もの」を表す。数的な「値」ではない、相互にダブりのないもの。
- 順序データ:上記カテゴリカルデータに含まれるが、順番が存在することだけが異なる。
- 量的データ:数。集計し、測ることができるもの。
データタイプと視覚属性の相性は以下の通り。
カテゴリカルデータ | 順序データ | 量的データ | |
位置 | ○ | ○ | ○ |
長さ | – | ○ | ○ |
向き | – | ○ | ○ |
明度 | – | ○ | ○ |
色相 | ○ | – | – |
形状 | ○ | – | – |
太さ | – | ○ | – |
認知的負荷を下げる
認知的負荷は、良いデータ視覚化を考えるにあたり最も根源的な概念である。データ視覚化をオーディエンスに理解させようとする際には、オーディエンスは脳のエネルギーを多分に消費することになる。データを使った情報伝達をする際には、このオーディエンスの脳のエネルギー消費を最小限にすることが大切である。そうでなければ、理解するのが負担になり、データ視覚化を理解しようとすることなく離脱してしまう。
・データインクレシオ
認知的負荷を語る上で参考になる1つの概念がデータインクレシオという概念である。その核となる考え方に「良いグラフを描くには、データに紐づいていない余分なものをすべて削除すべき」という点がある。データインクレシオの式は以下の通り。
データそのものを表すために使われたインクの量
グラフ、グラフィックなど表現全体で使われたインクの量
この比率が高いほど良いグラフということになる。
・ゲシュタルトの法則
認知的負荷を下げることを考える際、1つの大きな基礎となる法則。データ視覚化にあたり特に重要となるのは下記の6つ。
- 近接の法則:物理的に距離が近いものを同じグループだと捉える。
- 類同の法則:同じ色、形状、向きのものが同じグループだと認識されやすい。
- 囲みの法則:囲っているものは1つのグループであると認識されやすい。
- 閉合の法則:欠落部分があっても頭の中に既にあるものにフィットさせようとする。
- 連続の法則:明示的に連続しているわけではないものを、連続性をもとに考え認識する。
- 接合の法則:物理的につながっているものを1つのグループと認識する。
・クラター
整理されておらずごちゃごちゃしテイル状態。データ視覚化においてはこの「ごちゃごちゃしている状態」を回避すべきという大方針がある。単純にそれはオーディエンスの理解を促進させるものではなく、物事を複雑化させてしまう不要なものだからである。
何を捨てるかを決めることは、何に注目してもらうかを決めることとも言える。データ視覚化においては、人間が重要な情報を瞬時に理解できるように、視覚属性とデータタイプを意識することがキモのキモである。