# Visual query and data visualization > 시각적 질의라는 관점에서, 어떻게 하면 데이터 시각화를 더 잘할 수 있는지 정리해보았다. [시각적 질의](https://wiki.g15e.com/pages/Visual%20query.txt)라는 관점에서, 어떻게 하면 <데이터 시각화>를 더 잘할 수 있는지 정리해보았다. ## 시각적 질의 예를 들어 상품별 매출액 데이터가 있다고 치자. 각 상품을 X축에 놓고, Y축은 매출액으로 하는 막대 그래프를 그리면… > 매출에 가장 큰 기여를 한 상품과 가장 작은 기여를 한 상품의 차이는 몇 배인가? 라는 물음을 아래와 같은 시각적 질의로 바꿀 수 있다: > 가장 긴 막대와 가장 짧은 막대의 차이는 몇 배인가? 또는, [Visual thinking for design](https://wiki.g15e.com/pages/Visual%20thinking%20for%20design.txt)에 언급된 사례를 인용하자면: ![Visualization of current.png](Visualization%20of%20current.png) (출처: [Visual thinking for design](https://wiki.g15e.com/pages/Visual%20thinking%20for%20design.txt) by ) 위와 같이 해수의 온도를 색상으로(파란색이 낮은 온도), 해류의 속도를 올챙이 형태(굵고 길면 빠름)로 표현하면 "해류가 가장 빠른 곳은 어디인가?"라는 물음은 "가장 굵고 긴 올챙이가 어디있나?"라는 시각적 질의로 표현될 수 있다. 디자인(혹은 시각화)이 얼마나 잘 되어 있느냐에 따라 시각적 질의의 효율성에 큰 차이를 주게 된다. ## 데이터, 시각적 재료, 매핑 데이터에 대해 시각적 질의를 수행할 수 있게 한다는 것은 다시 말하면 **데이터**를 **시각적 재료**에 잘 **매핑**하는 것을 뜻한다. 시각적 재료란 다음과 같다: - 형태 - 크기 - 색상 - 움직임 - 위치 - 질감(texture) - (등등) 매핑이란 예를 들면 이런 뜻이다: - 매출이 크면 긴 막대기로, 매출이 적으면 짧은 막대기로 표현 (매출을 막대 크기에 매핑) - 서로 관련성이 깊은 데이터는 가까이에, 관련성이 낮은 데이터는 멀리 배치 (관련성을 위치에 매핑) - (등등) ## 좋은 매핑은 효율적이고 정확한 시각적 질의를 돕는다 좋은 매핑이 있고 나쁜 매핑이 있다. 데이터를 아무 재료에나, 아무렇게나 매핑해서는 안된다. 좋은 매핑은 **효율적**이고 **정확한** 시각적 질의를 도와주는 매핑이다. 위에서 예를 들었던 막대 그래프 이야기를 해보자. 각 상품은 X축에 놓고, Y축은 매출액으로 하는 막대 그래프다. > 가장 긴 막대와 가장 짧은 막대의 차이는 몇 배인가? 위 시각적 질의가 효율적이고 정확하게 처리되게 하려면 막대 그래프를 어떻게 그려야 하나? 예를 들어 각 막대 사이의 간격이 너무 멀면 시각적 질의의 **효율성**이 떨어진다. 혹은 세로축이 0에서 시작하지 않는다면 두 막대의 비율과 두 막대가 나타내는 숫자의 비율이 일치하지 않기 때문에 시각적 질의의 **정확성**이 떨어진다. 효율적인 매핑에 대한 좀 더 자세한 내용은 [시각적 특성들을 효과적으로 쓰기](https://wiki.g15e.com/pages/Effective%20use%20of%20visual%20features.txt), 특히 색상을 어떻게 활용할 것인가에 대해서는 [데이터 시각화에서의 색상 활용](https://wiki.g15e.com/pages/Colors%20in%20data%20visualization.txt)을 참고. ## 요약 요약하자면 데이터를 시각적으로 표현하고자 할 때 최소한 다음 두가지를 반드시 고민해야 한다: - [디자인](https://wiki.g15e.com/pages/Design.txt)이 지원해야 하는 <인지적 과업>들을 파악하고 각 과업의 우선순위를 정하기 - 위에서 정한 우선순위에 따라, 중요한 과업이 효율적이고 정확한 시각적 질의로 수행될 수 있도록 데이터를 시각적 재료에 적절히 매핑하기