제로베이스/데이터분석

DataScience. tips data 시각화

진주네카라 2021. 11. 18. 00:14
728x90

프로그래밍 언어

Python

 

프로그래밍 주요 도구

Seaborn

Matplotlib

 

프로젝트 번호

toy project

 


Seaborn basic

 

 

img. https://seaborn.pydata.org/

 

 

데이터 시각화 라이브러리 seaborn을 사용해 tips 데이터를 다루어보자

 

 

seaborn tips data

  • boxplot
  • swarmplot
  • implot

 

 

 

 

 

 

seaborn examples로 사용한 sample datasets인 tips, 참고 Git에 접속하면 다양한 샘플데이터를 볼 수 있다.

 

 

 

 

박스 내부의 세로선인 중앙값은 total_bill 17에서 18정도 되는거 같다.

 

 

 

요일 별로 분석해보면 주말에 total_bill이 높은것을 볼 수 있다.

그리고 범위도 평일보다 주말이 더 넓다.

 

 

 

 

 

 

 

 

특정 카테고리에 따른 데이터를 표현 할 수 있다.

요일과 흡연여부에 따라 정리해보았다.

 

 

 

 

 

swarmplot은 boxplot과 같이 사용하면 데이터 분포를 자세하게 보여준다.

 

 

 

 

회귀선을 그려 두 데이터간의 상관관계를 알 수 있다.

total_bill의 증가에따라 tip이 증가하는 경향을 보임

 

 

 

total_bill의 증가에따라 tip이 증가하는 경향을 보임

상대적으로 No 비흡연자가 더 tip 증가가 높다

 

 

 

 

 

성별로도 경향성을 볼 수 있다.

 

 

 

 

샘플데이터를 이용해 다양하게 분석해보고 가치있는 시각화 자료를 만드는데 노력해야겠다.

^-^

 

 

 

 

 

 

 

 

 


참고

https://github.com/mwaskom/seaborn-data

 

GitHub - mwaskom/seaborn-data: Data repository for seaborn examples

Data repository for seaborn examples. Contribute to mwaskom/seaborn-data development by creating an account on GitHub.

github.com

 

728x90