
matplotlib를 사용하여 Python 3에서 데이터를 그리는 방법
2022-06-01 last update
13 minutes reading Programming Project Data Analysis Development Python소개
Python은 데이터 처리에 매우 적합합니다.일반적으로 하나의 데이터 집합은 여러 변수와 여러 실례를 포함하기 때문에 무슨 일이 일어났는지 이해하기 어렵다.데이터 시각화는 데이터의 패턴을 식별하는 데 유용한 방법입니다.
예를 들어 부동산 중개인이라고 가정하면 집의 나이와 판매 가격 간의 관계를 이해하려고 한다.만약 당신의 데이터가 다섯 채의 집으로 구성된 한 구역을 포함한다면, 도대체 무슨 일이 일어났는지 알기는 그리 어렵지 않을 것이다.단, 도시 전체 500채의 주택 데이터를 사용하고 싶다고 가정해 보세요.그렇다면 나이가 어떻게 가격에 영향을 미치는지 이해하기 어렵다.판매 가격과 나이의 관계도를 그려 데이터를 가시화하면 둘 사이에 존재하는 관계를 밝힐 수 있다.
시각화는 통용되는 방식으로 개념을 신속하고 간단하게 전달하는 방법이며, 특히 당신의 데이터에 익숙하지 않은 사람들에게는 더욱 그렇다.우리가 데이터를 처리할 때마다 가시화는 통상적으로 분석의 필수 부분이다.
우리는 2Dplotting 라이브러리 matplotlib을 사용할 것이다. 이것은 처음에 John D. Hunter가 작성한 것이다. 그때부터 이것은 매우 활발한 개발 지역사회 프로젝트가 되었다.그것은 당신이 고품질의 선형도, 산점도, 직사각형도, 조형도 등을 생성할 수 있도록 합니다.각 드로잉은 서로 다른 방식으로 데이터를 표시하며, 데이터의 정보량이 가장 많은 드로잉을 결정하기 전에 다양한 유형의 드로잉을 시도하는 것이 일반적으로 유용합니다.시각화는 예술과 과학의 융합이라는 것을 명심하세요.
시각화의 중요성을 감안하여 본 강좌는 matplotlib를 사용하여 Python에서 데이터를 그리는 방법을 설명할 것입니다.우리는 일부분의 데이터를 사용하여 산점도를 생성하고 그림에 제목과 예시 등 정보를 추가하며 그림점의 외관을 바꾸어 그림을 사용자 정의할 것이다.
이 강좌를 완성하면 Python으로 데이터를 그릴 수 있습니다!
선결 조건
이 강좌의 경우 Python 3을 설치하고 컴퓨터에 로컬 프로그래밍 환경을 설정해야 합니다.그렇지 않으면 appropriate installation and set up guide for your operating system에 따라 설정할 수 있습니다.
단계 1 - matplotlib 가져오기
Python을 사용하기 전에 matplotlib 모듈이 설치되어 있는지 자세히 살펴보겠습니다.명령줄에서 다음 명령을 실행하여 matplotlib를 확인합니다.
- python -c "import matplotlib"
matplotlib가 설치되어 있으면 이 명령이 완성됩니다. 오류가 발생하지 않습니다. 준비가 되었습니다.그렇지 않으면 오류 메시지가 표시됩니다.- OutputTraceback (most recent call last): File "<string>", line 1, in <module> ImportError: No module named 'matplolib'
오류 메시지가 표시되면 pip 다운로드 라이브러리를 사용합니다.- pip install matplotlib
현재 matplotlib가 설치되어 있습니다. 우리는 Python에서 import을 사용할 수 있습니다.우선, 이 강좌에서 사용할 스크립트: scatter.py
을 만듭니다.그리고 스크립트에서 matplotlib를 가져옵니다.plotting 모듈 (pyplot) 만 사용하기 때문에, 가져올 때 지정합니다.분산시키다회사 명
import matplotlib.pyplot as plt
.pyplot
의 끝에 matplotlib
을 추가하여 가져올 모듈을 지정합니다.스크립트에서 모듈을 인용하기 편리하도록 plt
으로 줄임말합니다.이제 우리는 데이터를 계속 만들고 그릴 수 있습니다.2단계 - 인쇄할 데이터 포인트 만들기
Python 스크립트에서 사용할 데이터를 만듭니다.2D에서 작업하므로 각 데이터 포인트의 X 및 Y 좌표가 필요합니다.
matplotlib의 작업 원리를 더욱 잘 이해하기 위해 우리는 데이터를 가능한 실제 장면과 연결시킬 것이다.우리가 한 커피숍의 사장이라고 가정해 보자. 우리는 연간 평균 날씨와 아이스커피 총 구매량 간의 관계에 대해 흥미를 느낀다.X variable은 매달 판매되는 아이스커피 총수이며, Y 변수는 매달 평균 온도(화씨도)이다.
Python 스크립트에서는
X
(판매된 아이스커피 총량)과 Y
(평균 온도) 두 가지 목록 변수를 만들 것입니다.우리 각자의 lists의 각 항목은 매달 (1월부터 12월까지) 의 데이터를 대표할 것이다.예를 들어 1월의 평균 온도는 32화씨로 커피숍에서 590잔의 아이스커피를 판매했다.분산시키다회사 명
import matplotlib.pyplot as plt
X = [590,540,740,130,810,300,320,230,470,620,770,250]
Y = [32,36,39,52,61,72,77,75,68,57,48,48]
이제 우리는 데이터가 생겨서 그림을 그리기 시작할 수 있다.단계 3 - 데이터 인쇄
산점도는 두 변수 간의 관계를 확인하는 데 매우 유용하기 때문에 우리는 이 그림 유형을 예로 사용할 것이다.matplotlib를 사용하여 산점도를 만들려면
scatter()
함수를 사용합니다.이 함수는 X 및 Y 좌표 값을 나타내는 두 개의 매개변수가 필요합니다.분산시키다회사 명
import matplotlib.pyplot as plt
X = [590,540,740,130,810,300,320,230,470,620,770,250]
Y = [32,36,39,52,61,72,77,75,68,57,48,48]
plt.scatter(X,Y)
plt.show()
드로잉을 생성할 때마다 plt.show()
을 사용하여 표시할 드로잉을 지정해야 합니다.계속하기 전에 스크립트가 정상적으로 작동하는지 확인해 봅시다.스크립트를 저장하고 명령행을 통해 실행하려면 다음과 같이 하십시오.
- python scatter.py
모든 것이 순조롭다면 다음과 같이 드로잉을 표시하는 창을 시작해야 합니다.
이 창은 데이터를 보기에 매우 적합하다.이것은 상호작용적이며 탭과 좌표를 표시하거나 확대하거나 축소하거나 저장하는 등 여러 가지 기능을 포함한다.
단계 4 - 제목 및 레이블 추가
기왕 우리가 스크립트가 정상적으로 작동하는 것을 알았으니, 우리는 줄거리에 정보를 추가하기 시작할 수 있다.우리의 데이터가 무엇을 대표하는지 알기 위해서, 우리는 각 축에 제목과 라벨을 포함한다.
우리는 제목을 추가하는 것부터 시작할 것이다.스크립트의
plt.show()
행 앞에 제목을 추가합니다.분산시키다회사 명
import matplotlib.pyplot as plt
X = [590,540,740,130,810,300,320,230,470,620,770,250]
Y = [32,36,39,52,61,72,77,75,68,57,48,48]
plt.scatter(X,Y)
plt.title('Relationship Between Temperature and Iced Coffee Sales')
plt.show()
다음은 plt.title
선 바로 아래의 축에 레이블을 추가합니다.분산시키다회사 명
...
plt.xlabel('Cups of Iced Coffee Sold')
plt.ylabel('Temperature in Fahrenheit')
...
만약 우리가 스크립트를 저장하고 다시 실행한다면, 현재 업데이트된 그림이 있어야 하며, 그것의 정보는 더욱 풍부해야 한다.업데이트된 드로잉은 다음과 같습니다.
단계 5 - 드로잉 사용자 정의
우리가 사용하는 모든 데이터 집합은 유일한 것이기 때문에 우리가 정보를 표시하고자 하는 방식을 사용자 정의할 수 있는 것이 매우 중요하다.시각화도 예술이라는 것을 기억하고 창의력을 가져야 한다!matplotlib는 다양한 색상, 점 기호, 크기 등 다양한 사용자 정의 기능을 포함합니다.우리의 수요에 따라 우리는 서로 다른 각도를 사용하고 서로 다른 축 범위를 사용하기를 원할 수도 있다.다음과 같이 축에 새 범위를 지정하여 기본 매개변수를 변경할 수 있습니다.
분산시키다회사 명
import matplotlib.pyplot as plt
X = [590,540,740,130,810,300,320,230,470,620,770,250]
Y = [32,36,39,52,61,72,77,75,68,57,48,48]
plt.scatter(X,Y)
plt.xlim(0,1000)
plt.ylim(0,100)
plt.title('Relationship Between Temperature and Iced Coffee Sales')
plt.show()
...
원본 드로잉의 점은 약간 작아 보이며, 파란색은 우리가 원하는 색이 아닐 수도 있습니다.어쩌면 우리는 원을 점으로 삼지 않고 삼각형을 원할지도 모른다.점의 실제 색상/크기/모양을 변경하려면 초기 plt.scatter()
호출에서 변경해야 합니다.다음 매개변수를 변경합니다.s
: 점 크기, 기본값 = 20 c
: 색상, 순서 또는 색상 순서, 기본값은 "b"marker
: 점 기호, 기본값은 "o"드로잉을 쉽게 읽을 수 있도록 점 크기를 3배(
s=60
) 늘리고 색상을 빨간색(c='r'
)으로 변경하고 기호를 삼각형(marker='^'
)으로 변경합니다.plt.scatter()
함수를 수정합니다.plt.scatter(X, Y, s=60, c='red', marker='^')
업데이트된 스크립트를 실행하기 전에, 우리는 코드가 정확한지 자세히 검사할 수 있다.사용자 정의 드로잉에 대한 업데이트 스크립트는 다음과 같습니다.분산시키다회사 명
import matplotlib.pyplot as plt
X = [590,540,740,130,810,300,320,230,470,620,770,250]
Y = [32,36,39,52,61,72,77,75,68,57,48,48]
#scatter plot
plt.scatter(X, Y, s=60, c='red', marker='^')
#change axes ranges
plt.xlim(0,1000)
plt.ylim(0,100)
#add title
plt.title('Relationship Between Temperature and Iced Coffee Sales')
#add x and y labels
plt.xlabel('Cups of Iced Coffee Sold')
plt.ylabel('Temperature in Fahrenheit')
#show plot
plt.show()
6단계를 계속하기 전에 스크립트를 저장하는 것을 잊지 마십시오.단계 6 - 드로잉 저장
새 사용자 정의 그림을 보기 위해 코드를 실행했습니다.
- python scatter.py
드로잉을 표시하는 창이 열립니다.
그런 다음 저장 버튼을 클릭하여 아래쪽 도구 모음에 있는 디스크 아이콘으로 드로잉을 저장합니다.이미지는 대화형 그래픽이 아닌 PNG로 저장됩니다.당신은 현재 자신의 사용자 정의 산점도를 가지고 있습니다. 축하합니다!
결론
이 강좌에서 Python에서 matplotlib를 사용하여 데이터를 그리는 방법을 배웠습니다.이제 데이터를 시각화하고 드로잉을 사용자 정의할 수 있습니다.
matplotlib를 계속 사용하여 연습하려면 저희 안내서'How To Graph Word Frequency Using matplotlib with Python 3'에 따라 조작할 수 있습니다