matplotlib.pyplot.boxplot #
- matplotlib.pyplot. boxplot ( x , 노치 = 없음 , sym = 없음 , vert = 없음 , whis = 없음 , 위치 = 없음 , 너비 = 없음 , patch_artist = 없음 , bootstrap = 없음 , usermedians = 없음 , conf_intervals = 없음 , meanline = 없음 , showmeans= 없음 , showcaps = 없음 , showbox = 없음 , showfliers = 없음 , boxprops = 없음 , labels = 없음 , flierprops = 없음 , medianprops = 없음 , meanprops = 없음 , capprops = 없음 , whiskerprops = 없음 , manage_ticks = True , autorange = False, zorder = 없음 , capwidths = 없음 , * , 데이터 = 없음 ) [출처] #
상자와 수염 플롯을 그립니다.
상자는 중앙값에 선이 있는 데이터의 1사분위수(Q1)에서 3사분위수(Q3)까지 확장됩니다. 수염은 상자에서 사분위수 범위(IQR)의 1.5배까지 확장됩니다. 플라이어 포인트는 수염 끝을 지난 포인트입니다. 참조 를 위해 https://en.wikipedia.org/wiki/Box_plot 을 참조하세요.
Q1-1.5IQR Q1 median Q3 Q3+1.5IQR |-----:-----| o |--------| : |--------| o o |-----:-----| flier <-----------> fliers IQR
- 매개변수 :
- x 배열 또는 일련의 벡터.
입력 데이터입니다. 2D 배열인 경우 x 의 각 열에 대해 상자 그림이 그려집니다 . 1D 배열 시퀀스인 경우 x 의 각 배열에 대해 상자 그림이 그려집니다 .
- 노치 부울, 기본값: False
노치 상자 그림(
True
) 또는 직사각형 상자 그림( ) 을 그릴지 여부False
입니다. 노치는 중앙값 주변의 신뢰 구간(CI)을 나타냅니다. 부트스트랩 문서 에는 노치 위치가 기본적으로 계산되는 방식이 설명되어 있지만 conf_intervals 매개변수 를 설정하여 해당 위치를 재정의할 수도 있습니다 .메모
CI 값이 하위 사분위수보다 작거나 상위 사분위수보다 큰 경우 노치가 상자 너머로 확장되어 독특한 "뒤집힌" 모양을 제공합니다. 이것은 예상되는 동작이며 다른 통계 시각화 패키지와 일치합니다.
- 기호 문자열, 선택사항
플라이어 포인트의 기본 기호입니다. 빈 문자열('')은 전단지를 숨깁니다. 이면
None
전단지의 기본값은 'b+'입니다. flierprops 매개변수 를 통해 더 많은 제어가 제공됩니다 .- vert 부울, 기본값: 참
- whis float 또는 (float, float), 기본값: 1.5
수염의 위치.
플로트인 경우 아래쪽 수염은 위의 가장 낮은 데이텀 에 있고 위쪽 수염은 아래의 가장 높은 데이텀에 있습니다 . 여기서 Q1 및 Q3은 첫 번째 및 세 번째 사분위수입니다. 의 기본값 은 상자 그림에 대한 Tukey의 원래 정의에 해당합니다.
Q1 - whis*(Q3-Q1)
Q3 + whis*(Q3-Q1)
whis = 1.5
한 쌍이 부동이면 수염을 그릴 백분위수를 나타냅니다(예: (5, 95)). 특히 이것을 (0, 100)으로 설정하면 데이터의 전체 범위를 포함하는 수염이 생깁니다.
자동 범위 가 True 이면 whis 가 자동 으로 (0, 100)으로 설정됩니다(데이터의 전체 범위 포함) .
Q1 == Q3
수염 이외의 데이터는 이상치로 간주되며 개별 점으로 표시됩니다.
- 부트스트랩 정수, 선택사항
노치가 있는 상자 그림에 대한 중앙값 주변의 신뢰 구간을 부트스트랩할지 여부를 지정합니다. 부트스트랩 이 없음 이면 부트스트래핑이 수행되지 않고 가우시안 기반 점근적 근사를 사용하여 노치가 계산됩니다(McGill, R., Tukey, JW 및 Larsen, WA, 1978 및 Kendall 및 Stuart, 1967 참조). 그렇지 않으면 bootstrap 은 95% 신뢰 구간을 결정하기 위해 중앙값을 부트스트랩하는 횟수를 지정합니다. 1000에서 10000 사이의 값이 권장됩니다.
- usermedians 1D 배열 유사, 선택 사항
length 의 1D 배열과 유사합니다
len(x)
. 그렇지 않은 각 항목은None
해당 데이터 세트에 대한 중앙값 값을 강제합니다. 인 항목None
의 경우 중앙값은 Matplotlib에서 정상적으로 계산됩니다.- conf_intervals 배열과 유사, 선택 사항
모양의 2D 배열과 같은 . 없음이 아닌 각 항목은 해당 노치의 위치를 강제합니다( 노치 가 인 경우에만 그려짐 ). 인 항목 의 경우 노치는 다른 매개변수(예: 부트스트랩 ) 에 의해 지정된 방법으로 계산됩니다 .
(len(x), 2)
True
None
- 위치 배열과 유사, 선택사항
상자의 위치. 눈금과 한계는 위치와 일치하도록 자동으로 설정됩니다. 기본값 은 N이 그려지는 상자의 수입니다.
range(1, N+1)
- 너비 부동 또는 배열과 유사
상자의 너비. 기본값은 0.5 이며 더 작은 경우 입니다.
0.15*(distance between extreme positions)
- patch_artist 부울, 기본값: 거짓
False
Line2D 아티스트로 상자를 생성하는 경우 . 그렇지 않으면 패치 아티스트와 함께 상자가 그려집니다.- 레이블 시퀀스, 선택 사항
각 데이터세트의 레이블(데이터세트당 하나).
- manage_ticks 부울, 기본값: True
True인 경우 상자 그림 위치와 일치하도록 눈금 위치와 레이블이 조정됩니다.
- 자동 범위 부울, 기본값: False
True
25번째와 75번째 백분위수가 같도록 데이터를 분포 시켰을 때 , 위스커 끝이 데이터의 최소값과 최대값이 되도록 whis 를 (0, 100)으로 설정합니다.- meanline bool, 기본값: False
True
(및 showmeans 가 ) 이면 meanprops (아래 참조)True
에 따라 상자의 전체 너비에 걸쳐 있는 선으로 평균을 렌더링하려고 시도합니다 . shownotches 도 True 이면 권장되지 않습니다 . 그렇지 않으면 평균이 포인트로 표시됩니다.- zorder 플로트, 기본값:
Line2D.zorder = 2
boxplot의 zorder.
- 반환 :
- 딕셔너리
boxplot의 각 구성 요소를
Line2D
생성된 인스턴스 목록에 매핑하는 사전입니다. 해당 사전에는 다음 키가 있습니다(수직 상자 그림 가정).boxes
: 활성화된 경우 사분위수와 중앙값의 신뢰 구간을 보여주는 boxplot의 본체입니다.medians
: 각 상자의 중앙값에 있는 수평선.whiskers
: 이상값이 아닌 가장 극단적인 데이터 포인트까지 연장되는 수직선.caps
: 수염 끝의 수평선.fliers
: 수염(전단지)을 넘어 확장되는 데이터를 나타내는 점.means
: 수단을 나타내는 점 또는 선.
- 기타 매개변수 :
- showcaps 부울, 기본값: True
수염 끝에 모자를 보여줍니다.
- showbox 부울, 기본값: True
중앙 상자를 표시합니다.
- showfliers 부울, 기본값: True
캡 너머의 이상값을 표시합니다.
- showmeans 부울, 기본값: False
산술 수단을 표시합니다.
- capprops 사전, 기본값: 없음
모자의 스타일.
- capwidths 부동 또는 배열, 기본값: 없음
대문자의 너비.
- boxprops 사전, 기본값: 없음
상자의 스타일입니다.
- 위스커프롭스 사전, 기본값: 없음
수염의 스타일.
- 플라이어프롭스 사전, 기본값: 없음
전단지 스타일입니다.
- medianprops 사전, 기본값: 없음
중앙값의 스타일입니다.
- meanprops 사전, 기본값: 없음
평균의 스타일.
- 데이터 인덱싱 가능 개체, 선택 사항
주어진 경우, 모든 매개변수는 문자열도 허용하며 , 이는 (예외가 발생하지 않는 한
s
) 로 해석됩니다 .data[s]
또한보십시오
violinplot
확률 밀도 함수의 추정치를 그립니다.