matplotlib.pyplot.boxplot #

matplotlib.pyplot. boxplot ( x , 노치 = 없음 , sym = 없음 , vert = 없음 , whis = 없음 , 위치 = 없음 , 너비 = 없음 , patch_artist = 없음 , bootstrap = 없음 , usermedians = 없음 , conf_intervals = 없음 , meanline = 없음 , showmeans= 없음 , showcaps = 없음 , showbox = 없음 , showfliers = 없음 , boxprops = 없음 , labels = 없음 , flierprops = 없음 , medianprops = 없음 , meanprops = 없음 , capprops = 없음 , whiskerprops = 없음 , manage_ticks = True , autorange = False, zorder = 없음 , capwidths = 없음 , * , 데이터 = 없음 ) [출처] #

상자와 수염 플롯을 그립니다.

상자는 중앙값에 선이 있는 데이터의 1사분위수(Q1)에서 3사분위수(Q3)까지 확장됩니다. 수염은 상자에서 사분위수 범위(IQR)의 1.5배까지 확장됩니다. 플라이어 포인트는 수염 끝을 지난 포인트입니다. 참조 를 위해 https://en.wikipedia.org/wiki/Box_plot 을 참조하세요.

     Q1-1.5IQR   Q1   median  Q3   Q3+1.5IQR
                  |-----:-----|
  o      |--------|     :     |--------|    o  o
                  |-----:-----|
flier             <----------->            fliers
                       IQR
매개변수 :
x 배열 또는 일련의 벡터.

입력 데이터입니다. 2D 배열인 경우 x 의 각 열에 대해 상자 그림이 그려집니다 . 1D 배열 시퀀스인 경우 x 의 각 배열에 대해 상자 그림이 그려집니다 .

노치 부울, 기본값: False

노치 상자 그림( True) 또는 직사각형 상자 그림( ) 을 그릴지 여부 False입니다. 노치는 중앙값 주변의 신뢰 구간(CI)을 나타냅니다. 부트스트랩 문서 에는 노치 위치가 기본적으로 계산되는 방식이 설명되어 있지만 conf_intervals 매개변수 를 설정하여 해당 위치를 재정의할 수도 있습니다 .

메모

CI 값이 하위 사분위수보다 작거나 상위 사분위수보다 큰 경우 노치가 상자 너머로 확장되어 독특한 "뒤집힌" 모양을 제공합니다. 이것은 예상되는 동작이며 다른 통계 시각화 패키지와 일치합니다.

기호 문자열, 선택사항

플라이어 포인트의 기본 기호입니다. 빈 문자열('')은 전단지를 숨깁니다. 이면 None전단지의 기본값은 'b+'입니다. flierprops 매개변수 를 통해 더 많은 제어가 제공됩니다 .

vert 부울, 기본값: 참

인 경우 True세로 상자를 그립니다. 인 경우 False가로 상자를 그립니다.

whis float 또는 (float, float), 기본값: 1.5

수염의 위치.

플로트인 경우 아래쪽 수염은 위의 가장 낮은 데이텀 에 있고 위쪽 수염은 아래의 가장 높은 데이텀에 있습니다 . 여기서 Q1 및 Q3은 첫 번째 및 세 번째 사분위수입니다. 의 기본값 은 상자 그림에 대한 Tukey의 원래 정의에 해당합니다.Q1 - whis*(Q3-Q1)Q3 + whis*(Q3-Q1)whis = 1.5

한 쌍이 부동이면 수염을 그릴 백분위수를 나타냅니다(예: (5, 95)). 특히 이것을 (0, 100)으로 설정하면 데이터의 전체 범위를 포함하는 수염이 생깁니다.

자동 범위 가 True 이면 whis 가 자동 으로 (0, 100)으로 설정됩니다(데이터의 전체 범위 포함) .Q1 == Q3

수염 이외의 데이터는 이상치로 간주되며 개별 점으로 표시됩니다.

부트스트랩 정수, 선택사항

노치가 있는 상자 그림에 대한 중앙값 주변의 신뢰 구간을 부트스트랩할지 여부를 지정합니다. 부트스트랩 이 없음 이면 부트스트래핑이 수행되지 않고 가우시안 기반 점근적 근사를 사용하여 노치가 계산됩니다(McGill, R., Tukey, JW 및 Larsen, WA, 1978 및 Kendall 및 Stuart, 1967 참조). 그렇지 않으면 bootstrap 은 95% 신뢰 구간을 결정하기 위해 중앙값을 부트스트랩하는 횟수를 지정합니다. 1000에서 10000 사이의 값이 권장됩니다.

usermedians 1D 배열 유사, 선택 사항

length 의 1D 배열과 유사합니다 len(x). 그렇지 않은 각 항목은 None해당 데이터 세트에 대한 중앙값 값을 강제합니다. 인 항목 None의 경우 중앙값은 Matplotlib에서 정상적으로 계산됩니다.

conf_intervals 배열과 유사, 선택 사항

모양의 2D 배열과 같은 . 없음이 아닌 각 항목은 해당 노치의 위치를 ​​강제합니다( 노치 가 인 경우에만 그려짐 ). 인 항목 의 경우 노치는 다른 매개변수(예: 부트스트랩 ) 에 의해 지정된 방법으로 계산됩니다 .(len(x), 2)TrueNone

위치 배열과 유사, 선택사항

상자의 위치. 눈금과 한계는 위치와 일치하도록 자동으로 설정됩니다. 기본값 은 N이 그려지는 상자의 수입니다.range(1, N+1)

너비 부동 또는 배열과 유사

상자의 너비. 기본값은 0.5 이며 더 작은 경우 입니다.0.15*(distance between extreme positions)

patch_artist 부울, 기본값: 거짓

FalseLine2D 아티스트로 상자를 생성하는 경우 . 그렇지 않으면 패치 아티스트와 함께 상자가 그려집니다.

레이블 시퀀스, 선택 사항

각 데이터세트의 레이블(데이터세트당 하나).

manage_ticks 부울, 기본값: True

True인 경우 상자 그림 위치와 일치하도록 눈금 위치와 레이블이 조정됩니다.

자동 범위 부울, 기본값: False

True25번째와 75번째 백분위수가 같도록 데이터를 분포 시켰을 때 , 위스커 끝이 데이터의 최소값과 최대값이 되도록 whis 를 (0, 100)으로 설정합니다.

meanline bool, 기본값: False

True(및 showmeans 가 ) 이면 meanprops (아래 참조) True에 따라 상자의 전체 너비에 걸쳐 있는 선으로 평균을 렌더링하려고 시도합니다 . shownotches 도 True 이면 권장되지 않습니다 . 그렇지 않으면 평균이 포인트로 표시됩니다.

zorder 플로트, 기본값:Line2D.zorder = 2

boxplot의 zorder.

반환 :
딕셔너리

boxplot의 각 구성 요소를 Line2D생성된 인스턴스 목록에 매핑하는 사전입니다. 해당 사전에는 다음 키가 있습니다(수직 상자 그림 가정).

  • boxes: 활성화된 경우 사분위수와 중앙값의 신뢰 구간을 보여주는 boxplot의 본체입니다.

  • medians: 각 상자의 중앙값에 있는 수평선.

  • whiskers: 이상값이 아닌 가장 극단적인 데이터 포인트까지 연장되는 수직선.

  • caps: 수염 끝의 수평선.

  • fliers: 수염(전단지)을 넘어 확장되는 데이터를 나타내는 점.

  • means: 수단을 나타내는 점 또는 선.

기타 매개변수 :
showcaps 부울, 기본값: True

수염 끝에 모자를 보여줍니다.

showbox 부울, 기본값: True

중앙 상자를 표시합니다.

showfliers 부울, 기본값: True

캡 너머의 이상값을 표시합니다.

showmeans 부울, 기본값: False

산술 수단을 표시합니다.

capprops 사전, 기본값: 없음

모자의 스타일.

capwidths 부동 또는 배열, 기본값: 없음

대문자의 너비.

boxprops 사전, 기본값: 없음

상자의 스타일입니다.

위스커프롭스 사전, 기본값: 없음

수염의 스타일.

플라이어프롭스 사전, 기본값: 없음

전단지 스타일입니다.

medianprops 사전, 기본값: 없음

중앙값의 스타일입니다.

meanprops 사전, 기본값: 없음

평균의 스타일.

데이터 인덱싱 가능 개체, 선택 사항

주어진 경우, 모든 매개변수는 문자열도 허용하며 , 이는 (예외가 발생하지 않는 한 s) 로 해석됩니다 .data[s]

또한보십시오

violinplot

확률 밀도 함수의 추정치를 그립니다.