Numpy 중간값 - numpy jung-gangabs

numpy.ma.median

ma.median( a , axis=None , out=None , overwrite_input=False , keepdims=False ) [소스]

지정된 축을 따라 중앙값을 계산합니다.

배열 요소의 중앙값을 반환합니다.

Parameters aarray_like

배열로 변환 할 수있는 입력 배열 또는 객체입니다.

axisint, optional

중앙값이 계산되는 축입니다. 기본 (없음)은 전개 된 버전의 배열을 따라 중앙값을 계산하는 것입니다.

outndarray, optional

결과를 배치 할 대체 출력 배열입니다. 예상 출력과 모양 및 버퍼 길이가 같아야하지만 필요한 경우 유형이 캐스트됩니다.

overwrite_inputbool, optional

True이면 계산을 위해 입력 배열 (a)의 메모리 사용을 허용합니다. 입력 배열은 중앙값을 호출하여 수정됩니다. 이렇게하면 입력 배열의 내용을 보존 할 필요가 없을 때 메모리가 절약됩니다. 입력을 정의되지 않은 것으로 처리하지만 전체 또는 부분적으로 정렬 될 수 있습니다. 기본값은 False입니다. 경우 해당 주 overwrite_input 가 사실이고, 입력이 이미하지 ndarray , 오류가 발생합니다.

keepdimsbool, optional

이것이 True로 설정되면 축소 된 축은 결과적으로 크기가 1 인 치수로 남습니다. 이 옵션을 사용하면 결과가 입력 배열에 대해 올바르게 브로드 캐스트됩니다.

버전 1.10.0의 새로운 기능

Returns medianndarray

out이 지정되지 않으면 결과를 포함하는 새 배열이 반환되며, 이 경우 out에 대한 참조가 반환됩니다. 반환 데이터 유형은 정수의 경우 float64이고 float64보다 작은 float float64 float64 데이터 유형의 경우 그렇지 않습니다.

Notes

벡터 주어 VN 의 값을 마스크 비의 평균 V 는 정렬 된 복사본의 중간 값 인 V ( Vs 즉 -) Vs[(N-1)/2] , N 이 홀수 또는 {Vs[N/2 - 1] + Vs[N/2]}/2 N 이 짝수 인 경우 / 2-1] + Vs [N / 2]} / 2

Examples

>>> x = np.ma.array(np.arange(8), mask=[0]*4 + [1]*4)
>>> np.ma.median(x)
1.5
>>> x = np.ma.array(np.arange(10).reshape(2, 5), mask=[0]*6 + [1]*4)
>>> np.ma.median(x)
2.5
>>> np.ma.median(x, axis=-1, overwrite_input=True)
masked_array(data=[2.0, 5.0],
             mask=[False, False],
       fill_value=1e+20)


NaN을 무시하고 지정된 축을 따라 중앙값을 계산합니다.

배열 요소의 중앙값을 반환합니다.

버전 1.9.0의 새로운 기능

Parameters aarray_like

배열로 변환 할 수있는 입력 배열 또는 객체입니다.

{int, int 시퀀스, 없음}, 선택 사항

중앙값이 계산되는 축입니다. 기본값은 전개 된 버전의 배열을 따라 중앙값을 계산하는 것입니다. 버전 1.9.0부터 일련의 축이 지원됩니다.

outndarray, optional

결과를 배치 할 대체 출력 배열입니다. 예상 출력과 모양 및 버퍼 길이가 같아야하지만 필요한 경우 출력 유형이 캐스트됩니다.

overwrite_inputbool, optional

True이면 입력 배열 a 의 메모리를 사용 하여 계산할 수 있습니다. 입력 배열은 median 호출로 수정됩니다 . 입력 배열의 내용을 보존 할 필요가 없을 때 메모리가 절약됩니다. 입력을 정의되지 않은 것으로 취급하지만 완전히 또는 부분적으로 정렬 될 수 있습니다. 기본값은 거짓입니다. 경우 overwrite_input 가 있다 Truea 이미 아니다 ndarray , 오류가 발생합니다.

keepdimsbool, optional

이것이 True로 설정되면 축소 된 축은 결과적으로 크기가 1 인 치수로 남습니다. 이 옵션을 사용하면 결과가 원본 a 에 대해 올바르게 브로드 캐스트됩니다 .

이것이 기본값 이외의 값이면 (빈 배열의 특수한 경우) 기본 배열 의 mean 함수로 전달됩니다. 배열이 하위 클래스이고 mean 에 kwarg keepdims 가없는 경우 RuntimeError가 발생합니다.

Returns medianndarray

결과를 보유하는 새로운 배열. 입력에 정수가 포함되거나 float64 보다 작은 수레가 있으면 출력 데이터 유형은 np.float64 입니다. 그렇지 않으면 출력의 데이터 유형이 입력의 데이터 유형과 동일합니다. 경우 out 지정되어, 해당 배열 대신 반환됩니다.

Notes

벡터 주어 V 길이의 N 의 평균 V 정렬 된 복사본의 중간 값 인 V , V_sorted - 즉 V_sorted[(N-1)/2] , 경우 N 이 홀수 개의 중간 값의 평균이며 의 V_sortedN 은 짝수이다.

Examples

>>> a = np.array([[10.0, 7, 4], [3, 2, 1]])
>>> a[0, 1] = np.nan
>>> a
array([[10., nan,  4.],
       [ 3.,  2.,  1.]])
>>> np.median(a)
nan
>>> np.nanmedian(a)
3.0
>>> np.nanmedian(a, axis=0)
array([6.5, 2. , 2.5])
>>> np.median(a, axis=1)
array([nan,  2.])
>>> b = a.copy()
>>> np.nanmedian(b, axis=1, overwrite_input=True)
array([7.,  2.])
>>> assert not np.all(a==b)
>>> b = a.copy()
>>> np.nanmedian(b, axis=None, overwrite_input=True)
3.0
>>> assert not np.all(a==b)