*Numpy: 다차원 배열을 효과적으로 처리할 수 있도록 도와주는 모듈입니다.
-
np.array: 리스트를 배열의 형태로 정의 하는 함수입니다.
-
array.size: 배열 안에 있는 데이터의 개수를 출력 하는 함수입니다.
- array.dtype: 배열 안에 있는 데이터의 타입을 출력 하는 함수입니다.
1. Numpy 배열 초기화
-
np.arange(n): 0부터 n까지의 정수가 담긴 배열을 생성합니다.
-
np.zeros((n,m), dtype=float): 행이 n개이고 열이 m개이며, 데이터 타입이 실수인 배열을 0을 채워 생성합니다.
-
np.ones((n,m), dtype=str): 행이 n개이고 열이 m개이며, 데이터 타입이 문자인 배열을 1을 채워 생성합니다.
-
np.random.randint(0,10,(n,m)): 0~10사이의 정수 중 무작위로 이루어진 n곱하기m배열 생성합니다.
-
np.random.normal(0,1,(n,m)): 정규분포로 이루어진 n곱하기m 배열을 생성합니다.
2. 배열 합치기
-
np.concatenate([배열1, 배열2]): 배열1과 배열2를 합쳐서 새로운 배열을 만듭니다.
-
array1.reshape(n,m): 행이 n개, 열이 m개인 행렬로 다시 배열을 만듭니다. 행을 먼저 채우며, 배열의 길이가 n곱하기m과 같아야합니다.
-
np.concatenate([배열1, 배열2], axis=0): 배열1과 배열2를 합쳐 새로운 배열을 만듭니다. axis의 값이 0인경우는 열연산 이라서 세로로 합치고 1인경우는 행연산 이라서 가로로 합칩니다.
3. 배열 나누기
-
np.split(배열,[n],axis=1): n번째 열을 기준으로 나눕니다. 2개의 변수에 각각 저장합니다.
4. Numpy 연산과 함수
*브로드캐스팅(Broadcasting): 모양이 다른 두 배열들 간의 연산이 가능해지도록 배열을 자동으로 변환 하는것입니다.
-브로드캐스팅 조건:
-
차원의 크기가 1일때 가능하며, 연산 과정 중 최소 하나의 배열이 1차원 이라면 가능합니다.
-
차원의 짝이 맞아야하며, 차원에 대해 축의 길이가 동일 해야 가능합니다.
-
배열[조건] = 바꿀 값: 배열의 조건에 해당하는 값을 바꿉니다.
-
np.max(배열), np.min(배열): 배열의 최댓값과 최솟값을 구합니다.
-
np.sum(배열), np.sum(배열, axis=0)): 배열의 합을 구하는 함수이며, axis가 0이면 열연산, 1이면 행연산을 합니다.
-
np.mean(배열): 배열의 평균을 구하는 함수 입니다.
'데이터분석' 카테고리의 다른 글
(데이터분석)로또 번호 분석하기! 많이 나오는 번호는?(python) (0) | 2019.09.02 |
---|---|
(데이터분석)로또 번호 웹크롤링 하기(python3) (0) | 2019.08.31 |
네이버 키워드 도구 (0) | 2019.08.28 |
3과목 통계분석(데이터 분석 준전문가ADSP 요약) (0) | 2019.08.20 |
버거지수 따라하기(전국 맥도날드 주소 크롤링) (0) | 2019.08.12 |