상세 컨텐츠

본문 제목

판다스, 시리즈 다루기 - 기초

판다스 입문

by ZISEN 2021. 3. 20. 02:41

본문

반응형

데이터프레임에서 시리즈 선택하기

1. 먼저 변수 scientists에 데이터프레임을 준비합니다.

scientists = pd.DataFrame(
    data={'Occupation': ['Chemist', 'Statistician'],
          'Born': ['1920-07-25', '1876-06-13'],
          'Died': ['1958-04-16', '1937-10-16'],
          'Age': [37, 61]},
    index=['Rosaline Franklin', 'William Gosset'],
    columns=['Occupation', 'Born', 'Died', 'Age'])

2. 데이터프레임에서 시리즈를 선택하려면 loc 속성에 인덱스(과학자 이름)를 전달하면 됩니다.

정말 시리즈를 선택한 것인지 확인하기 위해 type으로 한 번 더 검사합니다.

first_row = scientists.loc['William Gosset']
print(type(first_row))

<class 'pandas.core.series.Series'>

3. first_row를 출력해 보겠습니다. 여기서 주목해야 할 점은 데이터프레임을 만들 때 Age열에

정수형 리스트를 전달해도 시리즈(first_row)를 출력해 보면 시리즈의 자료형을 오브젝트로

인식한다는 점입니다.

print(first_row)

Occupation    Statistician
Born            1876-06-13
Died            1937-10-16
Age                     61
Name: William Gosset, dtype: object

index, values 속성과 keys 메서드 사용하기

1. index 속성 사용하기

먼저 index 속성을 사용해 보겠습니다. index 속성에는 시리즈의 인덱스가 들어 있습니다.

print(first_row.index)

Index(['Occupation', 'Born', 'Died', 'Age'], dtype='object')

2. values 속성 사용하기

values 속성에는 시리즈의 데이터가 저장되어 있습니다.

print(first_row.values)

['Statistician' '1876-06-13' '1937-10-16' 61]

3. keys 메서드 사용하기

keys는 속성이 아니라 메서드입니다. keys 메서드의 기능은 무엇일까요?

keys 메서드는 index 속성과 같은 역할을 합니다. 즉, 과정 1의 결과와 동일한 결괏값을 얻을 수 있습니다.

print(first_row.keys())

Index(['Occupation', 'Born', 'Died', 'Age'], dtype='object')

 

시리즈의 기초 통계 메서드 사용하기

시리즈에는 keys 메서드 외에도 다양한 메서드가 있습니다. 이번에는 시리즈에 미리 정의되어 있는

mean, min, max, std 메서드의 사용 방법을 알아보겠습니다.

 

시리즈의 mean, min, max, std 메서드 사용하기

1. 이번에는 scientists의 Age 열을 추출해 보겠습니다.

ages = scientists['Age']
print(ages)

Rosaline Franklin    37
William Gosset       61
Name: Age, dtype: int64

2. 만약 시리즈를 구성하는 데이터가 정수라면 mean, min, max, std와 같은 통계 메서드를 사용할 수 있습니다.

print(ages.mean())

49.0

print(ages.min())

37

print(ages.max())

61

print(ages.std())

16.97056274847714

다음은 시리즈에서 자주 사용하는 메서드를 정리한 표입니다. 앞으로 종종 사용할 메서드이므로

한 번 읽어보기 바랍니다.

 

 

출처 : doit 데이터 분석을 위한 판다스 입문

반응형

'판다스 입문' 카테고리의 다른 글

판다스, 데이터프레임 다루기  (0) 2021.03.20
판다스, 시리즈 다루기 - 응용  (0) 2021.03.20
판다스, 나만의 데이터 만들기  (0) 2021.03.19
그래프 그리기  (0) 2021.03.19
기초적인 통계 계산하기  (0) 2021.03.19

관련글 더보기