1. 먼저 변수 scientists에 데이터프레임을 준비합니다.
scientists = pd.DataFrame(
data={'Occupation': ['Chemist', 'Statistician'],
'Born': ['1920-07-25', '1876-06-13'],
'Died': ['1958-04-16', '1937-10-16'],
'Age': [37, 61]},
index=['Rosaline Franklin', 'William Gosset'],
columns=['Occupation', 'Born', 'Died', 'Age'])
2. 데이터프레임에서 시리즈를 선택하려면 loc 속성에 인덱스(과학자 이름)를 전달하면 됩니다.
정말 시리즈를 선택한 것인지 확인하기 위해 type으로 한 번 더 검사합니다.
first_row = scientists.loc['William Gosset']
print(type(first_row))
<class 'pandas.core.series.Series'>
3. first_row를 출력해 보겠습니다. 여기서 주목해야 할 점은 데이터프레임을 만들 때 Age열에
정수형 리스트를 전달해도 시리즈(first_row)를 출력해 보면 시리즈의 자료형을 오브젝트로
인식한다는 점입니다.
print(first_row)
Occupation Statistician
Born 1876-06-13
Died 1937-10-16
Age 61
Name: William Gosset, dtype: object
1. index 속성 사용하기
먼저 index 속성을 사용해 보겠습니다. index 속성에는 시리즈의 인덱스가 들어 있습니다.
print(first_row.index)
Index(['Occupation', 'Born', 'Died', 'Age'], dtype='object')
2. values 속성 사용하기
values 속성에는 시리즈의 데이터가 저장되어 있습니다.
print(first_row.values)
['Statistician' '1876-06-13' '1937-10-16' 61]
3. keys 메서드 사용하기
keys는 속성이 아니라 메서드입니다. keys 메서드의 기능은 무엇일까요?
keys 메서드는 index 속성과 같은 역할을 합니다. 즉, 과정 1의 결과와 동일한 결괏값을 얻을 수 있습니다.
print(first_row.keys())
Index(['Occupation', 'Born', 'Died', 'Age'], dtype='object')
시리즈에는 keys 메서드 외에도 다양한 메서드가 있습니다. 이번에는 시리즈에 미리 정의되어 있는
mean, min, max, std 메서드의 사용 방법을 알아보겠습니다.
1. 이번에는 scientists의 Age 열을 추출해 보겠습니다.
ages = scientists['Age']
print(ages)
Rosaline Franklin 37
William Gosset 61
Name: Age, dtype: int64
2. 만약 시리즈를 구성하는 데이터가 정수라면 mean, min, max, std와 같은 통계 메서드를 사용할 수 있습니다.
print(ages.mean())
49.0
print(ages.min())
37
print(ages.max())
61
print(ages.std())
16.97056274847714
다음은 시리즈에서 자주 사용하는 메서드를 정리한 표입니다. 앞으로 종종 사용할 메서드이므로
한 번 읽어보기 바랍니다.
출처 : doit 데이터 분석을 위한 판다스 입문
판다스, 데이터프레임 다루기 (0) | 2021.03.20 |
---|---|
판다스, 시리즈 다루기 - 응용 (0) | 2021.03.20 |
판다스, 나만의 데이터 만들기 (0) | 2021.03.19 |
그래프 그리기 (0) | 2021.03.19 |
기초적인 통계 계산하기 (0) | 2021.03.19 |