반응형
●numpy, pandas
NumPy와 Pandas는 파이썬 데이터 분석에 사요오디는 라이브러리입니다.
NumPy는 행렬 계산, Pandas는 엑셀 같은 데이터 분석에 많이 쓰입니다.
반응형
●numpy
NumPy는 수학 연산과 배열(벡터, 행렬) 연산에 최적화된 라이브러리입니다.
import numpy as np
# 1차원 배열
arr1 = np.array([1, 2, 3, 4, 5])
print(arr1)
# 2차원 배열 (행렬)
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
print(arr2)
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print(a + b) # 배열 덧셈
print(a * b) # 배열 곱셈
print(np.dot(a, b)) # 내적 (1*4 + 2*5 + 3*6)
print(np.zeros((3, 3))) # 3x3 영행렬
print(np.ones((2, 4))) # 2x4 행렬 (1로 채움)
print(np.eye(4)) # 4x4 단위행렬
print(np.linspace(0, 10, 5)) # 0~10까지 5개의 숫자 생성
●pandas
데이터 분석 및 조작에 강력한 기능을 제공합니다.
import pandas as pd
s = pd.Series([10, 20, 30, 40], index=['A', 'B', 'C', 'D'])
print(s)
data = {'이름': ['철수', '영희', '민수'],
'나이': [25, 30, 28],
'점수': [90, 85, 88]}
df = pd.DataFrame(data)
print(df)
print(df.describe()) # 요약 통계 정보
print(df.head(2)) # 상위 2개 행 출력
print(df['이름']) # 특정 열 선택
print(df.loc[0]) # 특정 행 선택 (인덱스로)
print(df.iloc[1]) # 두 번째 행 선택 (순서로)
df.to_csv('data.csv', index=False) # CSV 저장
df2 = pd.read_csv('data.csv') # CSV 불러오기
print(df2)
반응형
'프로그래밍 > AI 머신러닝,LLM' 카테고리의 다른 글
결정트리,군집화,차원축소 (0) | 2025.04.12 |
---|---|
파이썬 머신러닝 사이킷런에서 reshape() 사용이유 (0) | 2025.04.02 |
파이썬 머신러닝 train_test_split() (0) | 2025.03.29 |
머신러닝 회귀(regression) 개념 (0) | 2025.03.29 |
머신러닝 기초, 모델, 데이터셋, 사이킷런 (1) | 2025.03.25 |
댓글