본문 바로가기
프로그래밍/AI 머신러닝,LLM

파이썬 numpy, pandas

by -현's- 2025. 4. 7.
반응형

●numpy, pandas

NumPy와 Pandas는 파이썬 데이터 분석에 사요오디는 라이브러리입니다.

NumPy는 행렬 계산, Pandas는 엑셀 같은 데이터 분석에 많이 쓰입니다.

반응형

●numpy

NumPy는 수학 연산과 배열(벡터, 행렬) 연산에 최적화된 라이브러리입니다.

import numpy as np

# 1차원 배열
arr1 = np.array([1, 2, 3, 4, 5])
print(arr1)

# 2차원 배열 (행렬)
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
print(arr2)

a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

print(a + b)  # 배열 덧셈
print(a * b)  # 배열 곱셈
print(np.dot(a, b))  # 내적 (1*4 + 2*5 + 3*6)

print(np.zeros((3, 3)))  # 3x3 영행렬
print(np.ones((2, 4)))   # 2x4 행렬 (1로 채움)
print(np.eye(4))         # 4x4 단위행렬
print(np.linspace(0, 10, 5))  # 0~10까지 5개의 숫자 생성

 

 

 

●pandas

데이터 분석 및 조작에 강력한 기능을 제공합니다.

import pandas as pd

s = pd.Series([10, 20, 30, 40], index=['A', 'B', 'C', 'D'])
print(s)

data = {'이름': ['철수', '영희', '민수'],
        '나이': [25, 30, 28],
        '점수': [90, 85, 88]}

df = pd.DataFrame(data)
print(df)

print(df.describe())  # 요약 통계 정보
print(df.head(2))  # 상위 2개 행 출력
print(df['이름'])  # 특정 열 선택
print(df.loc[0])  # 특정 행 선택 (인덱스로)
print(df.iloc[1])  # 두 번째 행 선택 (순서로)

df.to_csv('data.csv', index=False)  # CSV 저장
df2 = pd.read_csv('data.csv')  # CSV 불러오기
print(df2)

 

반응형

댓글