본문 바로가기
728x90
반응형
SMALL

인공지능/머신러닝7

9. 머신러닝 처리 - 사이킷 런을 통한 머신러닝 (유용한 라이브러리-1) 사이킷 런 파이썬에서 사용할 수 있는 머신러닝 라이브러리 중 하나로, 간결하고 효과적인 도구를 제공하여 머신러닝 모델을 구축하고 분석하는 데 사용된다. 장점 일관된 인터페이스 간단하고 일관된 API를 제공하여 여러 머신러닝 알고리즘을 쉽게 사용할 수 있게 한다. 덕분에 모델 간 전환 및 비교가 용이 다양한 머신러닝 알고리즘 사이킷런은 다양한 머신러닝 알고리즘을 포함하고있다. 지도학습, 비지도학습, 클러스터링, 차원축소, 등 다양한 작업을 수행할 수 있는 알고리즘들이 구현되어있다. 데이터 전처리 도구 데이터를 전처리하고 정제하는 데 사용할 수 있는 다양한 도구와 함수를 제공하며 데이터의 스케일 조정, 특징 추출, 결측치 처리 등을 수행할 수 있다. 효율적인 모델 평가 도구 모델의 성능을 측정하고 평가하기 .. 2023. 10. 5.
8. 데이터 결측치 시각화 - 데이터 결측치 시각화 https://www.kaggle.com/competitions/titanic/data?select=train.csv Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 위 데이터를 받아서 파이썬으로 데이터 시각화를 해보겠습니다. Kaggle에서 데이터셋 가져오기 데이터 결측치 시각화 다운로드 받은 3개의 파일을 이용해서 활용해 보곘습니다. 그리고 같은 폴더에 "ex1.py" 이렇게 파이썬 소스를 생성했습니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib as mpl import seaborn as sbn train = pd.r.. 2023. 9. 25.
6. 딥러닝을 위한 프레임 워크 - 파이토치(PyTorch) 파이토치(PyTorch) 개념  파이썬 오픈소스 라이브러리  딥러닝을 위한 프레임 워크 : 신경망을 생성하고 학습시킴  자연어처리, 이미지 처리 등 다양한 처리를 위해 사용됨 모듈과 클래스 모듈/클래스 설명 torch 주요 네임 스페이스 torch.autograd 자동미분함수 내장 torch.nn 신경망 구축을 위한 데이터구조나 레이어 정의 torch.optim 확률적 경사하강법(SGD)를 중심으로 최적화 알고리즘 구현 torch.utils.data SGD 반복연산 시 사용하는 미니 배치용 유틸리티 함수 포함 torch.utils.data.DataLoader 순회가능한 객체(iterable)로 처리하여 Dataset의 샘플에 쉽게 접근할 수 있도록 함 torch.utils.data.Dataset 샘.. 2023. 9. 19.
5. 데이터 시각화를 위한 matplotlib matplotlib 개념  데이터 시각화를 위한 파이썬 라이브러리  pyplot를 통하여 기능 사용  .plot() 메서드를 통해 데이터를 시각화함  .show() 메서드를 통해 화면에 출력함 설치 및 사용 방법 1) pip install matplotlib 2) 사용 : import matplotlib.pyplot as plt 종류 라인플롯 pyplot.plot(y) 막대 플롯 pyplot.bar(x,y), pyplot.barh(x,y) xticks, yticks를 통하여 해당 축의 값들 나열 가능 파이 플롯 pyplot.pie(데이터 , labels= , colors=, autopact= , shadow=True/False) 히스토그램 pyplot.hist(data ,bins) 박스 플롯 py.. 2023. 9. 19.
3. 머신러닝을 위한 판다스(Pandas) 판다스 개요 목적 데이터 처리를 위한 라이브러리 설치 pip install pandas cmd에서 설치 라이브러리 호출 import pandas 판다스의 데이터 타입 선언방법 특징 시리즈(Series) pandas.Series([Values], index= ... ) 1차원 배열의 값(Values)의 형태 각 값에 대응되는 인덱스가 자동으로 부여 인덱스 : 0부터 시작 각 값에 대응되는 인덱스 사용자 설정 가능 데이터 프레임 (DataFrame) pandas.DataFrame([values], index = ... , columns = ... ) 2차원의 행과 열을 테이블 형태 매개변수 : 2차원의 리스트 리스트, 딕셔너리, 시리즈, 넘파이 등 다양한 형태를 통하여 데이터 프레임 생성 가능 각 값에 대응.. 2023. 9. 5.
2. 머신러닝을 위한 넘파이(NumPy) 딥러닝을 위한 파이썬의 대표적 라이브러리 NumPy Numerical Python : 선형대수, 난수 , n -array 사용 가능 Pandas 데이터 조작, 분석을 위한 광범휘한 도구 제공 Matplotlib 데이터 시각화 및 시각화를 통한 데이터 탐색 가능 scikit-learn NumPy와 Pandas 등과 원활하게 연동되는 데이터 과학 관련 모듈 TensorFlow (Keras) 딜버닝 모델 구축 및 학습 가능 PyTorch 딥러닝 프레임워크 NumPy란? 행렬이나 대규모의 배열을 쉽게 처리할 수 있도록 도와주는 파이썬 라이브러리 백터, 행렬의 형태로 데이터 표현 및 연산을 한다. * numPy 를 이용하여 데이터를 행렬 또는 벡터의 형식으로 변환 웹사이트 www.numpy.org 발표일 1995.. 2023. 9. 5.
1. 인공지능과 머신러닝 개념 인공지능과 머신러닝의 개념 인공지능 > 머신러닝 > 딥러닝 인공지능 인간처럼 사고하고 예측하려는 컴퓨터 기술 전반 머신러닝 인공지능의 한 분야. 대량의 데이터를 학습한 후 기계가 스스로 결과를 추론할 수 있음 딥러닝 머신러닝의 한 분야. 인공신경망을 이용하여 데이터를 심층적으로 학습하고 결과를 학습함 인공지능 인간처럼 사고하고 행동하려는 컴퓨터 기술 알고리즘에 의해, 인간의 학습능력을 구현하려는 기술 - 학습능력 : 학습, 문제해결, 추론 , 지각 능력 강인공지능 자의식이 있는 인공지능, 일반적인 영역에서의 문제를 스스로 해결할 수 있음. 아직은 이론적인 기술 약 인공지능 자의식이 없는 인공지능. 특별한 영역에 대하여 문제를 해결. 현재 대부분의 인공지능 기술은 약 인공지능 -> 대부분이 약 인공지능이다.. 2023. 8. 29.
728x90
반응형
LIST