본문 바로가기
728x90
반응형
SMALL

파이썬4

1. 파이썬 크롤링 - BeautifylSoup 라이브러리, 예외처리 BeautifulSoup 라이브러리파이썬에서 크롤링을 학습하기위해 간단하면서 가장 기초가되는 기능들을 사용할 수 있게해주는 라이브러리라고 생각합니다.BeautifulSoup은 HTML, XML 파일에서 데이터를 쉽게 추출할 수 있게 도와주는 파이썬 라이브러리입니다. 웹 스크래핑(Web Scraping) 작업에서 자주 사용되며, 복잡한 HTML 문서에서도 원하는 정보를 구조적으로 추출할 수 있게 해줍니다.주요 기능HTML 파싱: BeautifulSoup은 HTML 문서를 트리 구조로 변환하여 파싱할 수 있습니다. 이를 통해 태그, 속성, 내용 등에 쉽게 접근할 수 있습니다.다양한 파서 지원: 기본적으로 Python 내장 HTML 파서를 사용하지만, lxml, html5lib와 같은 다른 파서를 사용할 수도.. 2024. 10. 13.
8. 데이터 결측치 시각화 - 데이터 결측치 시각화 https://www.kaggle.com/competitions/titanic/data?select=train.csv Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 위 데이터를 받아서 파이썬으로 데이터 시각화를 해보겠습니다. Kaggle에서 데이터셋 가져오기 데이터 결측치 시각화 다운로드 받은 3개의 파일을 이용해서 활용해 보곘습니다. 그리고 같은 폴더에 "ex1.py" 이렇게 파이썬 소스를 생성했습니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import matplotlib as mpl import seaborn as sbn train = pd.r.. 2023. 9. 25.
5. 데이터 시각화를 위한 matplotlib matplotlib 개념  데이터 시각화를 위한 파이썬 라이브러리  pyplot를 통하여 기능 사용  .plot() 메서드를 통해 데이터를 시각화함  .show() 메서드를 통해 화면에 출력함 설치 및 사용 방법 1) pip install matplotlib 2) 사용 : import matplotlib.pyplot as plt 종류 라인플롯 pyplot.plot(y) 막대 플롯 pyplot.bar(x,y), pyplot.barh(x,y) xticks, yticks를 통하여 해당 축의 값들 나열 가능 파이 플롯 pyplot.pie(데이터 , labels= , colors=, autopact= , shadow=True/False) 히스토그램 pyplot.hist(data ,bins) 박스 플롯 py.. 2023. 9. 19.
2. 머신러닝을 위한 넘파이(NumPy) 딥러닝을 위한 파이썬의 대표적 라이브러리 NumPy Numerical Python : 선형대수, 난수 , n -array 사용 가능 Pandas 데이터 조작, 분석을 위한 광범휘한 도구 제공 Matplotlib 데이터 시각화 및 시각화를 통한 데이터 탐색 가능 scikit-learn NumPy와 Pandas 등과 원활하게 연동되는 데이터 과학 관련 모듈 TensorFlow (Keras) 딜버닝 모델 구축 및 학습 가능 PyTorch 딥러닝 프레임워크 NumPy란? 행렬이나 대규모의 배열을 쉽게 처리할 수 있도록 도와주는 파이썬 라이브러리 백터, 행렬의 형태로 데이터 표현 및 연산을 한다. * numPy 를 이용하여 데이터를 행렬 또는 벡터의 형식으로 변환 웹사이트 www.numpy.org 발표일 1995.. 2023. 9. 5.
728x90
반응형
LIST