머신러닝 또는 인공지능 공부를 하는 동안 여러 데이터셋이 필요한경우가 있습니다.
그때마다 캐글을 사용하는데 이 캐글을 사용하는 기본적인 방법에 대해서 공유드리겠습니다.
캐글접속
먼저 캐글에 들어갑니다. 구글에 캐글 이라고 검색하셔도 바로나옵니다.
Kaggle: Your Machine Learning and Data Science Community
Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
www.kaggle.com
상단 로그인 또는 등록을 해줍니다.
저는 이번에 처음으로 등록하기에 구글을 새로 등록해보겠습니다.
로그인 이후
로그인 이후 첫화면입니다. 눈부시게 흰색입니다.
왼쪽메뉴에는 홈, 데이터셋츠, 코드 등등이 있습니다.
보통 데이터셋 검페티션즈, 코드 등을 사용합니다.
여기서 진행을 위해 데이터셋츠를 클릭하겠습니다.
데이터셋 기본화면
데이터셋츠에 들어가면 위와같은 화면을 보실 수 있습니다.
[ ... ] 을 누르면 북마크 또는 다운로드가 가능합니다.
데이터셋츠 검색
검색은 상단의 텍스트 인풋박스를 누르면됩니다.
간단하게 서울이라고 영어로 검색하니 대기오염수준에서 자전거 공유 수요등등의 데이터를 다운로드 받을 수 있습니다.
다운로드 파일 활용
다운로드시 주로 다운로드 폴더의 archive.zip 으로 저장되게됩니다. 그리고 해당 알집파일에는 해당 데이터 파일인 csv 확장자의 파일이 있습니다.
열어보니 엑셀의 표 형식과같은 데이터값들이 있습니다.
이것으로 캐글 활용 기초중 데이터셋츠에 대해서 알아보았습니다.
감사합니다.
댓글