모바일

구글스프레드시트 강좌 8탄 웹크롤링 방법!

racingtesk 2021. 1. 25. 03:22

 

"구글 스프레드 시트 웹크롤링 방법"

구글 스프레드 시트에서 웹크롤링 하는 방법에 대하여 알아 보겠습니다. 웹 크롤링은 간단하게 설명 드리면 웹에 있는 데이터를 가져오는 것 이라고 이해 하면 됩니다. 이번 포스팅에서는 네이트 판 게시판에 있는 데이터를 구글 스프레드 시트로 크롤링 하는 예제 입니다.

 

구글 스프레드 시트에서 새 스프레드 시트를 만듭니다.

 

첫번째 열에는 사이트 주소를 입력 합니다.

두번재 열에는 xpath를 입력 합니다.

세번째 열에는 importxml 함수를 사용합니다.

입력예시 ) =importxml(a3,b3) a3는 사이트주소, b3는 xpath 입니다.

 

 

구글 스프레드 시트 웹 크롤링

웹브라우저로 네이트 판에 접속하여 개발자 도구를 실행 합니다. 브라우저 개발자 도구 단축키는 F12입니다.

개발자도구를 실행하면 위 그림과 같은 화면이 나옵니다. 여기에서 빨간색 네모친 화살표 모양을 클릭하고 왼쪽화면에 게시판글에 가져가면 코드 부분에 어디인지 표시가 됩니다. 

게시글은 확인 한다은 코드 부분에서 마우스 오른쪽 클릭을 하여 cpoy 메뉴에서 copy xpath를 복사 합니다.

 

입력을 마치고 구글 스프레드 시트에서 웹크롤링을 정리한 화면 입니다.  보고 싶은 게시판을 사이트에 가지 않고 구글 스프레드 시트에서 확인을 할 수 있는 장점이 있습니다.

 

 

 

 

도움이 되셨다면 댓글, 공감, 구독 부탁드립니다~