본문 바로가기

Crawling2

[파이썬]셀레니움(selenium), 드롭다운박스 선택 파이썬 셀레니움으로 드롭다운 박스의 요소를 선택하는 방법을 알아보겠습니다. 선택하고자 하는 드롭다운 박스는 다음과 같습니다. 아래와 같은 순서로 진행합니다. 드롭다운박스를 찾아 클릭한다. 드롭다운박스에서 원하는 항목을 선택한다. 이동 버튼을 클릭하여 해당 사이트로 이동한다. 드롭다운박스에서 항목을 선택하기 위해서는 셀레니움의 Select함수를 사용해야 합니다. Select 함수를 사용하기 위하여 아래 모듈을 import해야 합니다. from selenium.webdriver.support.ui import Select 코드를 작성하는 방법을 순서대로 알아보겠습니다. 1. 드롭다운박스에 해당하는 태그를 찾아 클릭한다. driver.find_element('id','relation').click() 2. 드.. 2022. 11. 22.
크롤링(Crawling)과 스크래핑(Scraping) 크롤링(Crawling) 인터넷에서 공개된 데이터를 수집하는 일 파이썬 관련 라이브러리 : requests ■ 크롤링 할 때 3가지 주의점 1. 저작권을 지킬 것 저작권을 반드시 확인한다. 저작물을 무단으로 복제하거나 2차 이용 하였을 경우 저작권 침해로 인한 소송까지 갈 수도 있으니 주의할 것. 2. 과도한 액세스를 피할 것 과도한 액세스로 인해 사이트 운영에 피해를 줄 수 있으며, DDos 공격으로 오인할 수도 있다. 한꺼번에 많은 데이터를 가져오지 말고, 시간차(time delay)를 두어 가져온다. 3. 로봇배제표준을 지킬 것 로봇배제 표준을 확인하여 크롤링 금지 사이트는 크롤링 하지 않도록 한다. 로봇배제표준은 권고안이지만 불법으로 데이터를 수집하여 문제 발생 시 법적 제제를 받을 수 있으니 주.. 2022. 10. 21.