Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
Tags
- Spring Boot
- Powershell
- Machine Learning
- Github
- ChatGPT
- OSS
- 국가과제
- KAKAO
- suricata
- C언어
- VSCode
- 크롤링 개발
- git
- colab
- Rocky Linux
- 코딩도장
- Database
- Python
- Resnet
- rnn
- cloud
- Web
- 인터넷의이해
- Docker
- Spring
- LINUX MASTER
- 고등학생 대상
- ICT멘토링
- API
- GoogleDrive
Archives
- Today
- Total
목록scraping (1)
코딩두의 포트폴리오

요즘 다시 관심이 가는 스크래핑을 해보려고 시도하는 중이다. 먼저, 크롤링과 스크래핑의 공통점과 차이점을 정확히 짚고 넘어가려고 한다. 공통점- 웹 페이지의 데이터 등의 정보를 수집하는 작업 차이점크롤링(Crawling)정의 - 웹 페이지들을 체계적으로 탐색하여 데이터를 수집목적 - 웹 페이지를 대규모로 수집, 색인 -> 검색 엔진 DB 구축 방법 - 자동화 프로그램이 웹 링크를 따라 이동하면서 데이터를 수집 스크래핑(Scraping)정의 - 특정 웹 페이지들에서 필요한 데이터만 수집목적 - 특정 정보를 수집하여 비즈니스 등의 목적을 둠방법 - HTML 문서 구조 분석 / 필요한 데이터 추출을 위해 XPath, CSS Selector 등을 사용 결론부터 말하자면 코드의 기본은 작성을 완료한 상태이다...
Python
2024. 5. 7. 23:20