일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- Docker
- Resnet
- Database
- OSS
- colab
- C언어
- 고등학생 대상
- Spring Boot
- 국가과제
- VSCode
- Rocky Linux
- LINUX MASTER
- cloud
- ICT멘토링
- rnn
- ChatGPT
- GoogleDrive
- Github
- Powershell
- Spring
- git
- Machine Learning
- API
- Python
- suricata
- 크롤링 개발
- KAKAO
- 코딩도장
- 인터넷의이해
- Kubernetes
- Today
- Total
목록Python (4)
코딩두의 포트폴리오
요즘 다시 관심이 가는 스크래핑을 해보려고 시도하는 중이다. 먼저, 크롤링과 스크래핑의 공통점과 차이점을 정확히 짚고 넘어가려고 한다. 공통점- 웹 페이지의 데이터 등의 정보를 수집하는 작업 차이점크롤링(Crawling)정의 - 웹 페이지들을 체계적으로 탐색하여 데이터를 수집목적 - 웹 페이지를 대규모로 수집, 색인 -> 검색 엔진 DB 구축 방법 - 자동화 프로그램이 웹 링크를 따라 이동하면서 데이터를 수집 스크래핑(Scraping)정의 - 특정 웹 페이지들에서 필요한 데이터만 수집목적 - 특정 정보를 수집하여 비즈니스 등의 목적을 둠방법 - HTML 문서 구조 분석 / 필요한 데이터 추출을 위해 XPath, CSS Selector 등을 사용 결론부터 말하자면 코드의 기본은 작성을 완료한 상태이다...
GitHub에 만든 새 리포지토리를 vscode에 연동하기 위해 로컬컴퓨터로 git을 clone해야 함1) git clone '리포지토리 복제' 버튼 선택 2) git 주소 입력github에서 만든 리포지토리의 주소를 복사하여 1)에 URL 추가 3) 로컬에 clone할 폴더 생성 및 선택 4) github(원격) -> 내 컴퓨터(로컬)로 clone된 workspace 확인 5) 코드 수정 후 저장commit할 코드를 수정 6) 왼쪽에서 세번째 아이콘인 '소스제어'를 클릭 시 자동으로 수정된 파일들 탐지됨 + 버튼으로 커밋할 파일 추가 / v 버튼 눌러 commit 7) git push하단에 push 가능한 commit 수를 확인할 수 있음. -> github 리포지토리로 push 8) 커밋 완료..
1. 해당 프로젝트를 Fork하여 내 GitHub 계정에 복사 2. 로컬 저장소(repository) 만들기원하는 경로에 작업할 디렉토리 생성git Bash 실행 후 생성한 디렉토리로 이동(cd는 현재 작업 디렉토리 변경 / pwd는 현재 작업 디렉토리 확인) 3. Git 저장소 초기화(git init)git init 실행하여 Git 저장소 초기화git init 실행 후 초기화되었다는 의미'C:/oss_git' 폴더는 Git으로 관리할 수 있는 로컬 저장소가 되었음해당 폴더에서 변경사항 추적, 커밋 가능 4. git add / git commitGit 저장소 초기화 후 해야 할 일은 파일을 작업 디렉토리에 추가, 커밋oss_git 폴더에 hello.txt라는 파일 생성 후 git add . 명령어 사용하..