본문 바로가기

전체 글33

BeautifulSoup, requests 활용 웹크롤링(Web Crawling) BeautifulSoup이란? HTML 파서이다 HTML로부터 데이터를 추출하기 위해 사용한다 웹 스크래핑에 유용하다 현재 Beautiful Soup3는 더 이상 개발되지 않고(2021년 1월 1일 중단), Beautiful Soup4를 사용하면 된다. https://www.crummy.com/software/BeautifulSoup/bs4/doc/ Beautiful Soup Documentation — Beautiful Soup 4.9.0 documentation Beautiful Soup Documentation Beautiful Soup is a Python library for pulling data out of HTML and XML files. It works with your favorite.. 2023. 3. 13.
파이썬 import import import는 Python에서 모듈(라이브러리)을 가져오는데 사용되는 키워드이다. 파이썬에서 기본적으로 제공하는 모듈도 있고 다른 사람들이 만들어 제공하는 외부 라이브러리도 있다. import 사용법 import 키워드를 사용하여 모듈을 가져오면, 해당 모듈에 있는 함수, 변수, 클래스 등을 사용할 수 있다. import math x = math.sqrt(16) print(x) # 4.0 출력 모듈의 일부부만 가져올 경우 모듈에서 특정한 함수나 클래스만 가져오고 싶을 경우에는 다음과 같이 하면 된다. from 모듈_이름 import 가져올_함수_이름, 가져올_클래스_이름 from math import sqrt, pow x = sqrt(16) y = pow(2, 3) print(x) # 4.0.. 2023. 3. 12.
파이썬 메모이제이션 (Python memoization) 메모이제이션(memoization) 이란? 프로그램이 동일한 계산을 반복해야 할 때, 이전에 계산한 값을 저장함으로써 동일한 계산의 반복 수행을 제거 프로그램 실행 속도를 빠르게 하는 기술로 동적 계획법의 핵심이 되는 기술 https://ko.wikipedia.org/wiki/%EB%A9%94%EB%AA%A8%EC%9D%B4%EC%A0%9C%EC%9D%B4%EC%85%98 팩토리얼 구하기 아래와 같은 팩토리얼을 계산하는 재귀 함수의 경우, 함수가 호출될 때마다 n!을 계산하기 위해 n * (n-1) * (n-2) * ... * 1의 계산을 수행한다. 이런 경우, 재귀적으로 구현되어 있기 때문에, 큰 입력값에 대해서는 계산 속도가 매우 느려진다. def factorial(n): if n == 0: retu.. 2023. 3. 12.
파이썬 파일 입출력 파일 입출력 과정 파이썬에서 파일 입출력을 위해서는 다음 과정을 거쳐야 한다 파일 열기 파일 읽기 또는 파일 쓰기 파일 닫기 . 파일 열기 open() 함수를 사용하여 파일을 연다. 파일을 읽을 때 사용하는 모드는 2가지이다. r: 읽기 W: 쓰기 파일을 열 때 인코딩 방식을 지정할 수 있는데 한글의 경우 encoding='utf-8'을 사용한다. f = open('example.txt', 'r', encoding='utf-8') 파일 읽기 파일을 읽을 때는 read() 함수를 사용한다. read() 함수는 파일의 내용을 문자열로 읽어들인다. 파일의 내용을 한 줄씩 읽을 때는 readline() 함수를 사용한다. contents = f.read() print(contents) line = f.readli.. 2023. 3. 12.