프리 정보 컨텐츠

[파이썬] BeautifulSoup 에서의 get_text() vs string 차이점 본문

PYTHON

[파이썬] BeautifulSoup 에서의 get_text() vs string 차이점

쏜스 2020. 11. 11. 15:51

get_text

 

- 일반적으로 텍스트 부분만 모두 추출함.

- 하나의 스트링을 만들어 리턴함.

 

string

 

- 스트링만 리스트로 추출함.

- 줄바꿈, 공백 등 필요없는 것들에 제거한 스트링 리스트를 리턴함.

 

ex)

예제를 보면 알 수 있듯이 .string 은 문자열이 없으면 "None" 을 반환하는 반면

 

.get_text() 는 유니코드형식으로 텍스트까지 문자열로 반환하기 때문에 아무 정보도 나오지 않습니다.

 

하위태그에 텍스트까지 파싱하는 경우라면 .get_text() 방식을 선호하고

정확한 선택자를 통한 파싱을 하는 경우라면 .string 을 선호하므로 선택의 차이로 판단하셔서 사용하면됩니다.

Comments