크롤링을 하다가 보면.. URL에 한글이 들어가야만 하는 경우가 있는데 이 때 본 에러다.

 

URL 내의 한글을 퍼센트 인코딩으로 변경해서 넣어주어야 하는데 아래와 같이 quote 명령어를 통해서 해결이 가능하다.

 

from urllib.parse import quote
quote("서울")

>>'%EC%84%9C%EC%9A%B8'

 

* 레퍼런스

https://ko.wikipedia.org/wiki/%ED%8D%BC%EC%84%BC%ED%8A%B8_%EC%9D%B8%EC%BD%94%EB%94%A9?fbclid=IwAR3Sk_251xX3Y0p4Bp9YsKL2oaBH6Ucf0Gmj8ImjPIuTzeoIvZVjaO_V_4w

 

퍼센트 인코딩 - 위키백과, 우리 모두의 백과사전

위키백과, 우리 모두의 백과사전. 퍼센트 인코딩(percent-encoding)은 URL에 문자를 표현하는 문자 인코딩 방법이다. 이 방법에 따르면 알파벳이나 숫자 등 몇몇 문자를 제외한 값은 옥텟 단위로 묶어서, 16진수 값으로 인코딩한다. '위키백과'의 인코딩 인코딩 UTF-8 EUC-KR 16진수 표현 EC 9C 84 ED 82 A4 EB B0 B1 EA B3 BC C0 A7 C5 B0 B9 E9 B0 FA 퍼센트 인코딩 %EC%9C%84%ED%82

ko.wikipedia.org

 

반응형
Posted by JoeSung
,