読者です 読者をやめる 読者になる 読者になる

牌語備忘録 -pygo

あくまでもメモです。なるべくオフィシャルの情報を参照してください。

牌語備忘録 -pygo

web サイトの文字コードが euc_jp とかだけど utf8 で取得しちゃいたいなってときのとりあえずのスクリプトをPythonでの覚書

Python
import urllib
url = "http://hoge_euc_jp.com" #ここに文字コードが euc_jp のサイトの url いれる
html = urllib.urlopen(url).read()
html_utf8 = html.decode("euc_jp", "ignore").encode("utf8") #変換できないエラーを"ignore"で無視する
print html_utf8

とりあえず