-
Notifications
You must be signed in to change notification settings - Fork 94
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
fix download sample cases from judge.u-aizu.ac.jp #186
fix download sample cases from judge.u-aizu.ac.jp #186
Conversation
ありがとうございます。手元でも壊れていたことと修正できていることの両方が再現できました。 |
lxml 4.2.x だと再現しますが lxml 4.1.x だと再現しないのでlxml側のバグですね。マージします。 |
起きている現象は、下記に書かれているものと同じもののようです。 https://stackoverflow.com/questions/17859832/beautifulsoup-return-unexpected-extra-spaces ここでもlxmlのバグだと書いてあるのですが、何年も前の書き込みなので、治ってるもんだと思ってましたが、最近デグレードしてしまったのですかね。 マージありがとうございます。m(_ _)m |
|
lxml側に報告したりその準備をしたりしていますか? やらないなら私がやっておこうと思います |
他のページのテストしてたら |
lxmlのそれを再現するコード: #!/usr/bin/env python3
import bs4
html = '''<!DOCTYPE html>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=SHIFT-JIS" />
<title>Title</title>
</head>
<body>
''' + '<div></div>' * 2000 + '''
</body>
</html>'''
print(bs4.BeautifulSoup(html, "lxml")) |
PyPIに反映させました。 |
バグ報告ありがとうございました。 |
素早い対応ありがとうございます。 |
了解です。lxmlへの報告はやっておきます。 |
これ報告やるって言ったけど面倒がってまったくやってないです |
概要
AOJからのサンプルケースの取得が動作していなかったのを修正しました。
修正内容
AOJのhtmlパース時のパーサーの指定を
lxml
からhtml.parser
に変更しました。補足
サンプルケースの取得が動作しなかった環境