2011年6月 6日

[debian-users:55353] Re: Beautifulsoup のバグ

>> squeeze の python-beautifulsoup パッケージの Beautifulsoup の動作にはバグのような症状があります。
> (略)
>> 本家へのバグ報告は、私には難しいので、 報告だけさせていただきます。
>
> えーっと…。
>
> ・どのような動作を想定して実際にはどう動いたのか
> ・どのように操作すると再現するのか

>
> ぐらいは書かないと、何も続かないと思いますが。

失礼しました。
バグを直すというより、パッケージのバージョンをあげれば
よいだけの話だと判断したので、記述しませんでした。

パッケージ作成後、一度でもテストしていれば問題にならないと思いますが・・・・

def setPriceDatas(data, url):
page = urllib2.urlopen(url)
soup = BeautifulSoup(page)
date_strs = soup.findAll(['span'], attrs={"class" : "date"})

※url は 文字列データのURL表記です。

この時点(インスタンス作成直後) で エラーが上がります。
つまり、バグというか、最初から動作しないというか そういう感じです。

本家には、

For almost everyone, the the 3.2 series is the best choice. The most
recent release in this series is 3.2.0, released November 21, 2010.

とありまして、昨年末リリースされた3.2 の利用を推奨しています。

debian の backport には
squeeze-backports (python): error-tolerant HTML parser for Python
3.2.0-2~bpo60+1 [backports]: all
というのがあって、これを期待して aptitude したのですが、何故か
squeeze (stable) (web): error-tolerant HTML parser for Python
3.1.0.1-2: all
の、ダメだったバージョンが入ってきます。

それで、本家リリースの、3.2 を使っています。

報告の目的は、beautifulsoup 自体のバグというより、
3.2.0-2~bpo60+1 [backports]: all
が入ることを期待して、3.1.0.1-2: all が入ってきたことの報告です。

3.2.0-2~bpo60+1xxxx.deb をダウンロードして使えば良いだけの話なのでしょうが、

対象がパーサーなので、頻繁に更新される
setup.py install で ちゃんと動作できた

事から、debian パッケージを使うのを諦めて、本家からのダウンロードで利用する事にしました。


投稿者 xml-rpc : 2011年6月 6日 00:27
役に立ちました?:
過去のフィードバック 平均:(0) 総合:(0) 投票回数:(0)
本記事へのTrackback: http://hoop.euqset.org/blog/mt-tb2006.cgi/104354
トラックバック
コメント
コメントする




画像の中に見える文字を入力してください。