ニュース
今回はシリーズの『Python 2年生』から、主にWeb上のデータを収集・選別するスクレイピングの基本となるHTMLの解析を取り上げた「LESSON04 HTMLを解析してみよう」を抜粋して紹介します。 Pythonをインストールしてからお楽しみください。
米Anaconda社は、HTML文書の中にJavaScriptと同じようにPythonのコードを記述し、実行可能にする「PyScript」をオープンソースで公開した。
その一つが「xhtml2pdf」というPythonパッケージだ。 このライブラリは、PythonのPDF作成ライブラリを利用して、自力でHTMLをレンダリングしている。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する