Springer電子書籍のダウンロードを自動化
こんにちは、Choimirai School のサンミンです。
【主要なアップデート】
(2020.05.29)Captcha の追加によりこちらの機能は利用出来ません
(2020.05.06)グーグルドライブをマウントする方法を追加
0 はじめに
※重要:SpringerのサイトにCaptcha機能が使いされましたので、自動でダウンロードすることは出来なくなっています。
さいもそさんからのコメントで気づきました。ありがとうございます!
Springerの電子書籍が無料となっています。400冊を超える教材ですので、とりあえずダウンロードしておくと考えている方も多い。
1 通常の手順
通常の手順でダウンロードをしようとしますと、
①エクセルシートからリンクをコピーして、教材のリンクを開く
②「Download book PDF」リンクから本をダウンロード
本によってはファイルサイズが60MBを超える場合もあって、ダウンロードに時間がかかる。今回の note では、Pythonを使って、ダウンロードの手順を自動化する方法を紹介します。コードの詳細は下記のページを参考にしています。
2 Prerequisite
Google Colab を利用していますので、グーグルのアカウントが必要です。同じ作業は、ローカル環境で行うこともできます。
3 Google Colabで自動化
手順はとても簡単。
①Google Colabのファイルをグーグルドライブにコピー
②ダウンロード用のフォルダを作成
③パッケージのインストール
④ダウンロードするPDFリストを作成
⑤PDFのリストをアップロード
⑥ダウンロードの開始
①Google Colabのファイルをグーグルドライブにコピー
下記のリンクをクリックしますとGoogle Colabのファイルが表示されます。
File -> Save a copy in Drive でコピーを作ってください
②「download」のフォルダを作成
画面左にある「Files」のメニューそ選択しますと、Filesのタブが開きます。
空欄を右クリックしますとオプションが表示されますので、「New folder」を選択し、フォルダ名を「download」にしてください。
※注意:「download」のフォルダは一時的な保存ですので、グーグルドライブをマウント(下記図参照)し、その中に保存することをオススメしたいです。その際は、保存するフォルダのパスを変更する必要があります。
③パッケージのインストール
「# Install packages」のセルを実行して、必要なパッケージをインストールします。
④ダウンロードするPDFリストを準備
下記のリンクをクリックしますとSpringerのページが表示されます。
表示される画面に「Free English textbook titles (all disciplines)」のリンク(下記図参照)がありますので、そのリンクをクリックしエクセルのファイルをダウンロードしてください。
エクセルファイルを開き、ダウンロードする本だけを残して他の行は削除します。
⑤リストをアップロード
上記のステップで用意したファイルをGoogle Colabにアップロードします。
「#Upload Excel File」と書いてあるセルを実行(①矢印をクリック)します。すると、Choose Files(②)が表示されます。Choose Files を押下し、アップロードするファイルを選択します。すると、ファイルが自動的にアップロードされます。
※重要:ファイル名は、Free+English+textbooks.xlsx でアップロードしてください。
⑥ダウンロードの開始
フォルダとファイルの準備ができましたら、「#Download Books」のセルを実行してください。
全てが問題なく進みますと左側にある、「download」フォルダにPDFファイルがダウンロードできていることが確認できます。
4 まとめ
無料で利用できる本のリストは頻繁にアップデートされているように見えます。必要な本があればお早めにダウンロードすることをオススメしたいです。
この記事が気に入ったらサポートをしてみませんか?