見出し画像

Springer電子書籍のダウンロードを自動化

こんにちは、Choimirai School のサンミンです。

【主要なアップデート】
(2020.05.29)Captcha の追加によりこちらの機能は利用出来ません
(2020.05.06)グーグルドライブをマウントする方法を追加

0  はじめに

※重要:SpringerのサイトにCaptcha機能が使いされましたので、自動でダウンロードすることは出来なくなっています。

画像11

さいもそさんからのコメントで気づきました。ありがとうございます!

画像12

Springerの電子書籍が無料となっています。400冊を超える教材ですので、とりあえずダウンロードしておくと考えている方も多い。

1  通常の手順

通常の手順でダウンロードをしようとしますと、

①エクセルシートからリンクをコピーして、教材のリンクを開く

②「Download book PDF」リンクから本をダウンロード

画像1

本によってはファイルサイズが60MBを超える場合もあって、ダウンロードに時間がかかる。今回の note では、Pythonを使って、ダウンロードの手順を自動化する方法を紹介します。コードの詳細は下記のページを参考にしています。

2  Prerequisite

Google Colab を利用していますので、グーグルのアカウントが必要です。同じ作業は、ローカル環境で行うこともできます。

3  Google Colabで自動化

手順はとても簡単。

①Google Colabのファイルをグーグルドライブにコピー
②ダウンロード用のフォルダを作成
③パッケージのインストール
④ダウンロードするPDFリストを作成
⑤PDFのリストをアップロード
⑥ダウンロードの開始

①Google Colabのファイルをグーグルドライブにコピー

下記のリンクをクリックしますとGoogle Colabのファイルが表示されます。

File -> Save a copy in Drive でコピーを作ってください

画像2

②「download」のフォルダを作成

画面左にある「Files」のメニューそ選択しますと、Filesのタブが開きます。

画像3

空欄を右クリックしますとオプションが表示されますので、「New folder」を選択し、フォルダ名を「download」にしてください。

画像4

※注意:「download」のフォルダは一時的な保存ですので、グーグルドライブをマウント(下記図参照)し、その中に保存することをオススメしたいです。その際は、保存するフォルダのパスを変更する必要があります。

画像10

③パッケージのインストール

「# Install packages」のセルを実行して、必要なパッケージをインストールします。

画像9

④ダウンロードするPDFリストを準備

下記のリンクをクリックしますとSpringerのページが表示されます。

表示される画面に「Free English textbook titles (all disciplines)」のリンク(下記図参照)がありますので、そのリンクをクリックしエクセルのファイルをダウンロードしてください。

画像5

エクセルファイルを開き、ダウンロードする本だけを残して他の行は削除します。

⑤リストをアップロード

上記のステップで用意したファイルをGoogle Colabにアップロードします。

画像6

「#Upload Excel File」と書いてあるセルを実行(①矢印をクリック)します。すると、Choose Files(②)が表示されます。Choose Files を押下し、アップロードするファイルを選択します。すると、ファイルが自動的にアップロードされます。

※重要:ファイル名は、Free+English+textbooks.xlsx でアップロードしてください。

⑥ダウンロードの開始

フォルダとファイルの準備ができましたら、「#Download Books」のセルを実行してください。

画像7

全てが問題なく進みますと左側にある、「download」フォルダにPDFファイルがダウンロードできていることが確認できます。

画像8

4  まとめ

無料で利用できる本のリストは頻繁にアップデートされているように見えます。必要な本があればお早めにダウンロードすることをオススメしたいです。

この記事が気に入ったらサポートをしてみませんか?