見出し画像

PDFの論証集をエクセルに格納して、Googleスプレッドシートにコピペして、Ankiにインポートする【予備試験・司法試験】

Googleコラボの画面

Ankiに大量のデータをインポートするのに、エクセルやGoogleスプレッドシートを使うことができます。わたしはGoogleスプレッドシートを使用しています。

ここまではできるとして、じゃあ Anki カードをつくるのに、最後の壁はなにかというと、覚えるべきものがだいたいPDFで配布されるということです(断言)。

せめてエクセルデータでくれと思うのですが(勝手な都合)ないならば、こちらでプログラムのチカラでなんとかしようというのが今回の記事です。

今のところの最終形は、PDFの1行がそのままエクセルの1行となる(エクセルデータになったうえで、そこから文字データの結合などの修正は必要になる)です。たとえばPDFの元データが1行あいているならば、そこで区切りとして把握するとかのプログラムの進化はできるはずなのですが、そこまでの知識がありません。プログラマー受験生の方、ぜひこそっと教えていただきたいです。


PDFのテキスト化のもう1つの簡単な方法

最終的にAnkiに取り込むために今回はエクセルデータとすることとしておりますが、単純にPDFデータをワードの形で認識する、だけでよいならばもっと簡単な方法があります。

PDFデータをGoogleドライブにアップロードして、「Googleドキュメントで開く」ボタンを押す、です。

GoogleドライブでPDFを開いた画面

これでまあ許容範囲な精度で、PDFをGoogleドキュメント(ワード)のデータにできます。このほかにも、PDFをテキストデータ化する方法はたくさんあるかと思います。

今回は、最終的にAnkiにインポートするデータをつくりたいので、直接エクセルデータとしたい、という感じです。

Googleコラボというものがあります

Googleコラボは、わたしは、Python(パイソン)というプログラムを動かす母艦という認識です。誰でも使えます。

ここからは、ざっくりとした流れを書きます。

このGoogleコラボにPDFデータを入れ込みます。左側にファイルという文字が2つありますが、その下に ↑ 上向きの矢印があるボタンがあります。これを押すと、PDFファイルをGoogleコラボに入れ込むことができます。

PDFを入れるのは、ファイルの下の上向きの↑があるボタンです。

こんな感じです。

こんな感じで入ります。

そしてPython(パイソン)のプログラムを動かすと、1分ぐらいかかりますが、エクセルデータが生成されます。これをGoogleコラボからダウンロードして使います。

PDFデータの下に、エクセルデータが生成されている

使わせていただくPythonのプログラム

こちらの記事からプログラムをコピペして、Googleコラボに貼り付けます。

そして、getTextをget_textに変更すると上手く行きます。

もともとの記事はこちらです。

また、プログラムの中に出てくるPDFファイルをさきほど入れ込んだPDFのタイトルにあわせてください。

わたしは、慌てて、行政法1問1答.pdf のところを、Pythonプログラムでは行政法一問一答.pdf としています。これだと違うPDFファイルと認識します。プログラムが「バグあります」と返してきたので焦りました。こういうことはよくありますのでご注意ください。

間違えている。
これで成功です。EXCELデータをダウンロードします。

論証集を販売なさる方へ

エクセルデータにての販売をオナシャス!何回も書いてますけど。

真面目に考えると、論証の1問1答化ってレベルの高い話なのでは?と思ったり。もしかしていい方法だったりする?

けどやっぱり論証は論証として覚えて、ケーススタディも大事と思いました。そう考えると、やっぱり重問をやっていったほうがいいのか?

この記事が気に入ったらサポートをしてみませんか?