見出し画像

LiquidText覚書・・・日本語非対応「インスタントOCR」をGoogleレンズでカバー!・・・PDF群のワークスペースに他の情報を素早く追加する技・・・

LiquidTextを使用する最大のメリットは、参考資料として取り込んだ複数のPDFから「Excerpt(抜粋)」を集め、並び替え、あるいはMindMap風にまで整理整頓ができる点です。

よく使う技の覚書です。
何となく雑誌を見ていて・・・この記事は今格闘しているLiquidTextのワークスペースに追加したい・・・

とりあえず、
「写真」を撮る・・・出先の他人の雑誌かも【うん、ほんまやで】
②  LiquidTextを開いて・・・帰宅して・・・
②  -1   「Add Document」をクリック

LiquidTextの「Add Document」

②  -2   「Image Files」を選択

「Image Files」のダイアログ

「Insert Picture from Photos Library」を選択
当該の画像が表示されたら、「Import Document」アイコンをクリック

「写真」から当該画像をダウンロード

②  -3   これでDocument欄の最下部に追加され、

Document欄
ここに表示されているのは「画像」です。

これから、ワークスペースに加えたい「Excerpt(抜粋)」を部分スクリーンショットします。
スクリーンショットをクリップボードにコピーしたいので、

②  -4   LiquidTextのDocumentに表示されている「画像」から部分スクリーンショットします。
【Macbookの場合】
「control」「shift」「command」「4」の 3 つのキーを同時に長押し、十字型のカーソル をドラッグして、画面の取り込みたい部分をドラッグして範囲選択します。

これでワークスペースの「Excerpt(抜粋)」に加えたい部分がクリップボードにコピーされました。

次に「Google レンズ」を使って、OCRをかけます。

③ 「Google Clome」へ行きます・・・いったんLiquidTextから離れます

③  -1   カメラのマーク(画像での検索)をクリック
③  -2   【Googleレンズで画像を検索】の画面に移行

Googleレンズで画像を検索

③  -3   ここへいきなりペースト

左側では「テキスト」を選択・・・そうすると右側に出現する「テキストすべて選択」アイコンをクリック

③  -4   左側の「テキスト」を選択
③  -5   右側に出現する「テキストすべて選択」をクリック
これにより、左側の「テキスト」が選択状態に変わる
③  -6   右側の画面も変わり。「テキストをコピー」アイコンが出現する・・・その他「読み上げ」「翻訳」「検索」アイコンも出現・・【うん、ほんまやで】
③  -7「テキストをコピー」アイコンをクリック

これで画像をOCR化でき、クリップボードにコピーされました。
「Google レンズ」によるOCRの結果:

■ハロー効果
「東大出身」 「アカデミー賞8部門ノミネート!」 など、 対象を評価 するときに、最初に与えられた情報に影響され、 実態を知る前にそれ に対する評価が上がる効果のことです。 ハローは後光という意味です。 したがって、 「○○医大△△教授監修のダイエットサプリ」 「ファイ ナンシャルプランナーが教える月収3倍増の方法!」 など、パッと見で いかに良い印象を与えるかがポイントになります。

「Google レンズ」によるOCRの結果

④ LiquidTextに戻ります

④  -1   ワークスペースに「テキストボックス」を追加し、
④  -2  そこへペーストします・・・完成


左がDocument    右がワークスペースに追加したテキストボックス


まとめ


Liquid TextとGoogleレンズの組み合わせで、効率が上がりました・・・
OCRなしのPDFもワークスペースに加えたい抜粋(Excerpt)部分だけGoogleレンズでOCRをかけ、Liquid Textに戻って「貼り付け」で済みます。

今までよくやった、タテ書き参考文献をOCRかけてヨコ書きにする準備・・・・
ただし、大量に引用する予測ならこの準備の方が効率的です。

しかし、一冊からせいぜい10か20程度の引用しかつかめないような文献は
OCRなしのPDF(タテ書き)を読み飛ばしながら、必要な箇所だけ、
部分スクリーンショットしてGoogleレンズでOCRして、Liquid Textに戻り、
ワークスペースに貼り付ける繰り返しの方が効率的です【ほんまやで】

ついでに難題の「タテ書きルビ付き」をGoogleレンズで実験

GoogleレンズでOCR

たいらかやわ 心を平にして気を和らげげんむようふうかんしょしつまたときどきみ、言を少なくして無用の事をはぶき、風・寒・暑・湿の外邪を防ぎ、又時々身を動かし、歩行し、時ならずしてねぶり臥す事なく、食気をめぐらすべし。 しょくき是養生の要なり。 これようじょう*貝原益軒 『養生訓』(正徳三年・一七一三) 総論下

《感想》
ルビがここまであると、大混乱・・・【うん、ほんまやで】


江戸以前の妖怪画は、前二冊で充分紹介されているので、 本誌は江戸期を中心とする。 江戸期に入ると、妖怪とともに とりません 幽霊も盛んに描かれるようになる。 鳥山石燕の「画図百鬼夜 行」にはすでに幽霊がさまざまな妖怪とともに描かれている。
ここに、幽霊は妖怪とは別のものとする意見がある。 近 世文学研究者の諏訪春雄氏は、幽霊は死者の世界である 「他界」に住み、 妖怪の住む異界とは別だという。これに対 小松和彦氏は、妖怪は異界に住む 「祀られぬ霊的存在」と 考え、幽霊は妖怪の一つで、 死霊の特殊タイプと考える。 死 霊が人間以外の姿で現れると妖怪と言われ、生前の人間の姿 で現れると幽霊と言われる、というのだ。
では、骸骨は人間の姿には違いないので幽霊とすべきか、 肉身がないので妖怪とするか。
うもののけろくまさ また、「稲生物怪録絵巻」に出てくる女の生首に手のはえ 化物は、女の顔は生前の姿なので幽霊とすべきか、体の一 部しかないので妖怪とすべきか。

《感想》
残念ながら「ルビ」少々しか読み込みできませんでいたが、この方が本文は期待通りのOCR化ができました。

もっとも力を発揮した・・・縦書き・ルビなし部分OCR


あまりの激務のため 在任中に次々と交代
江戸の町奉行所は北町と南町の2 カ所にあったため、奉行の定員は2 人。仕事は登城に評定、罪人の裁判、 行政事務、火消しの統括など多岐に わたり、息つく間もない毎日だった。 このため、北町と南町は1ヵ月ご との交代制で訴状の受け付けを遂行。 つまり、「月番」と呼ばれる勤務を1 カ月務めると、翌月は「非番」。ただ し、非番の月であっても、訴状の処
理はしていたらしい。
日常の業務はまず8時に出勤。 町 奉行の屋敷は、奉行所の中に置かれ ていたため、出勤時間を必要としな い職住一体の生活だった。
奉行所で部下の与力に指示を与え ると、急ぎ登城し、老中や幕府官僚 への報告や打ち合わせにいそしむ。 昼食も打ち合わせの合間に済ませて いたというから、優雅にランチなど 食べていられなかったろう。
江戸城和田倉門近くにあった評定 所に、月6回出向くのも重要なスケ ジュールだった。評定所は、国政に 関する最高意思決定機関であり、非 番であっても欠席することは許され なかった。

《感想》
ルビなし、平易な現代文、さらに部分キャプチャーで文字が大きい場合はとっても良い結果が引き出せます。

おまけ

さらに、Googleらしく、この文章の場合は、
「町奉行」という検索結果がでてきます。


味される件は名 のお家騒動や、他の奉行である寺社 奉行や勘定奉行(町奉行を合わせて 三奉行と称された)も加わる、管轄 をまたいだ複雑な事件だった。江戸 の治安維持部隊のトップを務める町 奉行は、それだけ重い任務だったこ とが分かる。
すみ また、町奉行が管轄したのは「墨 びきない しゅびきない 「引内」と称され、江戸城を中心とし 環状域であった。それに対し、 江 戸府内全体を表す、より大きな環状 域が「朱引内」である。奉行所が取り 締まるエリアは、当時の古地図にも
明確に線引きされ、定められていた。 町奉行の役職の特徴として、在任 期間が極めて短かったこともあげら れよう。
激務だったため、短い期間で交代 せざるを得なかったと推測される。 ただすけ 大岡越前の名で知られる大岡忠相は 在任20年だったといわれるが、例外 中の例外である。
北町・南町の両奉行所の場所は、 北町が江戸城常盤橋御門→呉服橋御 門、南町が呉服橋御門→鍛冶橋→数 寄屋橋御門へと移転。 数寄屋橋にあ った跡地が現在、JR山手線有楽町 駅前に史跡として指定され、当時の 名残を留めている。

この文章の場合は「三奉行」というGoogle検索結果が出てきます。
認識できた文頭の言葉を選んでいるわけでなく(そうであれば「お家騒動」や「勘定奉行」を検索結果にしても良さそうですが、「三奉行」です。

ちょっと感動!・・・【うん、ほんまやで】

この記事が気に入ったらサポートをしてみませんか?