見出し画像

WordやExcel、PowerPoint内の画像を取り出す。そしてその画像からテキストも取り出す方法。【Mac使用者も注目!】



■テキスト要素を画像で送られたら

web制作をする中でひとつのストレスに

クライアントがテキスト部分を
「テキストではなく画像で送ってくる」
というのがあると思います。

それがjpgやpngの画像単独で送られるならまだしも(全然まだしもではないが)その画像が「WordやExcel、PowerPoint内」に入れ込んできた日にはというものです。遠くの緑を見てしまいます。それか、いもしない猫を撫でたくなります。

画像を見ながら文字起こしして〜というのも手ですが、時間もかかるし、間違うリスクが上がります。間違えちゃってそのままリリースされることもあるわけで。間違えたのはこちらなわけですが、「テキストでくれなかったのそっちじゃ〜ん。」なんてことは言いたくても言えないですよね。

多分テキストでくれる人は万が一、テキスト間違いのままリリースされても「相互確認していなかったせいですね」って言ってくれる人であることが多いい。お互い様で気持ちよく、でも悪かったな・・・気をつけなきゃと製作側の心をうまく掴むのよね。そういう人は。

しかし、テキスト画像ファンキー野郎はそんな機微はないわけで。
なぜならファンキー野郎だから。

要素のテキスト部分を画像で送ってきちゃうファンキー野郎は残念ファンキー!と思うことにして、簡単に抜き出してもうイライラしないようにしましょう。(でも一手間は変わらないからできればテキストで欲しいものです。)

■注目するのは拡張子!

Officeソフトそれぞれの拡張子をおさらいしましょう。
拡張子とはファイル名の「.(ドット)」以下の部分のことです。

Wordだと「.docx」
例:sample.docx

Excelだと「.xlsx」
例:sample.xlsx

PowerPointだと「.pptx」
例:sample.pptx

です。

■ファイル内から画像を取り出す。

元データは取っておきたいので、コピーしたもので作業に入りましょう。
取り出したい画像を含むファイルの拡張子を「.zip」に変更します。
例えばsample.docxsample.zipにします。

すると、「拡張子を変更してもいいか?」という確認メッセージが出てくるので「いいよ」と許可を出しましょう。

ここでできたzipファイルを展開します。
展開すると「Data」というフォルダーがあり、
その中にファイル内で使用した画像たちが入っています。
必要な画像をそこから取り出すことができます。

■Macユーザーは注意!

っと、
Windowsならこのやり方で出てくるかと思います。
Data」フォルダーの名前部分が違うかも?ですが・・・。

私はMacユーザーなんだよなという方もいるかと思います。
筆者もMacユーザーでありまして、
画像取り出す系の記事を読み、
「やった!!」と思ってルンルンでやってみたのですが、

できず・・・。

というか、
sample.docxsample.zipにできても展開してくれないのです。

「sample.zip」を展開できません。対応していないフォーマットです。

ガーン

とアラートが出てきてポカーンです。
Officeソフト入れてないからか・・・そりゃそうか・・・。
と思ったのですが、ここでひと手間!

Macに入っているOfficeの対応ソフト(同等ソフト?)の拡張子にしてからzipにするようにすれば上記と同じように画像が取り出せます。
ただ、先ほどのようにファイル名変更すればいいかというわけではなく、
該当ソフトで開いてからファイルを新たに保存します。

・Wordファイル(拡張子.docx)の場合

Wordと同じ機能を持つソフトは「Pages」
Pagesの拡張子は「.pages」
sample.docxをPagesで開き
「ファイル > 保存」または「⌘ + S」で保存します。
ファイル名が「sample.pages」になっているかを確認して保存。

・Excelファイル(拡張子.xlsx)の場合

Excelと同じ機能を持つソフトは「Numbers」
Numbersの拡張子は「.numbers」
sample.xlsxをNumbersで開き
「ファイル > 保存」または「⌘ + S」で保存します。
ファイル名が「sample.numbers」になっているかを確認して保存。

・PowerPointファイル(拡張子.pptx)の場合

PowerPointと同じ機能を持つソフトは「Keynote」
Keynoteの拡張子は「.key」
sample.pptxをKeynoteで開き
「ファイル > 保存」または「⌘ + S」で保存します。
ファイル名が「sample.key」になっているかを確認して保存。

なんでKeynoteだけ拡張子ソフト名そのままじゃないんだろう・・・・。

ただMacユーザーの方でもOfficeソフトを入れていれば、
Macソフトの方の拡張子にわざわざ変更しなくても、
Windowsの方と同じ方法で画像を取り出せるのかもしれないです。

■画像からテキストを抽出する

取り出した画像からテキストを抽出しましょう!

方法はいくつかあると思いますが、
私がしたことがあるのは、
画像から文字起こししてくれるサイトを利用するか、
Googleドライブを利用して文字起こしするかです。

・文字起こししてくれるサイトを利用する場合

「画像からテキストを抽出」なんてググってみると、
画像をアップロードしただけで文字起こししてくれるサイトがいくつか出てきます。下記に2サイトほど載せときます。

ただ、このサイトに画像アップして大丈夫かな・・・。
リリース前の情報だし、なんだか不安。という時もあるわけで、
画像や文章的に何かしら推測されないだろう時とか、
万が一誰かに見られたとしても問題ない時に使ってます。
ちゃんと管理されているサイト等だとは思いますが、情報管理は慎重にしたいと。

・Googleドライブで画像から文字起こしする場合

自分のGoogleドライブに画像をアップロードします。ドラッグ&ドロップ!
アップし終えたら、該当ファイル名を右クリックするとメニューが出てきます。

ちなみに右クリックで出てくるメニューは「コンテクストメニュー」もしくは「コンテキストメニュー」と言うそうです。
この記事を書いていて、あれってなんて言う呼び名があるんだろう??と思って調べて初めて知りました。ひとつ賢くなリました。

右クリック>メニュー内の「アプリで開く」>Googleドキュメント

を選択します。

少しGoogleが考えた後(ローディング的なシンキングタイムの後)に、
Wordのような様式に元の画像と、
画像内のテキストらしきものを抽出して画像下にテキスト化してくれています。一瞬の出来事!

■イライラとおさらば!そして確認もしっかりと!

この流れを覚えておけば、
テキスト要素を画像で送ってこられようとも、
ましてやパワポなんかにその画像貼っつけてこられようとも余裕綽々です。

しかし!
抽出してくれたテキストが絶対正しい訳ではないので、
画像と見比べて最終確認はしっかりしましょう!
テキストが画像か何かに重なっていたりすると抽出してくれてないとかもあるので注意です。

ひと手間であることは変わりないのですが、
ストレスを最小限に抑えられたらお互いにとって良いですよね。
私の備忘録として書いたところが大きいですが、
同じようなことで悩んでいた方のヒントになればと。


この記事が気に入ったらサポートをしてみませんか?