【NYAUWとMAPIのクロスミッション】⑤「OCR機能」(導入編)
クリニックでの診療以外にMAPI(医療AI推進機構)の想いに賛同し活動に参加させていただいております。
(この記事も井手個人の見解として記述をしております)
先日は
医療の診療行為と同じように、AIにもPerfectなものはないという理解のもと、その時点のBest Practiceに触れ続け、メリット・デメリットや注意点などのを実感することがAI利用でトータルメリットがプラスにつながるという考えを個人的に持っております。
自分で正解のわからないものではなくて、正解のわかるAIを試しましょうということで、第一弾では先生方に音声入力を実際に試していただきました(よね?)
OCRサービス
注意)ここでも「なるほどなー」で終わらないでくださいね(笑)。スマホやPCで無料(または適価)で使えるOCRサービスを紹介しており、AIについてメリットとデメリットを実感してもらうことが目的ですので。
今回は前回の音声認識に引き続き、識別系の中でも文字認識AI、つまりOCRを試したいと思います。どんな時に使うの?と思われるかもしれませんが。これは偽デジタルのデジタル化に使えるんです。
(*OCRは、Optical Character Reader(またはRecognition)の略で、画像データのテキスト部分を認識し、文字データに変換する光学文字認識機能のことを言います。)
偽デジタル?
またまた訳わかんない「偽デジタル」なんて言葉を!と思われた先生方すみません。
ではまず練習です。先生方それぞれの項目を【アナログ】と【デジタル】に分類して下さい
・手書きの習字
・メモ帳に書いた買い物メモ
・スマホのメモ帳・TODOアプリのテキスト
・スマホのメモ帳・TODOアプリのスクリーンショット(JPGE形式)
・電子カルテ上の紹介状情報
・電子カルテで作成・印刷・送付された紹介状
・頂いた紹介状をスキャンしてJPEGにしたもの
回答例
皆さんの代表的(であろうと思われる)な回答案を提示します
・【アナログ】手書きの習字
・【アナログ】メモ帳に書いた買い物メモ
・【デジタル】スマホのメモ帳・TODOアプリのテキスト
・【デジタル】スマホのメモ帳・TODOアプリのスクリーンショット(JPGE形式)
・【デジタル】電子カルテ上の紹介状情報
・【アナログ?】【デジタル?】電子カルテで作成・印刷・送付された紹介状
・【デジタル】頂いた紹介状をスキャンしてJPEGにしたもの
おそらくは「電子カルテで作成・印刷・送付された紹介状」以外は悩むことなく【アナログ】と【デジタル】の分類をされたと思います
【アナログ】と【デジタル】の定義は?
分類を行う際には、境目を決めなくてはなりません。
それぞれを定義するのも良いですが 片一方を定義して、残りはそれ以外とした方が簡単なので【デジタル】を定義して、【アナログ】はデジタル以外とします。
まずは先入観無しにGEMINIに聞いてみました
抽出しますと、デジタル技術の主な特徴は以下の通りです。
複製・編集が容易: デジタルデータは劣化することなく何度でも複製でき、容易に編集・加工できます。
高速な伝達: ネットワークを通じて瞬時に世界中に情報を伝達できます。
大容量の保存: ハードディスクやクラウドストレージなどに大量の情報を保存できます。
自動処理: プログラムによって複雑な処理を自動化できます。
今回の、例題に関する視点で言うと
複製・編集が容易: デジタルデータは劣化することなく何度でも複製でき、容易に編集・加工できます。
という判断基準が大切そうですね。
もう一度例題を見直します
・【アナログ】手書きの習字:複製・編集が容易ではない>確かに【アナログ】です
・【アナログ】メモ帳に書いた買い物メモ:複製・編集が容易ではない>確かに【アナログ】です
・【デジタル】スマホのメモ帳・TODOアプリのテキスト:スマホ上で選択コピー・ペースト・編集が容易>確かに【デジタル】です
・【デジタル】スマホのメモ帳・TODOアプリのスクリーンショット(JPGE形式)>これはJPEGのコピー(複製)は容易ですが中身の編集やテキストの抽出は出来ないので【デジタル】のように見えて【アナログ】、つまり【偽デジタル】です
・【デジタル】電子カルテ上の紹介状情報>電子カルテ上で選択コピー・ペースト・編集が容易>確かに【デジタル】です
・【アナログ?】【デジタル?】電子カルテで作成・印刷・送付された紹介状>電子カルテ上では【デジタル】でしたが印刷すると複製・編集が容易ではない>【デジタル】で作られても【アナログ】、つまり【偽デジタル】です
・【デジタル】頂いた紹介状をスキャンしてJPEGにしたもの>これはJPEGのコピー(複製)は容易ですが中身の編集やテキストの抽出は出来ないので【デジタル】のように見えて【アナログ】、つまり【偽デジタル】です
自分のメモ帳などはいいですが、他人から頂いた資料や教科書などは
いくらデジタルで作られていても
・キャプチャ画面
・印刷されたもの
などは偽デジタル(=アナログ)なのです。せっかくの手間の再利用ができないのです。
多くの方がアナログと判断するものは”アナログだから仕方ない”という諦めがありますが、中途半端にデジタルっぽいものは期待値が上がっているのに実はアナログ(=偽デジタル)というものがストレスなのです
以前も偽デジタルについても書いておりますのでこの【導入編】の最後の参考にお読みください
今日はここまで
どうです?皆さん周りを見回すと結構偽デジタルあるでしょう?
(再掲)とにかく試してみよう!
ChatGPTやCopilotやGeminiでは無料で試せるものがありますのでまずは触れてみてください。
目的は一般のAIを使うことでメリットやデメリットや使い分けの理解が出来て、医療AIでも結局そういったケアをしながら使うことでメリットが大きくなり、悪くないんじゃないという理解をされる先生方や医療機関が増えることが大切だと思うのです。
(再掲)AIと間接民主主義
これはMAPIのメンバーの言葉で感動したものです・
「データを提供していなければ、AIはその施設の特性を無視して判断するように、基準が作られていきます。学習データを提供することで、間接的に、自分たちの医療判断や患者層を基準に取り入れさせるという意味では、間接民主主義みたいだなと思いました。」
そういった意味でデータを提供してくださいということも大切ですが、AIを使ってダメさ加減にため息を感じていただくことでデータ提供が更に進むと思います
(再掲)このシリーズの目的は?
医療以外の日常でAIに触れることで、医療AIのデータ流通や医療機関へのAI導入が増え、患者さんケアの向上、医療従事者への負担減少、社会保障の負担軽減、医療レベルの上昇などにつながるというマクロ視点でのミッションと考えます。