見出し画像

具体的なタスクvol.1【動画#26】2値分類・多クラス分類・分類の構造・欠損値のある入力・回帰・転写のタスクの解説


<具体的なタスクについて>

1. 分類とは

離散的な結果を予想するための分布のこと

【サンプル例】

2値分類➡︎2つの確率を予想する
ex)
・男か女かどうか
・顔かどうか

多クラス分類 ➡︎多クラスの分離を行う
ex)
・Aさんか、Bさんか、Cさんかを予想する
・犬、猫、ネズミを分類する




2. 分類の構造について




3. 欠損値のある入力の分類について

<欠損値のある入力の分野>
AIおじさん分類器の事例では、Aの画像はデータとして適さないので除外する。

BやCだけの画像ではなく、Aのような変な画像もある
⬇︎(Aの扱い方例)
・Aをデータとして適さないものとする➡︎除外
・輝度、明度、彩度に対して頑健性をもつモデルを作成するためのデータの増加方法として扱う

アカデミックなAIについて自分が研究している内容で、1番伝えたいことを伝えるために都合の良い範囲で操作を行う。
➡︎実務ではもっと条件が複雑になる
➡︎そのひとつが欠損値




4. 回帰とは

連続的な結果を予想するための分析

【例】
0,1,2といった離散値ではなく
11.4や800.1といった連続値を予想

分類問題を回帰として扱うことも可能
【例】
100億以上をA
80億以上100億未満をB
といったボーダーラインを設けて離散的な形で当てはめることも可能



5. 転写のタスクについて

転写:
OCR文脈で用いられるタスク
画像の中の文字を読み込んで文字起こしを行う


<どんな文字か・座標点は何か>


文字のディテクションを行う
➡︎どんな文字か、座標点は何か

⬇︎
どこにどのような意味で書かれているかを解釈する


今回の場合、
上 タイトルのラベル
下 別のラベルをつける(上と開きがあるため)

取得した文字と座標点から、文字の繋がりとカテゴリーがわかる



<今回の総まとめ>
分類・回帰・転写のタスクをそれぞれしっかり要点をおさえよう。


次回、具体的なタスクvol.2 機械翻訳・構造出力・異常検知・合成・サンプリング・欠損値補完・ノイズ削除 について簡単に整理する。




この記事が気に入ったらサポートをしてみませんか?