マガジンのカバー画像

画像認識プログラムを作ってみよう

84
本書は、Google、Amazon、Microsoft、IBMの画像認識サービスを利用して、画像認識プログラムを開発するための学習書です。本書で使用するプログラミング言語は1つに… もっと読む
運営しているクリエイター

記事一覧

固定された記事

画像認識プログラムを作ってみよう - はじめに

 ひと昔前の画像認識と言えば、高度な知識を要するアルゴリズムで開発したソフトウェアを、高価なグラフィックボードを搭載したコンピューターで稼働させることにより、貧弱な光学文字認識(OCR)を実現する程度が一般的でした。 予めコンピューターに認識させておいたフォントの解読でさえうまくいかない場合もあり、手書き文字の認識は困難を極めました。  ところが2012年6月、画像認識を飛躍的に発展したことを示唆する、重大な事件が起きます。 Googleが「教師なし学習」で「猫」の画像をコ

スキ
7

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」

 本章では、本書のテーマである画像認識について、まずはその技術的背景を説明します。さらに具体例を用いて、現在において画像認識がどのように利用されているか、さらにその将来における可能性についても述べてみたいと思います。また、画像認識のアルゴリズムを簡単なサンプルプログラムを持って説明します。  続いて、Google、Microsoft、Amazon、IBMの4社が開発した画像認識APIを利用して、各々の画像認識サンプルプログラムを作成します。各々の画像認識APIには、一長一短が

スキ
1

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - 第三次人工知能ブーム

 今、人工知能がブームです。本書が紹介する画像認識プログラムについても、人工知能が用いられています。昨今の人工知能ブームは、「第三次人工知能ブーム」と呼ばれています。第三次ということは、これまでに第一次と第二次があったということです。第三次人工知能ブームが、第一次と第二次と比較をすることで、第三次にはどのような特徴があるのかを本節をもって説明します。  また、人工知能そのものについても考えてみます。近年では、人工知能によって仕事が奪われてしまうなどといった話しが聞かれます。実

スキ
2

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - Googleの猫

2012年、Googleの画像認識技術が飛躍的に向上することを示唆する、重要な事件が起きます。それは、「Googleの猫」と呼ばれています。Googleの画像認識プログラムが「猫」の画像を認識することに成功したということなのですが、いったい何が凄いのでしょうか。これまでの画像認識との違いを見てみましょう。 「Googleの人工知能が猫を認識した!」 2012年、Google社が開発した画像認識プログラムによって、猫の画像の認識に成功したというニュースが大きく取りざたされま

スキ
3

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - 第一次人工知能ブーム(推論と探索)

 まずは、第一次人工知能ブームからみてみましょう。 人工知能(AI:Artificial Intelligence)という言葉が最初につかわれたのは、今から60年以上も前で、1956年のダートマス会議(学術における研究分野を発表する場を設けるための会議)でJohn McCarthy(ジョン・マッカーシー)博士の発言とされています。 John McCarthy博士は、人工知能研究の第一人者で、プログラミング言語「Lisp」の開発者です。  第一次人工知能ブームは、1950年から

スキ
1

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - 第二次人工知能ブーム(知識表現)

第一次人工知能ブームでは、明確な答えを導き出すことができる問題のみに限定し、解決策を導き出すことが可能でした。しかし汎用性にかけ、ゲームやパズルを解くためのアルゴリズムでしかありませんでした。さて、第一次人工知能ブームの欠点を踏まえた上で、第二次人工知能ブームではどのような進化を遂げたのでしょうか。そして、なぜに終焉を迎えることになるのでしょうか。  前項にて説明したとおり、第一次人工知能ブームの問題点は「Toy Problem(トイプロブレム)」と呼ばれ、文字どおりゲーム

スキ
1

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - そして現在の第三次人工知能ブーム(機械学習)

前項と前々項にて、第一次人工知能ブームと第二次人工知能ブームについて説明しました。本項では、現在の第三次人工知能ブームについて説明します。コンピューターが人類にどれだけ近づけるかどころではなく、人類をはるかに超越した知能を得てしまう危険性さえ叫ばれています。  第一次人工知能ブームの「探索と推論」はゲームやパズルのような「Toy Problem(おもちゃの問題)」しか解決できず、第二次人工知能ブームの「知識表現」は専門家の知識はあっても常識がわからない「Frame Prob

スキ
1

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - AIの民主化

三度の人工知能ブームを迎えた現在、しきりに「AIの民主化」が叫ばれています。これまでの人工知能ブームは、優れた知能を持つ技術者の考案したアルゴリズムによって開発された人工知能が主体でした。しかし、昨今の第三次人工知能ブームは、優秀な技術者が必要なことはもちろんのこと、それ以外にもインフラの整備が重要となってきます。  本書で紹介する画像認識のWeb APIは、Google/Amazon/Microsoft/IBMの4社がサービスを提供しています。いずれの4社も、世界的な大企

スキ
1

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - 日本政府の人工知能への取り組み

人工知能の活用については、日本国政府においても積極的に推進しています。例えば、総務省では「AIネットワーク社会推進会議」なる会議を開催し、積極的に人工知能に関する意見交換と学習の場を設け、国内における人工知能の研究と開発、利活用を促進しようと邁進しています。  1990年代前半にバブル崩壊を迎えた日本経済は、「失われた20年」とも言われるほどの低迷期を迎えています。かつて世界経済をけん引した日本メーカーの優れた製品は、現在では海外製品に押され気味です。 当然、このような状況

スキ
1

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - まとめ

 第一次人工知能ブームと第二次人工知能ブームは、結局のところ、ブームとなる期待にそぐわぬ結果であったために、下火になってしまったと言えます。では、現在の第三次人工知能ブームはどうでしょうか?ビッグデータを解析して意思決定の判断をコンピューターに委ねるといった面においては、十分な結果を得られています。これがビッグデータの解析により、本書のテーマである画像認識も実装されています。これはすでに十分な結果を得られており、今後も多くの分野において応用されていくでしょう。  しかし、ここ

スキ
1

画像認識プログラムを作ってみよう - コラム:LINEアプリ「りんな」

 2015年8月、LINEアプリに登場した女子高生「りんな」は、Microsoft社が開発した人工知能です。登場からすでに4年の歳月を経ており、2019年3月に高校を卒業、その後は歌手活動に専念し、avexとレコード契約を結び、2019年4月にはデビュー曲「最高新記憶」を発表しました。 AIりんな https://www.rinna.jp/ Microsoft IMEの変換候補にも採用されているとのこと。人間どおしの自然な会話を可能とした会話エンジン「共感チャットモデル(

スキ
1

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - 人工知能について考える

 現在の第三次人工知能ブームのキーワードは、「機械学習(Machine Learning)」であることは前節で説明しました。 この機械学習にあたっては、学習するための材料となる大量のデータ、ビッグデータの存在が欠かせません。このビッグデータを解析することで、人工知能はさまざまな局面における意思決定を行うことができるようになります。さらに、人工知能はビッグデータのなかから特定のデータに関する特徴を見出すことで、自ら学習する深層学習についても前節で説明したとおりです。 しかし、そ

スキ
2

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - そもそもの人工知能の定義とは

さて第一章では、現在の第三次人工知能ブームについて説明しました。ところで、「人工知能」という言葉の定義は、そもそも何でしょうか?第一次人工知能ブームでは、ゲームやパズルを解くためのアルゴリズムが人工知能と呼ばれました。現在では、iPhoneのSiri(シリ)やAndroidのGoogleアシスタントが人工知能としての知名度が高いでしょう。本項では、人工知能という言葉の定義について、考えてみます。  ひと口に「人工知能」といっても、さまざまなものが挙げられます。 例えば、「人

スキ
2

画像認識プログラムを作ってみよう - コラム:アラン・チューリング

 先ほどはチューリング・テストについて説明しましたが、そのチューリング・テストを考案したアラン・チューリングの名が付いた、「チューリング賞」という賞があります。コンピューター技術者のあいだでは、ノーベル賞にも匹敵するほどの、栄誉ある称号です。コンピューター技術者として輝かしい業績を上げたが故に創設された賞ですが、そもそもアラン・チューリングとは、どのような人物だったのでしょうか。  アラン・チューリングは、1912年、イギリスのロンドンに生まれました。1931年にケンブリッジ

スキ
1

画像認識プログラムを作ってみよう - 第一章「画像認識の技術について」 - シンギュラリティの恐怖

SF映画やSF小説において、人類よりも優れた知能を手に入れた人工知能によって人類が滅亡の危機に瀕するような内容のものが数多くあります。もっとも有名なものとしては、映画「ターミネーター」でしょうか。果たして、人工知能が人類の知能を凌駕するときは、本当に来るのでしょうか。  人工知能の研究における世界的な権威である、Ray Kurzweil(レイ・カーツワイル)博士は、2005年、恐るべき予言をします。 著書「The Singularity Is Near:When Human

スキ
1