過去10年で人工知能は大きく進化し、その影響は多岐にわたります。ディープラーニングの革新により、機械は複雑な情報の処理やパターンの理解をすることができるようになりました。音声認識技術の発展により、コンピュータは私たちの言葉を理解し、日常生活における音声認識システムが一般的になりました。医療ではAIが診断や治療に大きく貢献し、ディープフェイク技術や画像認識技術も進展しています。自動運転車の普及、推薦システムの発展、そして大規模言語モデルの革新など、AIの進化は私たちの生活や業界に革命をもたらしています。
公開日:2023年9月29日
※動画を再生してから読むのがオススメです。
この10年間で、人工知能は大きく成長し、産業やテクノロジーを変える重要な存在となった。
人工知能は私たちの生活や働き方をも変え、人間と同じように行動し、選択できるスマートな機械やシステムの実現に近づいている。
このビデオの最後には、私たちの世界を変えた最も重要な10の人工知能イノベーションを発見できるでしょう。
始めよう。
その1、ディープラーニングです。
人工知能の画期的な進歩のひとつにディープラーニングがある。
これは機械学習の一部であり、人工知能システムに大量の情報を処理し、複雑なパターンを理解する能力を与えています。
IBMのディープ・ブルーは、何日も続いたチェスの6番勝負で世界チャンピオンを破った最初のコンピューターだ。
ディープ・ブルーはゲリー・カスパロフを圧倒し、コンピューターが複雑な計算を扱えることを示した。
ディープ・ブルーは毎秒2億の潜在的な胸の位置を評価する力を持っていた。
2008年、ラスベガスで開催されたポーカー大会で、ポラリスというAIプログラムが2人のチャンピオンに勝利した。
そして2011年、IBMのワトソンはジェパディのチャンピオンであるブラッド・ラッターとケン・ジェニングスを上回り、100万ドルの賞金を獲得した。
2015年、ディープマインドはディープラーニングを使ってアタリのビデオゲームや囲碁をプレイし、ディープラーニングがいかに強力かを示した。
これは多くの人々の注目を集め、それ以来、さらにエキサイティングな発展が続いている。
人工知能システムは、戦闘やゲームプレイなどの状況で人間を超えています。
スタークラフト2』や『Quake 3』、さらには米国防総省がスポンサーとなっている『Alpha dogfight』と呼ばれるジェット戦闘機のシミュレーションまで、人工知能システムは人間を超えてしまったのだ。
ポーカーのような古典的なゲームにも挑戦している。
その2、音声認識です。
人工知能のもう一つの大きな発見は、コンピュータが私たちの言葉を理解できるようになる音声認識です。
何年もの間、大きな改善はあまり見られなかった。
しかし2011年、グーグルがグーグル音声検索を発表し、多くの人がアプリを通じて音声認識を使えるようになった。
その後、アマゾンのアレクサやグーグルホームが登場し、今では人々は機械との会話をより快適に感じるようになった。
近年、機械学習によって話された言葉の理解が大幅に向上しました。
今では、いたるところで音声認識を目にするようになった。
人々が音声コマンドを好んで使うのは、学習やコミュニケーションが難しいと感じる人たちを助けるからだ。
また、物事をより速く進め、企業にとっては経費の節約にもなる。
人工知能は音声コマンドをより良いものにしている。
その3、ディープフェイクです。
ディープフェイクは、2021年の人工知能のブレークスルーのひとつだ。
MyHeritageのようなディープフェイクアプリが革命的なディープフェイクアプリをローンチした。
このソフトウェアは、亡くなった家族の写真をアニメーション化することができる。
ディープフェイクは、ディープラーニングを含む高度な機械学習技術を用いて、人を欺く説得力のある画像や音声を捏造する。
機械学習の手法、特にオートエンコーダや生成的敵対的ネットワークのようなネットワークを通じて、膨大なデータから学習し、本物そっくりのコンテンツを生成することで、ディープフェイクを作り上げる。
ディープフェイクとは、ディープラーニング(深層学習)とフェイク(偽物)を融合させた言葉で、AIによって改変された映像や音声が、実際には起こりえなかった出来事を描写することを指す。
ディープフェイク技術では、人工知能が顔を入れ替えたり声を変えたりして、言ったこともやったこともない出来事を描写する。
その4、医療の人工知能です。
人工知能は医療の革命を起こし、診断、薬剤の発見、個別治療を向上させています。
2012年に発売されたFitbit Oneスマートウォッチは、データを分析して潜在的な健康問題やリスクをユーザーや医療専門家に通知するデバイスを導入した。
機械学習は膨大な医療データを処理して病気を早期に発見し、患者の予後を改善する。
AIを活用した画像処理技術は、アカデミアから商業用途へと発展してきた。
彼らは眼や皮膚の障害、がんを特定し、専門家の診断精度に合致させます。
人工知能を使ったリスクスコアリングが普及している。
予測は医療記録プラットフォームや業務に統合されている。
多少のバイアスはあるものの、これらのシステムは有望である。
人工知能は、手術時間の予測、集中治療室のリスク識別、心電図の読み取りなど、さまざまな健康タスクを支援しています。
医療データを書き起こし、高解像度の画像を作成し、小児科の臨床医を支援する技術もある。
人工知能の現在の存在感は控えめだが、ヘルスケアにおけるその将来は拡大しそうだ。
その5、自然言語処理(NLP)です。自然言語処理は、人工知能の画期的な成果として際立っています。
この技術革新は、人間の言葉を理解し、解釈し、対話する能力を機械に与える。
Siriはバーチャルアシスタント時代の幕開けを告げ、テクノロジーとの関わり方を一変させた。
もともとモバイルアプリとしてニュアンス・コミュニケーションズによって発表されたSiriは、アップルに買収されたことで大きな転機を迎え、最終的には2011年にiPhone 4Sに搭載された。
Siriは、スマートアシスタントが通常のキーボードや画面を極めて自然な音声で置き換えることができることを初めて示した。
Siriは、提案の提供、イベントの手配、回答の提供、デバイス設定の調整、検索の実行など、幅広い機能を提供した。
Siriを際立たせているのは、ユーザーとの継続的な対話を通じて、時間をかけて個人の好みを学習・調整し、対応を洗練させていく能力だ。
このテクノロジーは、私たちの生活のさまざまな側面に革命をもたらした。
以前は、機械と対話するために特定のコマンドやキーワードを使う必要がありましたが、今ではより自然にデバイスに話しかけることができます。
質問したり、命令したり、あるいはただおしゃべりするだけでも、機械は理解してくれるのだ。
その6、画像と物体認識です。
人工知能は、私たちの周りの写真や物体を認識することで大きな進歩を遂げています。
今では物体、顔、シーンを正確に識別することができる。
2015年に開催された第6回ImageNet大規模視覚認識チャレンジでは、マイクロソフトとグーグルのマシンが画像認識で人間を上回った。
彼らは、1000以上のカテゴリーに属する物体や画像を識別するのに役立つディープラーニング・アルゴリズムを使用することで、この偉業を達成した。
これらのアルゴリズムは、人間の脳と同様の働きをする、さまざまなタイプの人工ニューラルネットワークにヒントを得ている。
この大きな進歩により、スマートシステムは物体や人物の認識が不可欠な作業を自動化できるようになった。
そして、その認識に基づいて意思決定を行う。
YOLOのように、写真に写っている重要なものをその場で発見できるシステムもある。
このようなシステムは、リアルタイムで群衆を監視するために使用され、ビデオ監視や自動運転車のようなロボットにとっても重要である。
その7、自動運転車です。
AIによる自動運転車の台頭は、自動車業界を完全に変貌させた。
機械学習とスマートセンサー技術の助けを借りて、自動運転車は私たちの移動方法を変革し、より安全で効率的なものにする可能性を秘めている。
2018年、ウェイモがアリゾナ州フェニックスで自動運転タクシーサービスを導入したことで、自動運転車のアイデアは現実のものとなった。
これらのタクシーは、ウェイモ・ドライバーと呼ばれるAIシステムによって制御された。
このシステムはセンサーからの情報を使って周囲の状況を把握し、シミュレーションで2000万マイル以上の詳細な地図を作成した。
その後、人工知能を使ってこのデータを分析し、目的地までの最も安全なルートを探し出した。
ウェイモのタクシーが特別だったのは、テストに使われただけでなく、実際の人間に使われたことだ。
これらの自動運転車が初めて導入されたとき、約400人が有料で乗車しました。
これは、単なる実験にとどまらず、この種のテクノロジーに対する真の需要があることを示していた。
その8、AIの推薦システムです。
情報が溢れるこの世界では、オンライン体験の優先順位を自動的に決めるレコメンダー・システムが不可欠となっている。
これらのシステム、例えばSpotifyやNetflixは、人工知能に大きく依存しており、ニュース、音楽、ビデオなどの商品、サービス、コンテンツの消費に大きな影響を与えています。
2006年に、Netflixはそのアルゴリズムの精度を向上させるための賞金コンテストを開催しました。
過去5年間で、オンライン活動が急増する中、推薦システムの背後にある人工知能は著しく進化しました。
現在、ユーザーの反応の予測をより良くするために、深いニューラルネットワークが一般的に使用されています。
先進的な機械学習技術も推薦コンテンツを分析し、それがユーザーに適している理由を理解します。
Spotifyはオーディオ解析を利用しており、BERT(双方向エンコーダ表現からのトランスフォーマーとして知られる)言語モデルは、ニュースやソーシャルメディアの推薦を強化します。
その9、ロボアドバイザーです。
2010年に、ジョン・スタインという若き起業家がBettermentという最初のロボアドバイザーを立ち上げました。
その後、より多くのロボアドバイザーが人気を博しました。
ロボアドバイザーはオンラインの金融の助け手です。
彼らは投資を管理するためのお金に関するアドバイスをします。
彼らは特別なコンピュータのルールや式を使用して動作します。
これらのルールは、金融の専門家、投資マネージャー、コンピュータの専門家によって作成されています。
コンピュータソフトウェアはこれらのルールに従って、お金を投資する方法を決定します。
ソフトウェアは人々に助言するための人間を必要としません。
それはこれらのルールを使用して、短期間または長期間のどちらかのために自動的に人々のお金の世話をします。
ロボアドバイザーは、多くの発展とともに近年ますます人気が出てきました。
その10、ニューラルネットワークと大規模な言語モデルです。
ニューラルネットワークは、生成モデリングへの革命的な方法をもたらしました。
彼らは二つのニューラルネットワーク間の競争を設定し、一方をジェネレータと呼び、もう一方をディスクリミネータと呼びました。
この革新的なアプローチは、私たちが画像、ビデオ、アート、その他のコンテンツを作成する方法を完全に変えました。
OpenAIは、その種類の初めてのものとしてのブレイクスルーで世界を驚かせました。
AIの革命は2022年のChatGPTの登場とともに始まりました。OpenAIは前年の11月にGPTをリリースしました。
その能力はみんなを驚かせました。
このAIチャットボットは、ほぼ任意の質問に対して正確で人間のような回答を提供するために、インターネットから大量の情報を収集します。
それはエッセイ、記事、詩を作成したり、テキストを翻訳したり、ゼロからアイデアを考え出すことができます。
医療研究の戦略を概説することや、子供の誕生日パーティーの計画をすること、OpenAIは後にDALL-Eを導入しました。これはテキストの説明から画像を生成する可能性があります。
そしてMidjourney、それはプロンプトと呼ばれる自然言語の説明から画像を生成する生成的な人工知能。
これらはすべて、生成的対抗ネットワークが導入した同じコンセプトによって動力を供給されています。
これは人工知能の世界における創造的な革命です。
ここまで来たら、このビデオからの知識を受け取ったことを確認するために、下のコメント欄に「100」という言葉を入力してください。
さらに興味深いトピックについては、今すぐ画面に表示される推奨ビデオをご覧ください。
ご覧いただきありがとうございます。