見出し画像

AIで無限のチャンスを掴め【海外最新AIニュースまとめ】

毎日たったの5分で世界の最新AIトレンドがわかるまとめニュースをTwitterやnoteで配信しております!
ぜひフォローして毎日のAI情報キャッチアップの一つにお役立てください♪
Twitterアカウント:@AICrossTime(タップしてフォロー)


✍️本日のハイライト【約2分で読み終わります】

AIビジョン技術の台頭

GPT-4V(またはGPTビジョン)がより広く知られるようになるにつれ、検索ボリュームが急上昇しています。GPT-4Vとは、画像やビデオの内容を解釈できるAIです。GPT4-Vision APIを使用するか、ChatGPTに画像をアップロードすることで、画像内の内容を解釈できます。「自転車のこの部品は何?」などの質問が可能ですが、他にも以下のような応用例があります:

  • スクリーンショットからコード生成 - スクリーンショットから、実際のコードに変換。YouTubeやInstagram、Hacker Newsのウェブサイトをクローンすることも可能。

  • Tldraw - 描いたものがアクティブに機能。例えば、電卓の箱を描くだけで、それが実際に機能する電卓になる。

  • Be My Eyes - 視覚障害者がボランティアとFaceTimeのように連絡を取り合い、日常のタスクをサポート。現在はOpenAIが支援。

また、以下のような機会も考えられます:

  • 製品デモのAIボイスオーバーを生成。

  • ポケモンGOを現実世界で実現させるデモのようなもの。

  • オンラインカジノでカードカウントする(推奨されませんが、技術的には可能)。

  • ソーシャルメディアでの週間時間の無駄遣いを分析。

  • 「夢を描く」アプリ。

  • バーチャルタイムトラベル体験。

  • 個人的なスタイリストアシスタント。

  • 自分のウェイトリフティング技術やテニスのスイングを分析。

  • 不動産リストをより高度なバーチャルビュー体験に変換するサービスを設立。

  • 販売用の興味深いレポートやインフォグラフィックを大量に作成。

  • ウェブサイト利用時の困難な箇所や多くの時間を費やしている箇所を解釈するユーザーフィードバックツール。

これらはほんの一例に過ぎず、GPT-4Vを活用した機会は無限に広がっています。

Meta、新たな言語翻訳モデル「Seamless」をリリース

Metaは、話し方をそのまま翻訳する新しい一連の言語翻訳モデル「Seamless」をリリースしました。また、話し終わるまで翻訳を待つ必要がなく、発話とほぼ同時に音声出力が行われます。

「Seamless」な言語翻訳モデルスイートには、以下の4つのモデルが含まれています:

  • SeamlessM4T v2 - 8月にリリースした基盤モデル。

  • SeamlessExpressive - スピーチ・トゥ・スピーチ翻訳で表現を保持するモデル。

  • SeamlessStreaming - 約2秒の遅延で最先端の結果を提供するストリーミング翻訳モデル。

  • Seamless - SeamlessExpressive、SeamlessStreaming、SeamlessM4T v2を統合したモデル。

HuggingFaceでこれらのモデルを試すことができ、非商用利用に限りオープンソースで提供されています。

注目すべき別の点は、基盤モデルを強化するためのアルゴリズムを構築できることです。例えば、SeamlessStreamingには、異なる言語の異なる文の構造を処理するために、いつ聞き続け、いつ翻訳を開始するかを決定するアルゴリズムがあります。

OpenAI、従業員の株式売却プランへの参加期間を1ヶ月延長

OpenAIは、CEOサム・アルトマンが再任されたことを受けて、従業員による株式売却の提案を継続しています。これにより、従業員は860億ドルの評価額で株式を売却することができます。最近の混乱を受けて、株式売却の提案期間は1月5日まで1ヶ月延長されました。

アルトマンが解任された際に一部の投資家が撤退しましたが、現在は取引をカバーするだけの需要があります。この延長は、混乱後に従業員が参加するための時間を与えます。

また、株式売却の提案は、OpenAIが安定し、将来的に上場を目指していることを示しています。この高額な評価は、オープンAIが非常に価値のあるAIリーダーであることを確固たるものにしています。速度の乱れにもかかわらず、投資家の関心は依然として非常に高いことが言えます。

🛠新しいAI関連のツール紹介

  • Project E ink - ハッカーニュースの技術ネタをアートに変換。

  • Like History - HuggingFaceのプロジェクトのいいね!履歴を見る。

  • Founder's Friend - 投資家や従業員には相談できない問題を話し合う。

  • Whisper Zero by Gladia - Whisper ASRを完全に作り直し、幻覚をなくす。

  • aiPDF - 詳細なリファレンスで、PDFから即座に答えを得る。

View more →

👀その他のAIに関する海外ニュース

View more →

※当メディアはBen's Bites(https://www.bensbites.co/)の日本語配信版です。
※当メディアはBen's Bitesから正式な許可を得て配信しております。
※Our media is the Japanese distribution version of Ben's Bites (https://www.bensbites.co/).
※We have obtained official permission from Ben's Bites for distribution.


この記事が気に入ったらサポートをしてみませんか?