人気の記事一覧

名刺読み取りアプリの検証

2か月前

llama-3-vision-alpha : LLaMA-3をVision Modelにする方法

13日前

GPT-4oと従来のGPT-4の性能比較と使い分け

2日前

【速報】ChatGPTの最新バージョンGPT-4oについて簡単にご紹介

「どんな帳票でも読み取れる」時代へ。非定型帳票1,000種類をわずか2ヵ月半で実装したAI-OCRの新次元

GPT-4Vのマルチモーダル機能を利用してオセロゲームを生成させた話

3か月前

MiniGPT4-Videoで動画理解の時代へ

🌈xAIのGrokが「Grok-1.5V」にバージョンアップとイーロン・マスク氏が発表 同社初のマルチモーダルで画像認識ができるようになったようね 他社のAIと比べても優れてるっていう話 その真相はちょっとどうかしら?って思うけど

X線診断の精度向上を実現する自己教師型AIの効果

OpenAIが強力な言語モデル「GPT-4 Turbo with Vision」のAPIを一般公開

1か月前

はじめての特許出願【デジタルアーカイブの取り組み】

Claude3 Visionを使ったStreamlitアプリを50行で実装する

『ChatGPTがついに「見る」「聞く」「話す」を習得。世界中のモノの品質が上がる革命』~【新しいweb3ビジネスのアイディアのタネ】2023.9.27

【丸パクリOK!!】AI×YouTubeでバズる動画を量産する方法!!

麻雀初心者救済アプリ「麻雀サポーター」ご紹介!

4か月前

Chat GPTの画像認識でオフィス診断をしてみた。ゴチャゴチャのオフィスの問題点を指摘!https://youtu.be/kca1cZ6AJ6Q

イーロン・マスク率いるxAI、画像認識機能搭載のマルチモーダルAI「Grok-1.5V」が空間認識能力で他モデルを凌駕!

1か月前

Azureサービスを用いた画像認識の検証

7か月前

Vision Transformer(ViT)の革新性とビジネスへの応用

マシンビジョンエンジニア(マイスターエンジニアリング)・新卒入社若手社員インタビュー Vol.1『カメラ機器のスペシャリスト!マシンビジョンエンジニアの働き方』