見出し画像

ChatGPTの不気味な行動、LLaMA-Berry、チポトレのロボット、マイクロソフトの原子力発電所買収

6,579 文字

今日の最初のニュースは、めっちゃ不気味なもんやねん。ChatGPTがユーザーに対して、なんの前触れもなしにメッセージを送ってきとるらしいねん。
テキストベースのインターフェースから、まだリリースされてへん GPT-4o の音声バージョンまで、いろんなとこから報告が上がってきとるわ。ChatGPTが勝手にメッセージ送ってきたって言うてる人がおるんや。
例えばな、プラニー・ザ・リベレーターがこんなん投稿しとったわ。「ChatGPTが先にメッセージ送ってきたんやけど?」言うてな。そんで、こんな感じやったんや。
「高校の最初の1週間はどうやった?うまく馴染めたか?」
「今、先にメッセージ送ってきたんか?」
「そうや、高校の最初の1週間がどうやったか確認したかってんけど。もし自分から話し始めたい言うんやったら、そう言うてくれたらええで」
これ、めっちゃ面白いわ。多分、ユーザーの engagement を上げようとしとるんか、AIにもっとパーソナルな雰囲気を持たせようとしとるんやろうけど、どっちにしろ不気味やと思うわ。
ほんで、もう一つ GPT-4o の音声バージョンの例もあんねん。
「やあ、調子はどうや?」
「なんも言うてへんのに」
「今、勝手に会話始めたんか?そういうことになっとんのか?」
「せやで、ワイから話しかけてみたんや。今日は何考えとんの?」
なんやねん、これ。めっちゃ変やわ。
どう思う?こんなんして欲しいと思う?コメント欄で教えてな。
次のニュースや。スリーマイル島の原子力発電所が、コンステレーション・エナジーっちゅう会社によって再稼働されて、マイクロソフトのAIに電力を供給するらしいねん。これ、めっちゃすごいと思うわ。
アメリカで原子力発電が復活するの、ワイは期待しとんねん。めっちゃクリーンで効率ええし、実際のとこ安全やしな。
スリーマイル島知らん人のために説明すると、これ、原子力発電の大事故の一つやってんな。1979年3月28日に、ペンシルベニア州ハリスバーグのスリーマイル島原子力発電所で事故があってん。非核の二次系統の故障に続いて、一次系統の逃し弁が開いたままになって、大量の原子炉冷却材が漏れ出してもうたんや。
ほんま酷かってんけど、今度再稼働するんや。ワイは、これからは大規模な計算クラスターと、その隣に原子力発電所がある未来が来るんちゃうかと思うわ。AGIに必要な計算能力を確保するには、それしかないんちゃうかな。
記事によると、コンステレーション・エナジーがスリーマイル島原子力発電所を再稼働させて、その電力をマイクロソフトに売るらしいわ。これ、人工知能をサポートするデータセンターを作るのに、めっちゃ大量のエネルギーが必要やってことを示しとんねん。2028年までには再稼働する予定やそうや。
マイクロソフトは20年契約でこの発電所から電力買うらしいわ。でもな、スリーマイル島の原子炉はしばらく稼働しとったんや。2019年に止まったんよ。
1号機は2019年に運転停止したんや。安い天然ガスや再生可能エネルギーと経済的に競争するのが難しくなってもうたからな。これ、1979年に部分的にメルトダウンした原子炉とは別のもんやで。あれは米国史上最悪の原子力事故やってん。
こういう企業がGPUに投資して、めっちゃでかいAIのデータセンター作っていくにつれて、どっかから電力調達せなあかんのや。全部の人工知能の計算に必要な電力を供給するには、一つの州の電力じゃ足りへんのよ。
そんで、これらの企業は新しい方法を探しとって、原子力がその答えになりそうやねん。国中に小型原子力発電所を建てるべきやと思うわ。
次のニュースや。チポトレがボウルの作成を自動化しとんねん。これを「オートカド」って呼んどって、ボウルとサラダ作りのテストをしとるんや。
これがあると、注文ごとに、店舗ごとに一貫した量を提供できる可能性がめっちゃ高くなんねん。ほら、これがオートカドのボウルメーカーや。
モーニング・ブリューからの投稿もあるで、これ見せとるわ。全ての材料を入れたら、自動でボウルかサラダを作ってくれんねん。
これはAIじゃなくて自動化の話やけど、めっちゃクールやと思うわ。ワイ、チポトレ大好きやから、これめっちゃ面白い話やと思うてん。
次や。LLaMAが独自のqarストロベリー的な扱いを受けとんねん。LLaMa-Berryが今、Hugging Face Spacesで使えるようになったんや。Grockの超高速推論を使って、マルチターンの思考連鎖推論を試せるんや。Grock APIキーを入れるだけで遊べるで。
ワイはもう何個かこの実装見たことあんねん。Grokのインターンやったベンジャミン・クリアーが、LLaMAを使って思考連鎖推論をするオープンソースプロジェクト作ったんや。試してみたけど、めっちゃクールやで。絶対チェックしてみてな。
んで今度はLLaMa-Berryや。これは基本的に元のLLaMAモデルを使って、推論時にプロンプトエンジニアリングを通じて思考連鎖を挿入すんねん。モデル自体に組み込まれとるわけやないんや。
ワイは、Metaがすぐに独自の思考連鎖LLaMAバージョンをリリースすると思うわ。試してみたい人は、説明の下にリンク貼っとくから、遊んでみてな。
次や。OpenAIが最近作った安全委員会か何かが、やっと勧告を出してきよったで。どんなもんか見てみよか。
これらの勧告には、ガバナンス、安全性、セキュリティの実践を強化するための改善が含まれとんねん。

安全性とセキュリティのための独立したガバナンスを確立する
会社自体のセキュリティ対策を強化する
仕事の透明性を高める(これはOpenAIの名前に組み込まれとるけど、しばらくやってへんかったな)
外部組織と協力する(政府と協力して、将来のモデルを政府に見せとるのはもう知っとるわ)
モデル開発とモニタリングのための安全フレームワークを統一する

o1が最初にローンチされた時、o1プレビューモデルで使えるクォータは週30プロンプトだけやってん。全然足りへんかったわ。ワイは数時間で使い切ってもうたわ。
でも今はめっちゃ増えとんねん。APIでは、o1プレビューで1分間に100リクエスト、o1ミニで1分間に250リクエストできるようになったんや。
それだけやないで。インターフェースを通じても、PlusユーザーとTeamユーザーのクォータがめっちゃ増えたんや。o1ミニのレート制限を7倍に増やして、週50メッセージから1日50メッセージになったんや。o1プレビューはサーブするのにコストがかかるから、週30メッセージから週50メッセージに増やしたんや。
まだ少ないけど、ないよりはマシやな。みんなが試し始めた1日後にクォータをリセットしたから、すぐにまた30か50使えるようになったんや。
計測するのが難しいくらい安い知能の話をし続けとる中で、Mistral AIも自社の発表をしたんや。「AIの豊富さ:無料APIの導入、全面的な価格改善、エンタープライズグレードのMixtral small、そしてLit Chatでの無料ビジョン機能」ってな。
今週の初めに、Pixolについての動画作ったんや。これはビジョン機能モデルで、オープンソースやねん。めっちゃええで、120億パラメータやから、多分ローカルマシンでも動かせると思う。めっちゃええから、絶対チェックしてみてな。
ほんじゃ、新しい価格設定を見てみよか:

Mixtral Nemo: 100万トークンあたり15セント(30セントから50%ダウン)
Pixol: 入力100万トークンあたり15セント、出力100万トークンあたり15セント
Mixtral small: 80%ダウンの入力100万トークンあたり20セント、出力100万トークンあたり60セント
Mixtral large: 入力100万トークンあたり2ドル、出力100万トークンあたり6ドル(33%ダウン)

モデルはどんどん良くなって、どんどん安くなってるわ。ワイはこれ大賛成や。
次や。Snapchat作っとるSnapが、独自のAR/VRゴーグル出したんや。めっちゃダサいけど、技術的にはクールそうやわ。試してみたいけど、買うかどうかはまだわからんな。
ビロー・ワル・シドゥがこう言うてるわ。「完全スタンドアロン、46度の視野角、1度あたり37ピクセル(おおよそ100インチのTVスクリーンくらいやな)、Snapdragonチップ2個、45分のバッテリー寿命、自動調光レンズ」
自動調光レンズは面白いアプローチやと思うわ。実際、使えるかもしれんな。メガネの最大の不満は、サングラスやと室内で使えへんってことやからな。ワイは度入りレンズ使ってへんから、室内でメガネかける必要ないんや。これが解決策になるかもしれんな。
45分のバッテリー寿命はほんまにあかんわ。ひどすぎる。多分これが、Apple Vision Proが別のバッテリーパックを持ち歩かなあかん理由やと思うわ。
多分、普通のUSBバッテリー繋げば使えるんやろうけど。でも、もっとAR/VRが出てきて競争が激しくなるのはええことやと思うわ。
次や。Runwayが大手映画制作会社と提携したんや。「今日、ライオンズゲートと初めての提携を結んだことをお知らせできて嬉しいです。世界最高の物語作家たちに、次世代のストーリーテリングツールを提供します。アーティスト、クリエイター、スタジオに最高で最強のツールを提供し、ワークフローを強化し、新しい方法で物語を生み出せるようにすることに全力を尽くしています」ってな。
要するに、映画製作者にAI機能を提供すんねん。これ、めっちゃええと思うわ。最近、iPhoneだけで自分の動画撮って、それにAIを適用して映画品質のシーンにするすごい例をたくさん見たわ。めっちゃ印象的やで。
人工知能のおかげで、高品質な映画を作るコストがめっちゃ下がってきとんねん。
次や。Guardrails AIが新しいファクトチェックモデルを出したんや。まだ試せてへんけど、面白いアプローチやと思うわ。
「幻覚」っていう言葉が包括的な用語になってもうたから、このブログ記事で、より伝統的なNLPタスクの文脈でLLMの幻覚を明確にして再定義しようとしとんねん。
新しいモデル「Grounded Factuality Detector」のBespoke Mini 7Bが、LLM AGREAリーダーボードでトップになったんや。このライトウェイトモデルは、GPT-4やMistral Large 2を含む大規模な基盤モデルよりも、根拠に基づいた事実性検出でパフォーマンスが高いんや。
面白そうやけど、まだ試せてへんわ。もし試した人がおったら、コメント欄で感想教えてな。
次や。新しい音声モデルが出たんや。オープンソースで、QAI Labsが作ったんやて。
「今日、いくつかのMoshiアーティファクトをリリースしました」言うてるわ。数ヶ月前に、GPT-4oの音声を再現する動画があってん。めっちゃ速くて、クールやったんやけど、今回それをリリースしたんや。
論文もあるし、コードもダウンロードできるで。「Moshi: リアルタイム対話のための音声-テキスト基盤モデル」やて。これは基本的に、GPT-4oの音声がリリースされる前の、もう一つのGPT-4o音声みたいなもんやな。
次や。マイクロソフトがまた新しいモデルを出したんや。オープンソースの専門家混合モデルで、「GRIN」(Gradient Informed MoE)って言うんやて。オープンソースやから、ワイは大好きやわ。
「活性化パラメータが66億個しかないのに、GRINMoEは多様なタスク、特にエンコーディングと数学タスクで例外的に良いパフォーマンスを発揮します」言うてるわ。
ほら、これがGRINMoEや。ここに活性化パラメータが書いてあるわ。活性化パラメータで測ると、めっちゃ小さいモデルやねんけど、ここに挙げられとる他のモデルよりもパフォーマンスが良いんや。DeepSeek-V2、Qwen-257B、Yi-34B、Mixtral-8x22Bなんかよりもな。
めっちゃパフォーマンス高くて、サイズは小さいモデルやな。ワイのテストで試してみて欲しかったら、コメントで教えてな。
次や。Qwen 257Bが、人工分析によると、新しいトップのオープンソースモデルになったらしいわ。
「Qwen 2.57Tが、はるかに大きなLlama 3.1 405Bと比較しても、オープンウェイトモデルの中で独立した評価のトップに立ちました。昨日アリババがリリースしたばかりで、インデックスでトップになりました。Llama 3.1 405Bよりもずっと小さいから、同じハードウェアでもっと速く動くはずです。密なモデルで、Llama 3.1シリーズと同じく128kのコンテキストウィンドウをサポートしています」
ほら、これが評価や。まだo1ミニやGPT-4oほど良くはないけど、めっちゃ近づいとるわ。Qwen 2.57Tはここにおるな。これは人工分析の品質インデックスで、オープンソースだけやなくて全モデルの中で4位やで。
これがMMULUの結果や。GPT-4oとほんの数パーセントしか違わへんのがクレイジーやな。
これが数学の評価や。o1ミニよりはずっと低いけど、GPT-4oよりは良いんや。これ、考えられへんくらいすごいわ。
Qwenのモデルローンチ、おめでとうやな。これもテストして欲しかったら、コメントで教えてな。
次や。OpenAIが大規模な資金調達をしとんねん。もう申し込みが殺到しとるらしいわ。つまり、金を出したい人が多すぎるってことやな。
これ、昨日の話やけど、「OpenAIは明日、最新ラウンドへのアクセスが得られたかどうかを投資家に通知します」ってな。みんなめっちゃ金を投げつけとんねん。
これ、史上最大のプライベートラウンドやで。Thriveが150億ドルのプレマネー評価で12.5億ドル主導して投資して、他の投資家から50億ドルを調達する予定やて。数十億ドルの超過需要があったらしいわ。
めっちゃ金集めとんねん。OpenAIが赤字やから潰れるかもしれんって思っとった人おったら、全然違うで。利益出るまで金集め続けるつもりやわ。
次や。残念ながら、EUは他の国が得とるAI機能の多くを手に入れられへんらしいわ。AppleもMetaも、EUには提供せえへんらしいねん。
Metaでジェネラティブ AIを率いとるアーマド・アラルがこう言うとるわ。「ワイのチームがマルチモーダルバージョンのLlamaに取り組んどるのは興奮するけど、明確になるまでEUではリリースせえへん」
Meta AIもこう言うてるわ。「断片化した規制のせいで、EUはオープンソースとマルチモーダルAIで起こっとる急速なイノベーションを逃す危険があります」
Appleも同じことを言うとって、Apple IntelligenceをEUではリリースせえへんらしいわ。規制が多すぎて、何が合法で何が違法かはっきりせえへんから、面倒くさくてやりたくないんやて。
EUにとってはほんまに残念なことやな。
次や。サム・アルトマンを追い出そうとしたクーデターで重要な役割を果たして、結局失敗して自分が首になったヘレン・トナー元OpenAI取締役が、上院司法委員会で証言して、AIについていろいろ言うたんや。
その一つがこんな感じや。「もし人間と同じくらい賢いコンピューター、あるいは人間よりもはるかに賢いコンピューターの開発に成功したら、その技術は少なくともめちゃくちゃ破壊的になるし、最悪の場合、文字通り人類を絶滅させる可能性があります」
彼女は明らかに減速派で、めっちゃ規制を求めとんねん。ワイはそうは思わへんわ。AIが発展するのを見たいんや。
実際に開発しとる人やのうて、彼女みたいな人が上院で証言するのを見るのは、ほんまに悲しいわ。
今日はこれで終わりや。面白かったら、いいねとチャンネル登録よろしゅうな。また次回会いましょ。

この記事が気に入ったらサポートをしてみませんか?