Aiニュース:Claude 3.5 Haikuがオンラインになりました:最速、Metaの元ハードウェアディレクター、Gradient Boostingなど
テンセントのHunyuan3Dモデルリリース
簡単なスケッチや簡単な写真を完全な 3D オブジェクトに変換することを考えたことはありますか? Tencent は、わずか 10 秒でテキストや画像を 3D アセットに変換できるオープンソースツール、Hunyuan3D-1.0 をリリースしました。その通りです! 説明を入力するだけで、このモデルはオブジェクトの 6 つの異なるビューを瞬時に作成し、完全な 360 度の外観を提供します。あっという間にリアルな 3D オブジェクトを作成できると想像してみてください! Hunyuan3D は無料で使用でき、重要なモデルのウェイトとコードがすべて付属しています。
2024 科学とインテリジェンスサミットの洞察
AI が科学の進歩を加速させたらどうなるでしょうか。これが、北京の海淀区で開催された 2024 科学インテリジェンス サミットの大きなアイデアです。専門家たちは、より優れた材料を見つけ、開発サイクルを加速させることで、物理学、化学、生命科学などの分野の研究を AI がどのように変えることができるかについて議論しました。たとえば、AI は新しい触媒の発見を加速させ、科学者が記録的な速さで炭素材料をカスタマイズするのに役立ちます。海淀区では、コンピューティング パワーに最大 1,000 万元の助成金を提供するなど、AI 企業を支援する政策も推進しています。彼らの目標は、2026 年までにこの地区を AI の世界的なホットスポットにし、この分野のトップ レベルの人材と大手企業を引き付けることです。
新しい画像ツール: ControlNet の開発者による IC-Light V2
品質を落とさずに写真の照明を調整したいと思ったことはありませんか? Zhang Lyumin が開発したツール、IC-Light V2 をご紹介します。ネオンシティの雰囲気や繊細で芸術的な照明など、画像の照明に魔法をかけるようなものです。以前のツールと比較すると、IC-Light V2 はさまざまなスタイルに合わせて照明を調整しながら、細部を鮮明に保ちます。写真に自然でプロフェッショナルな照明効果を加えたい場合に最適です。そして、これが一番良いところです。HuggingFace プラットフォームで無料で試すことができます。ただし、現時点では個人使用のみであることを覚えておいてください。
CMU の AI モデル向け自動プロンプト最適化
AI に自分が望むものを正確に作成させるために、適切な言葉を探すのに苦労したことはありませんか? カーネギーメロン大学は、それを簡単にする新しい方法を思いつきました。プロンプトを手動で何度も微調整する代わりに、システムが自動的に調整します。ChatGPT や DALL-E などのモデルを使用すると、このシステムが最適な言葉を見つけて、より良い結果を得ることができます。画像認識やテキストから画像へのタスクのいずれに取り組んでいる場合でも、「ブラックボックス最適化」と呼ばれるこの手法が、舞台裏ですべての大変な作業を実行します。技術的なスキルは必要ありません。誰でも使用できるように設計されています。また、複数のタスクでモデルの精度が向上することがすでに実証されています。
ケイトリン・カリノフスキーがロボティクスとコンシューマーハードウェアの分野で OpenAI に参加
AI を物理世界に簡単に持ち込むことを想像してみてください。Meta の AR チームでハードウェア プロジェクトを率いた Caitlin Kalinowski 氏が OpenAI に入社し、同社のロボット工学および消費者向けハードウェア部門を率いています。Kalinowski 氏の職務には、スマートフォンと同じくらい直感的で、さらに日常生活に溶け込んだ新しい AI ハードウェア製品の開発が含まれます。この変化は、OpenAI が AI を誰にとっても身近なものにするハードウェアの開発を目指していることを示唆しており、元 Apple デザイナーの Jony Ive 氏との提携も検討されている可能性があります。このチームにより、OpenAI は私たちが現実世界で AI と関わる方法を変え、AI をソフトウェアというよりは役に立つアシスタントのように感じられるようにできるかもしれません。
新しい xAI API を無料でお試しください!
よりスマートなチャットやクールな機能が必要ですか? xAI APIは、128k トークンという十分なスペースを備えており、大きなタスクを簡単に処理できます。さらに、年末まで毎月 25 ドル分の無料クレジットが付与されます。OpenAI および Anthropic SDK と連携するため、お好みに合わせて設定できます。
Claude 3.5 Haiku のご紹介 – 高速、スマート、そしてお手頃価格
Anthropic の新しい Claude 3.5 Haiku モデルが、Amazon Bedrock と Google Cloud の Vertex AIで公開されました。より高速で安価であり、予算内で信頼性の高い AI を必要とする人にとって理想的です。
新しいHumeアプリでパーソナルAIアシスタントを手に入れよう
Hume アプリのアップデートにより、EVI 2 の音声と個性が Claude 3.5 Haiku とともに実現します。人間味のあるスマートなヘルパーとなり、音声チャットやカスタマー サポートに最適です。
研究者向けの新しいAIケース分析ツールをご紹介します
調査の支援が必要ですか? このツールは、Claude 3.5 Sonnet を使用して URL からケース スタディをスキャンし、エンタープライズ レベルの洞察を提供します。要約、戦略のアイデア、傾向を構築し、調査を容易にします
OuteTTS-0.1-350M – LLaMa Tech で音声を瞬時に複製
LLaMa のフレームワーク上に構築された OuteTTS-0.1-350M は、最小限のデータで音声を複製するために WavTokenizer を使用します。個人のデバイスに収まるほど小さいため、どこでも音声出力が可能です。
BLENDERGPT – 数秒でテキストから 3D モデルを作成
BLENDERGPTを使用すると、3Dアーティストはリクエストを入力して約20秒でモデルを取得できます。アニメーションやゲームに最適で、高品質のアセットをすばやく作成し、時間を大幅に節約します。
ディープラーニングの洞察: 新しいモデルの驚くべき発見
この記事では、単純なモデルを使用して異常な動作を示すディープラーニングの新しいアイデアについて説明します。研究者は 3 つの領域でモデルをテストし、二重降下曲線、グロッキング (モデルが突然驚くべき方法で学習すること)、テーブル データにディープラーニングを使用する際の問題などについて新しい洞察を得ました。このモデルはパターンを見つけるのに役立ち、ディープラーニングが驚くべき方法で機能する可能性があることを示します。また、勾配ブースティングなどの方法との予期しないつながりを明らかにし、モデルのパフォーマンスを向上させる新しい方法を示唆しています。
https://arxiv.org/pdf/2411.00247
ケンタウロスモデル: 人間の行動を予測する新しい方法
この記事では、さまざまな状況で人間の行動を予測するモデル「Centaur」を紹介します。60,000 人による 1,000 万件以上の意思決定のデータセットでトレーニングされた Centaur は、人間の選択を模倣し、トレーニングに含まれていない人の行動を予測することさえできます。多くの状況でうまく機能し、脳活動のいくつかのパターンと一致します。Centaur は、人間の思考を理解するための科学に基づいた方法を提供し、行動の研究方法を変える可能性があります。
スクリーンショットからコードへ: 画像を機能的なコードに変換する
このツールは、 AI を使用して、スクリーンショット、デザイン、または Figma プロジェクトをクリーンな実用的なコードに変換します。Tailwind を使用した HTML や Tailwind を使用した React など、さまざまなフロントエンド設定を作成できます。ユーザーは、ビデオや画面録画を実用的なプロトタイプに変換することもできます。Claude Sonnet 3.5 および GPT-4o モデルと連携するため、デザイナーや開発者が視覚的なアイデアをコードとして実現するのに最適なツールです。
AnythingLLM: ドキュメントをチャットのコンテキストとして
AnythingLLM は、チャット中にあらゆるドキュメント、ファイル、コンテンツを大規模な言語モデルの貴重なリファレンスに変えます。カスタム AI エージェントを作成したり、マルチモーダル機能を使用したり、Docker を使用して複数のユーザーをサポートしたりできます。PDF、TXT、DOCX などのファイル タイプと互換性があり、アプリのドラッグ アンド ドロップ インターフェイスと明確な参照により、AI との会話中に関連情報を簡単に取得できます。
Spot AI: リアルワールドビデオ AI エージェントと新たな資金調達ラウンド
Spot AI は、物理的な空間にデジタル監視をもたらすスマート ビデオ AI エージェントをリリースしました。この AI ツールは、安全上の問題などのインシデントを迅速かつ正確に検出し、製造、学校、小売業の企業が業務をよりスムーズかつ安全に行えるよう支援します。
この技術革新に加えて、Spot AI は 3,100 万ドルの資金を調達し、合計 9,300 万ドルを調達しました。このラウンドは Qualcomm Ventures などの大手投資家が主導しました。これらの資金は、Spot AI が事業を拡大し、この技術をより多くの業界に導入するのに役立つでしょう。
Yuequan Bionics: 大きな支援を受けたヒューマノイドロボット
最先端のヒューマノイドロボットで知られる Yuequan Bionics 社は、資金調達ラウンドを完了し、約 1 億元を調達しました。この支援により、同社は研究を促進し、チームを拡大し、ロボットを現実世界のタスクに適用できるようになります。
同社はすでにエネルギー業界の大手パートナーと協力し、洋上風力発電所のような厳しい現場でロボットを活用している。同社は現在、自動車や航空宇宙などの分野にもロボットを導入することを検討している。
Coatue Management の 10 億ドルの AI 投資ファンド
大手テクノロジーヘッジファンドの Coatue Management は、AI に特化した 10 億ドル規模のファンドを設立しています。このファンドは、大手機関や富裕層からの寄付により、AI イノベーションの次の波を推進することを目指しています。
同社はすでに、Glean、Scale AI、Skild AI などの企業、特に AI 駆動型ロボットに注力する企業に投資しています。このファンドにより、同社はさらに画期的な AI プロジェクトを支援し、急成長する AI テクノロジーの世界を活性化させる予定です。
DistilQwen2: より高速でスリム化された AI モデル
大規模な AI モデルを実行するのは、そのサイズが大きいため難しい場合があります。DistilQwen2 は、人気の Qwen2 モデルの小型バージョンというソリューションを提供します。知識蒸留と呼ばれる手法を使用して、大規模なモデルの知識を、より高速で必要なリソースが少ないコンパクトなバージョンに凝縮します。
このモデルは命令を正確に処理できるため、携帯電話などのリソースが限られたデバイスに最適です。開発者は、HuggingFace などのプラットフォームでこのモデルを見つけて、自分のアプリに統合できます。
スマートエージェントを構築するための適切なフレームワークの選択
スマート エージェントのフレームワークを選択する際には、すべてプロジェクトのニーズによって決まります。ここでは、いくつかの主要な選択肢を簡単に説明します。
フレームワークフリー: シンプルで直接的ですが、プロジェクトが拡大するにつれて管理が難しくなる可能性があります
LlamaIndex ワークフロー: 柔軟でイベントベースですが、非同期機能により複雑さが増す可能性があります。
選択する前に、プロジェクトの詳細、チームの専門知識、およびガイドとなる類似プロジェクトの例を考慮してください。
Baichuan Intelligence の AI モデル高速化のヒント
AIモデルの速度を向上させるために、Baichuan Intelligence はいくつかの最適化のコツを共有しています。
量子化: モデルのサイズを縮小して、限られたハードウェアでのパフォーマンスを向上します。
最初のトークンごとの最適化: 開始応答と進行中の応答の両方を高速化します。
通信の最適化: 一部の GPU でよりスムーズに使用できるように待機時間を短縮します。
これらの方法により、AI モデルはさまざまなデバイスでより高速に動作し、リアルタイムでの使用に最適です。
グラフ + AI ホワイトペーパー: データ分析への新しいアプローチ
「グラフ + AI」という新しいホワイトペーパーでは、グラフ コンピューティングと AI を組み合わせて使用することで、データ分析における大きな問題を解決する方法が示されています。この組み合わせたアプローチは、金融、電子商取引、研究などの分野でセキュリティの向上、より適切な意思決定、有用な知識の創出に役立っています。
この論文では、グラフ データ処理、ナレッジ グラフ、AI を活用した意思決定などの重要な技術について説明しています。研究者や業界の専門家にとって役立つ洞察を提供します。