Manyong

高専教員&株式会社ゼンリン東海技術顧問

Manyong

高専教員&株式会社ゼンリン東海技術顧問

最近の記事

OpenAI o1+AI Scientist =?

ずっと前から噂されていたQ*やStrawberryがついにその正体を現しました。OpenAIが発表した新しいAIモデル「OpenAI o1」は、特に複雑な問題解決に特化した大型言語モデル(LLM)で、科学、コーディング、数学などの分野での推論能力を大幅に向上させており、従来のモデルであるGPT-4oと比較してもその性能が際立っています。 その特徴と活用方法をまとめると以下の通りです。科学や工学、教育における期待が大きいので、僕自身も積極的に活用していきたいと考えています。

    • フランスの非営利研究ラボ「kyutai」が音声生成AI「moshi」を発表

      フランスの非営利研究ラボ「Kyutai」(日本語の「球体」)が開発した初のリアルタイム音声AI「Moshi」(日本語の「もしもし」から命名)のデモ動画が公開されました。動画は以下のリンクから視聴できます。 https://www.youtube.com/watch?v=hm2IJSKcYvo この動画では、「Kyutai」のCEOであるパトリックが「Moshi」を紹介し、その仕組みと機能について説明しています。「Moshi」は、二人の話者の対話形式で自然なコミュニケーショ

      • ChatGPTなどのLLMサービス系の参考書を買わない理由

        AI技術、特に大規模言語モデル(LLM)の進化は日進月歩です。ChatGPTをはじめとするLLMサービスは、私たちの働き方や生活を大きく変えつつあります。しかし、こうした最先端技術に関する参考書を購入することに躊躇を感じる方も多いのではないでしょうか。私自身が、LLMサービス系の参考書を買わない理由について考えてみました。 1. 技術の陳腐化が早いLLM技術の進化スピードは驚異的です。本が出版される頃には、すでに記載されている情報が古くなっている可能性が高いのです。例えば、

        • モラベックのパラドックスとLLM:AIの進化が示す驚きの逆転現象

          人工知能(AI)の世界には、私たちの直感に反する興味深い現象がたくさんあります。その中でも特に注目すべきものの一つが「モラベックのパラドックス」です。今日は、このパラドックスについて、そして最近の大規模言語モデル(LLM)がこのパラドックスにどのような新たな視点をもたらしているかについてお話しします。 モラベックのパラドックスとは? 1980年代、ロボット工学者のハンス・モラベックは、AIの能力に関する興味深い観察をしました。それは次のようなものです: 人間にとって難し

        OpenAI o1+AI Scientist =?

        • フランスの非営利研究ラボ「kyutai」が音声生成AI「moshi」を発表

        • ChatGPTなどのLLMサービス系の参考書を買わない理由

        • モラベックのパラドックスとLLM:AIの進化が示す驚きの逆転現象

          Dify: 大規模言語モデルを活用したアプリケーション開発の新時代

          近年、人工知能(AI)と機械学習の進展により、さまざまな業界でのAIアプリケーションの開発が加速しています。その中で、特に注目されているのが大規模言語モデル(LLM)の活用です。今回は、LLMを活用したアプリケーション開発のためのオープンソースプラットフォーム「Dify」についてご紹介します。 Difyとは?Difyは、AIアプリケーションを簡単かつ効果的に開発するためのオープンソースプラットフォームです。プログラミングの知識がなくても、直感的なビジュアルキャンバスを使って

          Dify: 大規模言語モデルを活用したアプリケーション開発の新時代

          5回目のDCON本選出場

          本日から二日間で開催されるDCON2024のために渋谷に来ております。昨年度までは大手町の日経ホールが会場でしたが、今年は渋谷のヒカリエホールに変わりました。 今年は、沼津高専コンテスト同好会のメンバーで構成されている、チーム「データドリブンウェア」が「倉庫ナビ」という作品で本選に出場します。 本日から二日間にわたり開催されるDCON2024のため、渋谷に来ております。これまでは大手町の日経ホールが会場でしたが、今年は渋谷のヒカリエホールへと変更されました。 今年は5回

          5回目のDCON本選出場

          "未来への転換:日本におけるオントロジーベース文化への道"

          日本のビジネス文化では、長年にわたって詳細なマニュアルが重宝されてきました。これは、正確で一貫性のある作業を保証する一方で、創造性や柔軟な対応を阻害するという側面もあります。現代のダイナミックな市場環境においては、柔軟で適応性の高いアプローチが求められています。この文脈で、オントロジーベースのアプローチが注目されています。オントロジーは、特定のドメイン内の概念や概念間の関係を定義するためのフレームワークです。ここでは、日本がオントロジーベースの文化を築くための具体的な方策を考

          "未来への転換:日本におけるオントロジーベース文化への道"

          Devinに続いてWorkspaceが登場した!もうすぐノーコード時代に突入

          GitHub Copilot WorkSpacesは、開発者がプロジェクトの計画から実装までをスムーズに進めることを支援するためのAI駆動の環境です。このツールは、GitHubが提供する既存のCopilot技術を基に、さらに拡張されています。特に、開発者が問題を特定し、それに基づいて計画を立て、コード化する過程をサポートするために、自然言語処理を用いています​​。3月に発表されたDevinそっくりのプラットフォームです。 Copilot WorkSpacesの主要な特徴には

          Devinに続いてWorkspaceが登場した!もうすぐノーコード時代に突入

          イーロン・マスクの思考法を学ぶ:革新的アイディアと夢の実現

          イーロン・マスクの思考法を理解することは、革新的なアイディアを生み出し、夢を実現させるための貴重なヒントになります。彼のアプローチは、特に科学技術に興味を持つ若い世代にとって、大きなインスピレーションを与えるでしょう。以下では、マスクの思考法と彼のキャリアからのエピソードを通じて、その核心に迫ります。 第一原理思考(First Principles Thinking) イーロン・マスクは問題解決のアプローチとして「第一原理思考」を重視しています。これは、既存の知識や常識に

          イーロン・マスクの思考法を学ぶ:革新的アイディアと夢の実現

          RAG導入のメリットと課題

          Retrieval Augmented Generation (RAG) は、機械学習と特に大規模言語モデル(LLM)を活用する技術であり、外部の情報源からデータを取得して回答の精度と信頼性を高めることを目的としています。この技術は、特定の問題に適用される事前学習されたモデル(dense retrieval)とシーケンス・ツー・シーケンスモデル(seq2seq)の組み合わせから成り立っています。RAGは、関連する文書を検索し、それらをseq2seqモデルに渡して出力を生成しま

          RAG導入のメリットと課題

          MicrosoftがPhi-3を発表。On-Device AIの実現へ

          米Microsoftは23日(現地時間)、小規模言語モデル(SLM, Small Language Model)「Phi-3」を発表した。23日時点ではPhi-3ファミリーとして複数あるモデルのうち最も小規模な「Phi-3-mini」がHugging Face、Ollama、NVIDIA NIMで利用可能になった。 ・Phi-3-miniは人々の日常的なコミュニケーション方法をベースとし、さまざまな指示に従うよう訓練されたオープンモデルである。 ・3.3兆個のトークンで訓

          MicrosoftがPhi-3を発表。On-Device AIの実現へ

          スタンフォードAIインデックス年次報告の概要と考察

          スタンフォード大学が発表した最新のAIインデックス年次報告を基に、ChatGPTを使って要点をまとめてみました。この報告書は、AI技術の進展とその社会的影響に関する重要な洞察を提供しています。 AIの影響の拡大と公的な注目 2022年は、AI技術がさらに進化し、日常生活に欠かせない存在となった年でした。AIシステムは次々と既存の性能ベンチマークを達成または超え、新たな、より挑戦的なテストの必要性が高まっています。例えば、画像認識のImageNetや質問応答のSQuADのよ

          スタンフォードAIインデックス年次報告の概要と考察