yutohub

2 フォロー 7 フォロワー

Self-Instructで商用利用可能な日本語インストラクションデータを作成する

Self-InstructについてSelf-Instructは、175個の人間が書いたインストラクションから新しいインストラクションを生成できます。 Stanford Alpacaの実装では、175個の人間…

yutohub

2か月前

Megatron-DeepSpeedからHFのTransformersにチェックポイントを変換する

こちらのプロジェクトでMegatron-DeepSpeedからHFのTransformersにチェックポイントを変換する必要があったので Megatron-DeepSpeedは、NVIDIAのMegatron-LMをもとにした…

yutohub

2か月前

Mistral AIの3つオープンソースモデルの日本語性能を確認してみる

はじめにWikipediaによると、Mistral AIはAI製品を販売するフランスの企業で、2023年4月にMeta PlatformsとGoogle DeepMindの元従業員によって設立されたそうです。2023年1…

yutohub

2か月前

GPTからChatGPTへ：OpenAIの言語モデルの進化の歴史

GPT2018年、OpenAI は「Improving Language Understanding by Generative Pre-Training（GPTによって言語理解を向上させる）」というタイトルの論文を発表しました。既存…

yutohub

2か月前

合成データを利用したLLMの開発

大規模言語モデル（LLM）の開発において、高品質で多様なデータセットの重要性は計り知れません。しかし、インターネットから収集されたデータには多くの問題が伴います。…

yutohub

2か月前

Meta Quest 3のソフトウェアアップデートv64によるパススルー機能の改善

今回のアップデートでは、以下のような変更点がありました。今回はMeta Quest 3を使っていて感じたことを書きたいと思います。パススルーの改善外部マイクのサポート …

yutohub

2か月前

Meta Llama 3の紹介

2024年4月19日にMetaは、8Bおよび70Bの事前訓練済みおよびインストラクションチューニングされた大規模言語モデル（LLM）のMeta Llama 3を開発し、リリースしました。性…

yutohub

2か月前

llm-jp-evalの中身を見てみる

llm-jp-evalが対応している8つのカテゴリ自然言語推論（Natural Language Inference, NLI） - Jamp, JaNLI, JNLI, JSeM, JSICK 質問応答（Question Answering, QA） - J…

yutohub

2か月前

Japanese MT-Benchの中身を見てみる

はじめにJapanese MT-Benchには以下の8つのカテゴリーがあります。それぞれのカテゴリーにどんな質問が含まれているのか分析してみたいと思います。 coding: コーディング…

yutohub

2か月前

Pythonとngrokを使ってSlack Botを作ってみる

はじめにSlackは、チームコミュニケーションとコラボレーションを目的としたビジネス向けのメッセージングアプリです。さまざまなアプリやボットを追加することで、ユーザ…

yutohub

2か月前

最適なLLMを見つけるためのガイド

背景近年、人間の指示に従う能力や会話能力を高めるために、教師ありファインチューニング（SFT: Supervised Fine-Tuning）や人間のフィードバックを用いた強化学習（RLHF …

yutohub

2か月前

英語のポットキャストを日本語に吹き替えてみる

YouTubeの英語動画を見る際、日本語字幕を利用することができますが、ポッドキャストのように目を離しても楽しめるメリットを字幕では得られません。そこで、AI技術を使っ…

yutohub

2か月前

yutohub

2024年4月25日 23:39

Self-Instructで商用利用可能な日本語インストラクションデータを作成する

Self-InstructについてSelf-Instructは、175個の人間が書いたインストラクションから新しいインストラクションを生成できます。

Stanford Alpacaの実装では、175個の人間が書いたインストラクションから3つをサンプルして、GPT-3に新しいインストラクションを20個生成させています。生成されたインストラクションをROUGEスコアを用いて既存のインストラクションと

もっとみる

yutohub

2024年4月24日 22:03

Megatron-DeepSpeedからHFのTransformersにチェックポイントを変換する

こちらのプロジェクトでMegatron-DeepSpeedからHFのTransformersにチェックポイントを変換する必要があったので

Megatron-DeepSpeedは、NVIDIAのMegatron-LMをもとにした拡張版で、DeepSpeedライブラリを使用しています。

Megatron-DeepSpeedには、DeepSpeedからMegatron-LMやHugging Face

もっとみる

yutohub

2024年4月23日 06:42