Masatoshi Kurihara

Masatoshi Kurihara

マガジン

  • ZENKIGEN Data Science Team

    • 18本

    株式会社ZENKIGENで働くデータサイエンスチームが、最新の生成AI事情や日々取り組んでいるテーマについて発信していきます。

記事一覧

NotebookLM, Apple Intelligence, Claude 3.5 Sonnet - Generative AI 情報共有会 #18

今週、6月25日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

4

GPT-4o, Google I/O 2024, etc - Generative AI 情報共有会 #17

今週、5月28日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
4週間前
16

⌘R+, Llama 3, Phi-3, OpenAI Japan, etc - Generative AI 情報共有会 #16

今週、4月30日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
1か月前
4

言語処理学会第30回年次大会(NLP2024)参加報告

こんにちは。ZENKIGENの栗原です。現在、データサイエンスチームにおいて、自然言語処理周りの研究開発に携わっています。 今回は、2024年3月11日(月)~3月15日(金)に…

Masatoshi Kurihara
3か月前
7

OpenAIの動画生成AI Sora, Gemini 1.5, etc - Generative AI 情報共有会 #14

今週、2月20日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
4か月前
11

Swallow, Nekomata, ELYZA-13b, etc - Generative AI 情報共有会 #13

今週、1月16日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 約1ヶ月ぶりの開催です。直近1ヶ月にあっ…

Masatoshi Kurihara
5か月前
9

GoogleのGemini, OpenAIのGPTs, etc - Generative AI 情報共有会 #12

今週、12月12日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
6か月前
7

LLM-jp-13B, LLMプロンプト技術まとめ, etc - Generative AI 情報共有会 #11

今週、11月7日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します(OpenAI DevDayの内容は間に合わなかったの…

Masatoshi Kurihara
7か月前
13

PLaMo-13B, Mistral 7B, Qwen-14B, etc - Generative AI 情報共有会 #10

今週、10月3日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
8か月前
17

Xwin-LM, DALL·E 3, Bard, etc - Generative AI 情報共有会 #9

今週、9月26日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
9か月前
18

Stable Audio, Firefly, etc - Generative AI 情報共有会 #8

今週、9月19日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
9か月前
13

Turingのマルチモーダル学習ライブラリ「Heron」, Falcon 180B LLM, etc - Generative AI 情報共有会 #7

今週、9月12日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
9か月前
9

生成AIのプロンプト個人情報保護法論点, ChatGPT plugin, etc - Generative AI 情報共有会 #6

今週、9月5日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一回…

Masatoshi Kurihara
9か月前
8

GPT-3.5-Turboファインチューニング, ELYZA日本語LLM, etc - Generative AI 情報共有会 #5

今週、8月29日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
10か月前
12

様々な日本語LLM, LLMでの電子透かし手法, etc - Generative AI 情報共有会 #4

今週、8月22日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。 この連載の背景や方向性に関しては 第一…

Masatoshi Kurihara
10か月前
14

論文メモ : A Watermark for Large Language Models

ICML2023 のOutstanding paper これまでの入力から次の単語を生成する際に、直前のトークン情報から、サンプリング候補とする単語リスト(green list)と候補としない単語…

Masatoshi Kurihara
10か月前
6
NotebookLM, Apple Intelligence, Claude 3.5 Sonnet - Generative AI 情報共有会 #18

NotebookLM, Apple Intelligence, Claude 3.5 Sonnet - Generative AI 情報共有会 #18

今週、6月25日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

Google、NotebookLMを日本語で提供開始(2024/06/06)Google DriveのファイルやPDF、テキストファイル、WebページのURLなどをアップするとその情

もっとみる
GPT-4o, Google I/O 2024, etc - Generative AI 情報共有会 #17

GPT-4o, Google I/O 2024, etc - Generative AI 情報共有会 #17

今週、5月28日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

OpenAI、GPT-4o発表(2024/05/13)テキスト、音声、画像、動画のあらゆる組み合わせの入力に対して、テキスト、音声、画像での出力を可能とするGPT-4o (”o”は”

もっとみる
⌘R+, Llama 3, Phi-3, OpenAI Japan, etc - Generative AI 情報共有会 #16

⌘R+, Llama 3, Phi-3, OpenAI Japan, etc - Generative AI 情報共有会 #16

今週、4月30日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

様々なLLM4月も様々なLLMが発表されました。

Cohere、「Command R+」を発表。非商用ながら100B超えで重み公開。(2024/04/04)

RAGに最適化され、

もっとみる
言語処理学会第30回年次大会(NLP2024)参加報告

言語処理学会第30回年次大会(NLP2024)参加報告

こんにちは。ZENKIGENの栗原です。現在、データサイエンスチームにおいて、自然言語処理周りの研究開発に携わっています。

今回は、2024年3月11日(月)~3月15日(金)に神戸国際会議場で開催された、言語処理学会第30回年次大会(NLP2024)に参加してきたので、その参加報告をいたします。

ZENKIGENは、録画選考システム『harutaka EF(エントリーファインダー)』や面接解

もっとみる
OpenAIの動画生成AI Sora, Gemini 1.5, etc - Generative AI 情報共有会 #14

OpenAIの動画生成AI Sora, Gemini 1.5, etc - Generative AI 情報共有会 #14

今週、2月20日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

OpenAI、動画生成AIモデル「Sora」発表(2024/02/16)ユーザーのプロンプトに忠実に従い、高品質の動画を生成可能(1分の長さを生成可能)な動画生成モデル「Sora」を

もっとみる
Swallow, Nekomata, ELYZA-13b, etc - Generative AI 情報共有会 #13

Swallow, Nekomata, ELYZA-13b, etc - Generative AI 情報共有会 #13

今週、1月16日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。
約1ヶ月ぶりの開催です。直近1ヶ月にあった内容からになります。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

GPT StoreリリースGPTsのアプリストア「GPT Store」がリリース。

「Top Picks」「DALL

もっとみる
GoogleのGemini, OpenAIのGPTs, etc - Generative AI 情報共有会 #12

GoogleのGemini, OpenAIのGPTs, etc - Generative AI 情報共有会 #12

今週、12月12日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

Google、Gemini発表衝撃的なデモ(と実際のところ)

かなり衝撃を持って迎えられたデモ動画。

しかし、デモはかなり誇張という見方が強い。

Googleから公開された

もっとみる
LLM-jp-13B, LLMプロンプト技術まとめ, etc - Generative AI 情報共有会 #11

LLM-jp-13B, LLMプロンプト技術まとめ, etc - Generative AI 情報共有会 #11

今週、11月7日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します(OpenAI DevDayの内容は間に合わなかったので後日機会があれば…)。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

LLM-jpから、13B LLM公開LLM-jp: 国立情報学研究所(NII)が主催し、日本の錚々たる研究

もっとみる
PLaMo-13B, Mistral 7B, Qwen-14B, etc - Generative AI 情報共有会 #10

PLaMo-13B, Mistral 7B, Qwen-14B, etc - Generative AI 情報共有会 #10

今週、10月3日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

PFN、大規模言語モデル PLaMo-13B を公開Preferred Networksが13Bの大規模言語モデルを公開。日英2言語を合わせた能力で世界トップレベルの高性能。

モデ

もっとみる
Xwin-LM, DALL·E 3, Bard, etc - Generative AI 情報共有会 #9

Xwin-LM, DALL·E 3, Bard, etc - Generative AI 情報共有会 #9

今週、9月26日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

一部ベンチマークでGPT-4を初めて上回るLLM、「Xwin-LM」Llama 2をベースに構築された3つのサイズ(7B, 13B, 70B)のLLMが公開。開発者は中国科学院や清華

もっとみる
Stable Audio, Firefly, etc - Generative AI 情報共有会 #8

Stable Audio, Firefly, etc - Generative AI 情報共有会 #8

今週、9月19日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

Stability AI、音楽とサウンド生成のためのAIモデル「Stable Audio」発表テキスト入力から音楽やサウンド生成ができるWebサービスとして公開。

サンプル(テキス

もっとみる
Turingのマルチモーダル学習ライブラリ「Heron」, Falcon 180B LLM, etc - Generative AI 情報共有会 #7

Turingのマルチモーダル学習ライブラリ「Heron」, Falcon 180B LLM, etc - Generative AI 情報共有会 #7

今週、9月12日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

Turing、日英対応のマルチモーダル学習ライブラリ「Heron」と最大70Bパラメータの大規模モデル群公開完全自動運転車両の開発・販売に取り組むTuring株式会社、日本語を含む複

もっとみる
生成AIのプロンプト個人情報保護法論点, ChatGPT plugin, etc - Generative AI 情報共有会 #6

生成AIのプロンプト個人情報保護法論点, ChatGPT plugin, etc - Generative AI 情報共有会 #6

今週、9月5日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

Google DeepMind、「画像生成AIで生成した画像」に電子透かしを入れるツール公開AIが生成した画像に電子透かしを入れ、識別するためのツール。フェイク画像の拡散を防止するため

もっとみる
GPT-3.5-Turboファインチューニング, ELYZA日本語LLM, etc - Generative AI 情報共有会 #5

GPT-3.5-Turboファインチューニング, ELYZA日本語LLM, etc - Generative AI 情報共有会 #5

今週、8月29日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

GPT-3.5 Turboのファインチューニング機能が公開個別のユースケースに精度よく対応できるようにするためのGPT-3.5 Turboのファインチューニング機能が公開(GPT-4

もっとみる
様々な日本語LLM, LLMでの電子透かし手法, etc - Generative AI 情報共有会 #4

様々な日本語LLM, LLMでの電子透かし手法, etc - Generative AI 情報共有会 #4

今週、8月22日(火)にZENKIGEN社内で実施の「Generative AI最新情報共有会」でピックアップした生成AI関連の情報を共有します。

この連載の背景や方向性に関しては 第一回の記事 をご覧ください。

様々な日本語LLMの公開ストックマーク(1.4B)、Stability AI Japan(7B)、LINE(3.6B)、東京大学松尾研究室(10B)と、立て続けに日本語LLMが公開さ

もっとみる
論文メモ : A Watermark for Large Language Models

論文メモ : A Watermark for Large Language Models

ICML2023 のOutstanding paper

これまでの入力から次の単語を生成する際に、直前のトークン情報から、サンプリング候補とする単語リスト(green list)と候補としない単語リスト(red list)に分割して、green listから生成するように促す。

電子透かし入りテキストはgreenばかりになり、人間が書いたテキストはgreen listやred listなど認知

もっとみる