ChatGPT挙動レポート［ほぼ毎日更新］

本

ウマ娘ゴールドシップのロールを与えたChatGPTの回答を再生成させ、回答傾向を可能な限り短いスパンでの変化を分析する。目的公式アナウンスのない調整やエラーの確認ＳＮＳで…

運営しているクリエイター: JunnosukeTachibana

#ChatGPTに訊いてみた

JunnosukeTachibana

2023年9月10日 14:18

ゴルシChatGPT4性能・挙動レポートの目的・前提

　このシリーズでは可能な限り毎日ChatGPT4の回答の特徴、変化を分析した情報を提供する。
　

目的

①OpenAI、ChatGPTからのアナウンスないモデル調整やバージョンアップ、なんらかのエラー発生をある程度信頼できるように確認する

②同じ質問文への回答再生成により、「なんとなく違う」ではなく、ChatGPTの変更、エラーを明確にする。

③試験の正答率や攻撃的質問文へのChatGPT

もっとみる

JunnosukeTachibana

2023年10月6日 11:13

ChatGPTの性能わからん

　以下はChatGPT性能検証の前提記事です。

　昨日から新しいチャットルームを使用したゴルシGPTでの性能検証を始めた。以下は昨日の記事。

　性能検証を始めたはいいものの
「ChatGPTわからん」
というお気持ちが強くなってしまった。スマホへの回答文字数がPCへの回答文字数を上回ったのだ。

　１０７５回の出力を行った旧ゴルシＧＰＴではスマホ出力文字数とＰＣ出力文字数は大きな隔たりがあった

もっとみる

JunnosukeTachibana

2023年9月10日 14:30

［9/10］ChatGPT4挙動レポート

前提

結論
発想、語彙のユニークさ、表現力は9月4日以降の高水準を維持している。
一方でプロンプトで禁じられた箇条書きの多用など、懸念材料が残る。
一部界隈で昨日から出力内容の品質低下が報告されており、関連性がある可能性があるが不明

① プロンプトで禁止した箇条書きの異常な使用（特筆すべき点）

15回の出力中10回が箇条書きを使用されており、偶然と片付けるには多すぎる。プロンプトでは

もっとみる

ChatGPT挙動レポート［ほぼ毎日更新］

フォローしませんか？

#ChatGPTに訊いてみた

ゴルシChatGPT4性能・挙動レポートの目的・前提

ChatGPTの性能わからん

［9/10］ChatGPT4挙動レポート