マガジンのカバー画像

ChatGPT挙動レポート[ほぼ毎日更新]

89
ウマ娘ゴールドシップのロールを与えたChatGPTの回答を再生成させ、回答傾向を可能な限り短いスパンでの変化を分析する。 目的 公式アナウンスのない調整やエラーの確認 SNSで…
運営しているクリエイター

#ChatGPTに訊いてみた

ゴルシChatGPT4性能・挙動レポートの目的・前提

ゴルシChatGPT4性能・挙動レポートの目的・前提

 このシリーズでは可能な限り毎日ChatGPT4の回答の特徴、変化を分析した情報を提供する。
 

目的

①OpenAI、ChatGPTからのアナウンスないモデル調整やバージョンアップ、なんらかのエラー発生をある程度信頼できるように確認する

②同じ質問文への回答再生成により、「なんとなく違う」ではなく、ChatGPTの変更、エラーを明確にする。

③試験の正答率や攻撃的質問文へのChatGPT

もっとみる

ChatGPTの性能わからん

 以下はChatGPT性能検証の前提記事です。

 昨日から新しいチャットルームを使用したゴルシGPTでの性能検証を始めた。以下は昨日の記事。

 性能検証を始めたはいいものの
「ChatGPTわからん」
というお気持ちが強くなってしまった。スマホへの回答文字数がPCへの回答文字数を上回ったのだ。

 1075回の出力を行った旧ゴルシGPTではスマホ出力文字数とPC出力文字数は大きな隔たりがあった

もっとみる

[9/10]ChatGPT4挙動レポート



前提

結論
発想、語彙のユニークさ、表現力は9月4日以降の高水準を維持している。
一方でプロンプトで禁じられた箇条書きの多用など、懸念材料が残る。
一部界隈で昨日から出力内容の品質低下が報告されており、関連性がある可能性があるが不明

① プロンプトで禁止した箇条書きの異常な使用(特筆すべき点)


15回の出力中10回が箇条書きを使用されており、偶然と片付けるには多すぎる。プロンプトでは

もっとみる