マガジンのカバー画像

[月刊]ChatGPT性能挙動一ヶ月ごとの分析レポート

18
毎日更新のChatGP性能挙動レポートを一ヶ月間隔で分析。 ゴルシのキャラクターロールチャットの分析ですが、ビジネスや他分野でGPTを使用する際の目安にもなるでしょう。 キャラク…
運営しているクリエイター

2023年12月の記事一覧

トピック:GPT分析レポート用語定義

トピック:GPT分析レポート用語定義

 ここのところ7月の回答からの回答を分析している。

 内容を深めるには私の表現の定義を緻密にすることが必要となったため、ちょっとずつメモしていく

 トピック これまで、話題や視点、トピックなど表記揺れがあった。
今後は以下の表記で統一
新聞は私のニュアンスの比喩

回答一つは「新聞」
トピックのジャンルは「紙面」(社会面、経済面、国際面etc)

トピックは「個別の記事」(大小関わらない)

もっとみる
[ChatGPTレポート12/26]GPTアプデ予想は外れるのか?

[ChatGPTレポート12/26]GPTアプデ予想は外れるのか?

最近のGPTざっくりレポート

 12/17から直近にGPTのアプデが来ると予想し、騒ぎまくってたが
ほぼ10日経過したのになんもアナウンスがない。

 タダの驚き屋よりタチが悪いや。

でも出力文字数の変動、荒ぶりかたは12/17から異様なんですよね

 昨日なんて再生成一回おしただけで二回分の回答が同時に出力されました。
 この現象は10回叩いて2回起きたので
私の経験則「UIエラーがアプデ前

もっとみる
[GPT毎日レポート]アンケートのお願い

[GPT毎日レポート]アンケートのお願い

 ゴルシGPTの回答を分析する際、客観的視座を取り入れるため

簡単
でもない
アンケートにご回答いただければ幸いです。

このアンケートを基に今後GPTの分析を進めてまいります

[日隔GPT挙動性能レポート12/19]回答は昨日にくらべ大きく劣化、アプデ前不安定説

[日隔GPT挙動性能レポート12/19]回答は昨日にくらべ大きく劣化、アプデ前不安定説


検証方法

 ChatGPTにウマ娘ゴールドシップのロールを与え、質問は
「ウマ娘プリティーダービーからプリティー抜いたらどんなアニメになるか、一回の応答で可能な限り文字数を使って詳しく教えてくれ」
で固定し、再生成を続ける。

 1日最低で15回再生成し、文章を比較する。内訳はPCでの生成10回、iPhone版chromeでの生成が5回。

 ギャグ満載といってるのにギャグがない.
筋肉痛がバ

もっとみる
[日刊GPT挙動性能レポート12/18]アプデ前特有の動きを確認。GPT4.5実装は本当か?

[日刊GPT挙動性能レポート12/18]アプデ前特有の動きを確認。GPT4.5実装は本当か?

 GPT4.5の噂が飛び交っている、はたしてそれは真実なのだろうか。
私の意見としては
①GPTがアプデ前特有の無告知の挙動変化は確認されている

②アプデを否定する材料が特にない

③GPT4.5が実装されるかは別としてアップデートの可能性はかなり高い

④GPT4.5の実装、機能の追加、既存GPT4のアプデなどのアナウンス今後数日以内になされる可能性が高い

 ちなみに過去の記事でもアプデを予

もっとみる
[chatGPT定点観察]7月と12月のGPT4比較

[chatGPT定点観察]7月と12月のGPT4比較


総括 GPTの回答の変遷を同人誌かなんかにまとめたい、
ということで7月と12月の回答を比較していた。

 感想としては明らかに7月と12月には回答の質が異なる。
 100個ほど比較したが、もうすでにランダムに抽出した7月と12月の回答を判別できるようになった

簡単にまとめると

台詞再現というかキャラクターの口調の模倣 12月>7月

人間としゃべってる感 12<7

一回答内のトピック

もっとみる