- 運営しているクリエイター
#OpenAI
[日隔GPT挙動性能レポート12/14]GPT4.5の噂について
総括 今日のGPTは悪くない、知性を感じた。
一つの回答から全体像を読み取ることができるように感じたし、
具体的、抽象的な説明の使い分け、段落ごとに扱うテーマの分割もここ数日とは明らかに異なる。
ただし、これはここ数日との比較であり、この数日は本当に酷い性能だった。
ここ数日は読み込めるプロンプトの長さこそ3.5を凌駕しているが、
過去最も性能差を感じない。
そのためこれまでの回答
11/28昨日より表現力・ボキャブラリが落ち、時々クセの強い変化球を投げてくるChatGPT挙動性能レポート
総括 今日のChatGPTの評価は11/23から4日間安定していた高性能路線から劣化したように感じる。
11/7以降の不安定さを鑑みれば許容範囲内と言えなくも無い。
回答のユーモア、ボキャブラリと回答の論理性がトレードオフの関係だったころに比べるとバランスはとれている。
が、やはり11/23~11/27と比べると回答の質の劣化は目につく。
特にボキャブラリや回答の情報量減少が目につくか
[11/27]手放しで高性能化と評価できる、回答のユーモアと論理的思考を両立し、方向性も安定してるchatGPT挙動性能レポート
総括 今日も11/24からの高性能化を維持。
11/7アプデ後はサムアルトマン問題と関係はないだろうがChatGPTの回答は不安定で、回答の傾向も二日以上続くことが稀だった。落としどころといえる調整が終わったのだろうか?
11/24からchatGPTがユーモア、ボキャブラリの豊かさと論理的思考(矛盾がない)が両立し、回答が安定している。
特に今日は一回も回答の矛盾がないにも関わらず
[11/26]11/7アプデ以降初の安定して高性能のChatGPT性能挙動レポート
総括 chatGPTが高性能の水準で安定、昨日からアイディア、ボキャブラリ、表現力、論理的整合性のバランスがとれている。
ユニークかつ矛盾がなく、口調が安定している。
11/23から24にかけて安定した性能、昨日からは安定と高性能化が両立されている。
11/7以降は極端に論理的で回答の内容が凡庸な日、
思考の飛躍で回答はユニークだが論理的に破綻する日と
日によって回答が極振り、路線が日に
[11/25]11/7アプデ後最もバランスのとれたChatGPT性能挙動レポート
総括
今日ははっきりとchagGPTが高性能だと言い切れるレベル回答だった。
11/7アプデ以降は迷走が続いており、性能、というか回答の性質が毎日極端に変化してきた。
口語、説明口調の使用率やボキャブラリ、言い換え、表現能力、回答の的確さ、ユニークな要素を盛り込みつつも文章の整合性がとれているため、11/7アプデ以降では最もバランスがとれている。
一昨日、昨日とようやくchatGPTが安
[11/24]9/25モデルへの回帰を感じなくもないChatGPT挙動性能レポート
総括 昨日今日は回答に極端な変化は感じなかった。
(特定の項目は過去最大のふり幅だったが)
ちょっと不安になったので回答のお堅さ(説明口調)と発想の突飛さ、ボキャブラリーなどを過去の回答と突き合わせてみてみると、今日の回答は9/25、特に10/20以降のお堅めの日と非常に類似した傾向にあった。
ただし11/7アプデ以降に増えた矛盾やノリと勢いで付け加えたような発想、表現という特徴は今
[11/22]アプデ後最低レベルじゃないchatGPT性能挙動レポート
総括 CEOが変わったことを性能低下の理由にしてはいけない。
朝からログインすらできず、回復したと思ったら一時間再生成できず。
んで回答内容も過去最低。
矛盾も多いし、回答の意味内容、質も低い。
矛盾が多いのはわかりやすいが、質が低いというのは
一つの回答でひたすら類義語、同義語つかって類似トピックを話題に出す。
直球な言葉づかい、というかボキャブラリーが全く無い。
中身スカスカ