2024年9月12日(US現地時間)、OpenAIが、Strawberryと噂されていた、次世代のLLMを発表、o1-previewとo1-mini。
それぞれ、有料ユーザーのみがつかえる(9/14現在)。ただし、huggingFaceなどには、o1を試行用に試供してくれているサイトがある(9/14現在)ので試してみる。
比較題材は、認知言語学の読書ノート(12章)、の「課題」への回答、もともとの質問プロンプトは、本ノートの最後に載せている
絵は、FLUX.1 three wise men(gpt-4o,o1,Claude) came to the gothic hall discussing the future of the humanity. there is a floating globe on the wise men
o1-previewの回答
gpt-4oの回答
感想
gpt-4oはそつない回答であるが、o1は、「言語が認知システムの一翼を担うことで可能」は、まあいいとして、「要因として、言語を介したカテゴリー化や類推、参照関係などの認知能力が挙げられます」、って、元の質問では認知能力は、メタファーなどの基盤であり、そのメタファーなどを用いて言語が形作られる、<認知能力の反映としての言語>、という話とあまり整合してない感じがする。
追加の質問(複数ターン)
少し追い込んでみる。
o1-previewの回答
なんかいい感じになった、やればできるじゃん。やっぱり少し具体的に指示する必要ありそうだ、たぶんそうでないと、すぐさぼるモードで動くのだろう。
一応、メタな能力も確かめよう。
最初から、そうしてほしいもんだ。
もともとの質問