見出し画像

551|生成AIの構造(240405時点での推測)

今回は、キーワードも出揃ってきたので、現時点での生成AIの構造、構築方法の推測について説明します。
これは、論文などに目を通したわけではなく、「僕がこれまでに出てきた資料を基に構築するんだったら」という推測になるのでご注意ください。(初期から言っているように「非常に簡単な構造をしている」と考えています) 

表記の揺れを吸収、質問はベクトル的に近い方向性として捉える

先日の資料ですが、浮動小数点数は質問中の属性の含有率(?、例:「映画~%」や「俳優~%」などの※)みたいなもののようで、これが数兆個あって、傾きや内積を計算して、近い方向性として捉えていると推測できます。
※たぶん、僕で言うところのkkファイル(キープキー、コンバーターで自動抽出している)にディープラーニングで重みづけして計算している? 
そう考えると、たしかにたまに質問が丸められていると言うか、「いくつかの条件を読み飛ばしてしまっている」と感じることがありますね。
また、語順には意味があっても、丁寧語にはあまり意味がないかもしれません。

生成AIは生成はしていない、回答は生成ではなく統計?

表記の揺れを吸収できる(1項)のであれば、後は一般的に多い回答を返すのは簡単

BingAIなども「小説の登場人物」と注文しても、インターネットに言及が多いのか、実在の人物の情報を出されることがよくあります。

まだ実用レベルに達していない?

僕も、正直、現代の生成AIは実用レベルに達していないと思います。
「生成AIを利用した小説の書き方」なども解説していますが、やっぱり、生成AIの回答は”一般論”であって、おもしろ味はないんですよ。笑(試験問題を解かせるのには向いていても創作には向いていない?) 

【アナウンス】過去、映画館で上映された映画のデータ4万件を入手

プログラムを組んでも2日かかりましたが、4万件の映画データを入手しました。(m3型) 

#生成AI #生成AIの構造 #ベクトルデータベース

謙虚でポジティブに続けていきたいと思っています!応援よろしくお願いします^^