10月19日 技術者の集合知の活かし方
10月19日ですね。
こんな記事を見かけました。
https://gigazine.net/news/20221019-github-copilot-erases-open-source-community/
私もAIによるコーディングは以前試してみました。つい先日もkintoneで○○すると指示を出したところ、kintoneのAPIの構文のさわりが出てきたのを確認しました。
この記事ではオープンソースコミュニティが破壊される危険が主に取り上げられています。か、私はこの記事の最初にある、学習データの中に著作権で保護されたソースコードが含まれている件について考えてみます。
これ、実はMidJourneyやStable DiffusionなどのAI画像出力でも問題になりました。元画像やソースコードが人間由来であること。
そのような元は誰かの創意によって作られた画像から加工された成果を使って良いのかと言う議論です。
人類が今まで累々と貯めてきたデータは著作権の対象であろうとなかろうと、人類の叡智の成果、つまり集合知てす。
この事実は多分、人工知能が人類によって用意されたデータで学習する今の基本設計が変わらない限り、ずっと残り続けるでしょう。
それはつまり、人工知能によって自動出力された画像や音楽などは、基本的に人間の感性にあったものが出力されることでもあります。人類の感性の枠組みを超えたものは採用されず、枠を越えることはないでしょう。
その一方で、将棋のPonanzaや囲碁のAlphaGoのように論理に集約されるものは、人類の想像もつかない指し手を編み出します。プロ棋士はそれを学び、実践に活かします。そかで生まれた棋譜をまた人工知能が学びます。
今回の著作権云々の問題は、AIが出したコードがAI自らが導いた論理に基づいて書き直したものではなく、既存のコードから統計的に出したものをただ出しただけであることに注意が必要です。だから著作権で保護されたはずの既存のコードが紛れ込んだのだと思います。
ただ、何らかの手段で膨大なソースコードを学習データに投入することが可能になった時、もはや著作権を侵害しているかどうかを人間は検知できないはずです。
多分、人類は人工知能の進出を抑え込めないでしょう。シンギュラリティが来るのか来ないのかは分かりません。が、人類の著作権は曖昧になり、誰もが集合知を活用できるようになると予想しています。
となると、あとはその活用の仕方です。
私はプログラマーの仕事はあと五年か十年で消えていくと思っています。
またGitHub Copilotは実務に使える段階にはありませんが、ますますプログラムのコーディング技術は需要が減っていくでしょう。
膨大に用意されているコードを使い、お客様のビジネスにいかにして合わせるか。
その時、自社で保護した著作権を盾に安心していると、新たなビジネスの流れについていけない可能性があります。
人工知能との付き合いは、これからも注視していかないと、道を間違えかねません。
そう思わされたニュースでした。
ありがとうございます。 弊社としても皆様のお役に立てるよう、今後も活動を行っていこうと思います。