



  • オープンソースとプロプライエタリソフトウェアの戦いは、AIの領域でも続いています。特にAIの文脈で「オープンソース」が何を意味するのかについては、まだ合意がありません。

  • The struggle between open source and proprietary software is well understood. But the tensions permeating software circles for decades have shuffled into the artificial intelligence space, in part because no one can agree on what “open source” really means in the context of AI.


  • The New York Timesは最近、MetaのCEOであるマーク・ザッカーバーグが「オープンソースAI」を取り入れたことで、シリコンバレーで再び人気を得ていると評価しました。しかし、MetaのLlamaブランドの大規模言語モデルは、真の意味でのオープンソースとは言えないという意見もあります。

  • The New York Times recently published a gushing appraisal of Meta CEO Mark Zuckerberg, noting how his “open source AI” embrace had made him popular once more in Silicon Valley. By most estimations, however, Meta’s Llama-branded large language models aren’t really open source, which highlights the crux of the debate.

Open Source Initiative(OSI)の取り組み

  • OSIは、オープンソースの定義を守り続けていますが、AIにおけるライセンスや命名法を適用するのは問題があります。昨年、オープンソースの伝道者であるジョセフ・ジャックスとOSS Capitalの同僚であるヘザー・ミーカーは、「オープンウェイト」という新しい概念を提唱しました。

  • The OSI has been a steward of the Open Source Definition (OSD) for more than a quarter of a century, setting out how the term “open source” can, or should, be applied to software. But transposing legacy licensing and naming conventions from software onto AI is problematic. Last year, Joseph Jacks, open source evangelist and founder of VC firm OSS Capital, and his colleague Heather Meeker, came up with their own definition of sorts, around the concept of “open weights.”


  • AIシステムが「オープンソース」とみなされるためには、訓練データセットを他の人が調査できるようにする必要があるのかどうかが大きな課題となっています。Maffulli氏によれば、データの出所や開発者がどのようにデータをラベル付け、重複排除、フィルタリングしたかを知ることの方が重要だといいます。

  • One of the biggest challenges has been around data — that is, can an AI system be classified as “open source” if the company hasn’t made the training dataset available for others to poke at? According to Maffulli, it’s more important to know where the data came from, and how a developer labeled, de-duplicated and filtered the data.


  • ソフトウェアのオープンソースとAIのオープンソースには根本的な違いがあり、OSIはその違いを定義に反映させようとしています。現在、オープンソースAIの定義草案はバージョン0.0.8で、3つの主要な部分から構成されています。最終版は10月末のAll Things Open会議で発表される予定です。

  • The fundamental differences between “open source software” and “open source AI” are what the OSI is trying to capture in its definition. The current Open Source AI Definition draft sits at version 0.0.8, and the stable version is expected to be rubber stamped by the Board at the All Things Open conference at the tail end of October.


