ディスカッション (11件)
この投稿では、「法律上の合法性(Legal)」と「倫理的な正当性(Legitimate)」の違いについて問いかけています。AIを用いたコードの再実装が、従来のコピーレフト(GPLなど)の仕組みをいかに形骸化させてしまうのか。AIが学習を通じて既存のコードを「書き換える」ことで、ライセンスの縛りを巧妙に回避できてしまう現状と、オープンソース文化の危機を考察します。
それは状況を限定的に見すぎてると思うな。歴史を振り返ってGPLが作られた理由を考えれば、著作権を使って著作権と戦おうとした試みだったことがわかるはず。「コピーレフト」っていう名前自体がその考えを表してる。AIが壊してるのは著作権そのものだ。GPLのプログラムだけじゃなく、クローズドソースのプログラムだってリバースエンジニアリングして再実装できる。HNでもそういう話が出てたしね。AIが著作権を無効化しつつあるなら、もうGPLは必要ないかも。GNUは立ち止まってスタンスを考え直すべきだ。邪悪なソフトウェア企業と戦うメインツールとしてのGPLは捨てて、LLMを最大の武器として受け入れるべきだよ。
「壁にあるキャンバスに目隠ししてペンキを投げたら、たまたまミッキーマウスの形になった。だからミッキーの知識を使わずに作ったんだし、著作権侵害じゃない」って言ってるようなもんだよね。ブランシャールは当然ソースコードに精通してる。何年もメンテナをやってるんだから。自分の知識を使って指示したり誘導したりせずに、Claudeに再実装を促したっていうのが前提なんだろうけど。
企業の世界では、セキュリティ部門が許可しないツールを使えるようにするために、AIでの再実装が使われ始めてる。セキュリティは「デフォルトで拒否」のポリシー、エンジニア側は「もっとAIを使おう」ってポリシー。社内で書かれたコードならデフォルトで通る。この先どうなるかは目に見えてるよね。セキュリティが承認しないツールを再実装するためにAIを使ってるんだ。インセンティブが最悪の形で組み合わさっちゃったけど、これが現状。違う結果を望むなら、違うインセンティブを作るしかないよ。
個人的に面白いのは、これが著作権を超えて、知的財産っていう概念そのものをバラバラにしてしまうんじゃないかってこと。そもそも知的財産は、創造性は「難しい」っていう前提に基づいているから。でもLLMはソフトウェアを書くだけじゃなく、数学の証明を解いたり新薬を設計したりする「汎用的な知識生成エンジン」として急速に進化してる。もしそれが「難しく」なくなったら、知的財産って意味があるのかな?そもそも投資がほとんど必要ないものに、なんで独占権を与える必要があるの?古い知財法、例えば特許が残ったとしても、AIにとっては他の制約と同じように「回避すべき入力パラメータ」のひとつになるだけだよ。
そもそも、ライセンス違反はもう起きていると思う。大半の大規模モデルは、利用規約に違反する形でデータを学習してるしね。裁判が必要だけど、GPLのコードで学習されたモデルは、オープンライセンスの要件に「汚染」されていると考えるのは極めて妥当だと思うな。
記事によると「彼はAPIとテストスイートだけをClaudeに渡して、ライブラリをゼロから再実装するように頼んだ」とある。GPL2では「著作物のソースコードとは、それに対して修正を行うのに好ましい形式のこと。実行形式の場合、完全なソースコードとは、含まれる全モジュールの全ソースコードに加え、関連するインターフェース定義ファイル、コンパイルやインストールを制御するためのスクリプトを含む」と定義されてる。プロジェクトのテストスイートはソースコードの一部と見なされないのかな?修正を加える時、テストケースはプロセスの一部だよね。もしテストスイートがこのライブラリのソースコードの一部で、Claudeにテストスイートやインターフェース定義ファイルが渡されたなら、その出力はLGPL 2.1の用語で言うところの「ライブラリに基づく著作物」にならないのかな?
誰かがこれをテストしてみるべきだよね。最近リークされたMinecraftのソースコードを使って、Copilotに別の言語で全く同じレプリカを作らせて、それをオープンソースとして公開してみるとか。Microsoftがそれを「AIによる著作権侵害」と見なすかどうか、見ものだね。
この記事の主旨には同意するよ。規範や、私たちが良い・望ましいと感じるものは、法律が定める最低限のラインを大きく超えている。でも、あまり強調されていないけど重要なのは、これが「あらゆる方向」に作用するってこと。こういう再実装が合法なら、どんな寛容なOSSもプロプライエタリに作り直せる。逆にプロプライエタリなソフトを寛容なライセンスで作り直すことも、自分のプロプライエタリとして作り直すこともできる。法律が追いついてこういう行動を阻止するか、さもなければソフトウェアに関しては実質的に「ポスト著作権」の世界に突入することになる。これは良くないことだよ。オープンライセンスにする動機がなくなるし、企業はAPIを営業秘密みたいに保護したり難読化したりし始めるだろうから。
「仕様からソースコードを生成できるようになった今、GPLプロジェクトの本質的な知的内容は仕様の中にある」。私たちの先人たちは、たとえ所有者が嫌がったとしても、企業のソフトウェアパッケージと同等の機能を持つクローンを作る権利のために戦ってきた。それを全部投げ捨てて、知的財産権の所有者にもっと大きなコントロール権を与えようとしてるんだ。その結果は、「反大企業」にも「共有の促進」にもならない。仕様の再実装や、特定のAPIを話すクライアントの作成、同等品の作成を阻止できるようになれば、いつものように大企業がその力を行使するだけだよ。
「修正したコードを配布したり、ネットワークサービスとして提供したりする場合は、同じ条件でソースを公開しなければならない。これは共有に対する制限ではなく、共有するための条件だ。共有するなら、同じ条件で共有せよということだ」――これ、普通に読めば共有に対する制限だよね。「この条件下でしか共有できない」というのは、「好きにしろ」というより明らかに制限が強い。最終的により多くの共有につながる制限だという議論はできるけど、個別のケースで見れば、やっぱり共有に対する制限だよ。