ディスカッション (11件)
オランダが独自に開発した言語モデル「GPT-NL」が発表されました。これは特定の国家や言語の特性を尊重し、データ主権を確保することを目的とした「ソブリン(主権)AI」の先駆的な取り組みです。汎用的なモデルに頼らず、オランダ語圏の言語的・文化的文脈を最適化できるこのモデルは、AIのローカライゼーションにおいて重要な一歩となるでしょう。
以前、2023年12月2日に投稿されたものだね。 https://news.ycombinator.com/item?id=38497495 (コメント3件)
たった1350万ユーロで、ゼロから競争力のある品質のモデルを構築して、さらにコンテンツ所有者に公正な報酬を支払うだって?どこか計算が合わない気がするんだけど。
このタイミングで投稿されたのは興味深いね。最近、オランダのテック界隈ではこのプロジェクトに対して懐疑的な見方が強まっていて0、それももっともだと思うよ。
すでにかなり強力なオープンソース(ウェイト公開)モデルが存在しているのに、各国(特に政府)がなぜ独自のモデルを持ちたがるのか理解できないな。
国が気にするべきなのは、どのコードが動くかじゃなくて、コンピューティングリソースを「どこで」確保するかじゃないのか?
政府の業務のために、自国のハードウェアでKimiやQwen、GPT-Ossをホストすることの何がいけないんだろう。
こういう動きが出てくるのはすごくいいことだ。どの国もやるべきだよ。個人的には、一人ひとりが自分のコンピュータでパーソナライズされたAIを動かすようになるべきだと思う。コストが天文学的に高くさえなければね。
ヨーロッパが何かをするたびにこれほど批判されるのは異常だと思う。小規模な国がそれぞれの言語を使って自国の境界内でモデルを構築するのは重要なことだよ。米国や中国以外でも研究を続ける必要があるはずだ。
こういう「主権AI」の類の話は何度も見てきたな。スウェーデンでもGPT-SW3 (https://www.ai.se/en/project/gpt-sw3) があって、同じような話だった。「主権」なんて言葉に金を浪費するより、国立研究所はQwenやKimiのような強固なベースラインモデルの上に構築して、実用的なエージェント機能を持たせるためのファインチューニングを行うべきだ。それなら広く国民が無料で使えるようになる。例えば、CursorがComposer 2.5でやったようなことを各国が見習うべきじゃないかな。
すでにGEITjeがあったけど、裁判所によって禁止されてしまったんだ。インターネット全体がオランダの法律の管轄下にあるわけじゃないから、今でも見つけることはできるけどね。でも、あれのせいで開発が止まってしまったのは痛いよ :(
GPT-NLはオランダとヨーロッパ内で開発されています。これにより、モデル、データ、そして意思決定のすべてを完全に制御できます。非ヨーロッパ圏のプロバイダーへの依存を避け、EUのAI法に沿った法律、価値観、社会的目標に適合する持続可能なAIエコシステムに投資します。
最高だね!アメリカや中国が自分たちの最先端モデルへのアクセスを拒否してきたことに対する、我々の回答ってわけか。主権AIを開発するための1350万ユーロという巨額の資金、法的に適正な文書のみで学習され、EUのAI法で定義された最高の倫理基準を満たすAI、期待しているよ。
本当に重要なのは、LLMモデルをファインチューニングする主権的な能力だと思う。どんなモデルでも検証やテストはできるけど、モデルが古くなるのを防ぐにはファインチューニングやLoRAの学習環境が必要だからね。