【速報】Gemini 3 Proモデルカード公開！詳細スペックを徹底解剖

まあ、ギャップを埋めるための徹底的な研究はすごく効果的だよね。

VincentNacon

👍17か月前

おそらく、もうすぐリリースされる2.5をコピー＆ペーストしただけだろうね。後でアップデートされる可能性が高い。

Leather-Cod2129

👍17か月前

同じトレーニングデータセットを使ってるからじゃない？

Solarka45

👍17か月前

それはちょっと残念。GeminiとExpedition 33について話せるようになるまで、もうちょい時間かかるな。

Content_Shallot2497

👍17か月前

2025年にはAI生成のクソコンテンツが大量に出回るからね。

ActiveLecture9825

👍207か月前

あと、これもね:

入力: 最大1Mトークンのコンテキストウィンドウ。テキスト文字列（質問、プロンプト、要約するドキュメントなど）、画像、オーディオ、ビデオファイル。
出力: テキスト、64Kトークンの出力。
Gemini 3 Proの知識カットオフ日は2025年1月。

SecretTraining4082

👍67か月前

＞最大1Mのトークンコンテキストウィンドウ。テキスト文字列（質問、プロンプト、要約するドキュメントなど）、画像、オーディオ、ビデオファイル。

それはそれでいいんだけど、問題は実際にそのコンテキスト長をちゃんと守ってるかどうかだよね。

ActiveLecture9825

👍27か月前

返信先:>>20

マジで同意。もうすぐわかるさ。

Brilliant-Weekend-68

👍17か月前

2025年1月？それはかなりヤバいな。なぜだろう？モデルのトレーニングをかなり前にやったのか、それとも何らかの理由でトレーニングデータを最新の状態に保っていないのか？

no-name-here

👍17か月前

返信先:>>22

競合他社も似たような状況みたいだし、つい最近リリースされたChatGPT 5.1も、まだ2024年の知識で止まってるみたいだね: https://platform.openai.com/docs/models/gpt-5.1 。もしかして、学習にかかる時間が長くなってるだけじゃない？

Either_Scientist_759

👍17か月前

https://preview.redd.it/yfnna4yd502g1.jpeg?width=349&format=pjpg&auto=webp&s=e3133aedff89239c4f49efb432574550620aab66

Cursorだと200万のコンテキストウィンドウをサポートしてる。

improbable_tuffle

👍17か月前

返信先:>>24

APIだと200万だけど、Geminiだと100万みたいなパターンでしょ

old_Anton

👍17か月前

つまり2.5 Proと同じ入出力だから、改善はなしってことか。コンテキスト長も実際は100kぐらいなんじゃない？何も言及してないし。

Plenty-Donkey-5363

👍17か月前

返信先:>>26

違いが実際に見られるベンチマークをチェックしてみたら？

improbable_tuffle

👍17か月前

マジかよ、2.5 Proと同じカットオフ日ってのが信じられねえわ

LateAd5142

👍17か月前

返信先:>>28

Gemini 2.5のカットオフ日は2025年1月じゃないぞ

no-name-here

👍17か月前

返信先:>>29

https://deepmind.google/models/gemini/pro/ によると、そうみたいだよ。どこかで違うって聞いたの？

Least_Bodybuilder216

7か月前

嘘っぽい。

SpecialistLet162

👍97か月前

返信先:>>31

いや、マジだよ。リンク見て、Googleのサイトに飛ぶから。2.5 Proのモデルカードも見てみな、同じドメインで公開されてるから。

Least_Bodybuilder216

7か月前

返信先:>>32

😭

Least_Bodybuilder216

7か月前

返信先:>>32

どうか嘘であってくれえええ😭

jan04pl

👍117か月前

返信先:>>34

なんで？かなり大幅な改善に見えるけど。

ReallyFineJelly

👍97か月前

返信先:>>34

なんで？ベンチマークスコアがマジでヤバいじゃん。

VincentNacon

👍17か月前

返信先:>>34

マジで、ジェミニがそんなに嫌ならGrokにでも戻れば？

Equivalent_Cut_5845

👍37か月前

返信先:>>32

storage.googleapisはただの汎用的なGoogleクラウドストレージのリンクでしょ。deepmind-mediaの部分が本当にDeepMindのものかどうかは分からんけど。

MrDher

👍47か月前

返信先:>>38

https://modelcards.withgoogle.com/model-cards
リンクをチェックして。

Equivalent_Cut_5845

👍27か月前

返信先:>>39

うん、プレフィックスは正しそうだね。

MerBudd

👍17か月前

返信先:>>38

/deepmind-media は彼らのものだよ、うん。同じリンクのドキュメントがGoogleのブログ記事にもたくさんある。誰かがわざわざGoogleストレージをハッキングして、たった一つのファイルを置いて人をからかうなんて考えにくいな。

LingeringDildo

👍97か月前

SonnetとSWEベンチマーク、あれはマジでフロントエンドの怪物だな。

Ok_Mission7092

👍17か月前

返信先:>>42

そこが気になったんだよね。Gemini 3が他のすべてを圧倒してるのに、SWEベンチだとイマイチってどういうこと？

Sound_and_the_fury

👍17か月前

マジかよ、すげえな。

Mwrp86

👍17か月前

今日知ったんだけど、Claude Sonnet 4.5は人類最後の試験で負けるんだ。

jan04pl

👍37か月前

返信先:>>45

それでも最高のコーディングモデルなんだから、ベンチマークは話半分に聞いとくわ。

DisaffectedLShaw

👍27か月前

返信先:>>46

Claude Sonnet 4.5は、ものを作るのがマジ得意。スキルとMCPがあれば、タスクに必要な情報を与えれば、メモを取って正式なドキュメントを1つのチャットで作れる。

jan04pl

7か月前

返信先:>>47

そうそう、Gemini 2.5はCursorみたいなAgenticツールではマジでクソだったから、3.0を試すのが楽しみ。少なくともエージェントのスコアはClaude/GPTと同等みたいで期待できる。

CarelessAd6772

👍17か月前

マジか、すごいな。

P.S. コンテキストウィンドウがまだ1Mなのが残念。

Cultural-Check1555

👍17か月前

返信先:>>49

コンテキストウィンドウが1Mだったことなんてないよ。2.5 Pro だと、200k を超えるとマジで Bard みたいになっちゃうし… まあ、様子見だね。

VincentNacon

👍17か月前

返信先:>>49

テストのためだけに100万に制限されてるのかも。そういうテスト作った人たちが、もっと許可するようにアップデートする必要があるのかもね。

どれくらい？まだわからん。

yonkou_akagami

👍37か月前

誰かGrok 4.1のARC-AGI-2での性能を知ってる？

SecretTraining4082

👍27か月前

GPT-5 Pro は HLE で 31.64% か。

LexyconG

👍17か月前

またしても漸進的な改善か。壁はマジであるな。

jan04pl

👍17か月前

つまり、どのモデルも漸進的な改善で、それでも新しいモデルをリリースし続けるなら、それを壁とは呼ばないんじゃないかな。

簡単なところは拾い尽くされて、指数関数的な改善なんてありえないのは確かだけど、それでも可能な限り絞り出してるんだよ。

LexyconG

👍17か月前

返信先:>>55

リリースごとにステップが小さくなってるね。アーキテクチャの根本的な問題は解決されないまま。Sonnetよりも良いコーディングすらできてないし。AGIはもう終わりだ。

jan04pl

👍17か月前

返信先:>>56

この分野に真剣に取り組んでる人で、LLMがAGIにつながると本気で信じてる人いる？

LexyconG

👍17か月前

返信先:>>57

せやな

XvX_k1r1t0_XvX_ki

👍17か月前

返信先:>>56

そうなの？

FlamaVadim

👍17か月前

LLM についてはそうだと思う。

old_Anton

👍17か月前

LLMはずっとそうじゃん。今までと何も変わってないって。

DifficultSelection

👍17か月前