ディスカッション (14件)
Googleの最新モデル「Gemini 3 Pro」が話題沸騰中!
そこで、ChatGPT 5.1とGemini 3 Pro、一体どっちが優秀なのか?実際に複雑なタスクで徹底比較してみました。
今回のプロジェクトは、Windows LTSC (企業向け特別版) の自動 unattended インストール機構の構築。
具体的には、以下の2つのシークレットを作成する部分に取り組んでいます。
- 初回インストールに必要なブートストラップ管理者のための、暗号学的に生成されたワンタイムパスワード
- システムインストール後に残る永続的な管理者のパスワード
問題発生!詳細なログと仮想マシンでのテスト結果を両モデルに投入。
一見すると、Geminiの方が迅速に問題を解決しているように見えます。しかし、Geminiは大胆すぎる仮定に基づいており、検証が甘い部分が見受けられました。
一方、ChatGPTはより慎重で、根拠に基づいた議論を重ね、二重チェックを行います。重要なパイプラインにおいては、ChatGPTの方が信頼できるアプローチと言えるでしょう。
結論:もしGoogleがCLIコーディングエージェントをリリースしたら、Codexは太刀打ちできないかもしれない。
みんなはどんなユースケースで使ってる?ぜひシェアして!
P.S. ここで言う「Gemini CLI」とは、単なるコマンドライン版Geminiではなく、ChatGPTとCodexのように、独立したコーディングモデルのことです。
GoogleにはGemini CLIがあるし、結構前からそうだよね……
ああ、ちょっと正確じゃなかったね。OpenAIみたいに、独立したコーディングモデルのことを言いたかったんだ。
それが役立つとは限らないんだよね。例えば、Codex CLIではGPT5 mediumの推論が一番信頼できる。以前はCodex 5 mediumモデルを使ってたけど、GPT5 mediumの方が信頼性が高いんだ。コーディング能力だけでなく、一般的な知能も必要だからね。5.1に関しては、ひどい状態らしいから、とりあえずGPT5を使い続けるよ。
みんなの意見を聞く限り、Gemini 3はまだ本格的なコーディングプロジェクトには使えないみたい。システムプロンプトを修正して、ハルシネーションを減らす必要があるね。
全体的には同意だよ。でも Gemini 3 の現状を見ると、もう大体の下準備は終わってる気がするんだよね。ざっくり言うと、エンジン、トランスミッション、サスペンションはもう準備OK。あとはダイナモに乗せて、適切なソフトウェアをロードするだけ。そしたら、マジで他の車じゃ太刀打ちできないスーパーカーになると思うぜ、マジで!
GoogleにはCLIエージェントがあるよ。Gemini-cliって名前で、CCのフォーク。
比較するなら、codex-5.1-max-xhighじゃない?
みんな、この投稿でいくらもらってるんだ? 俺も欲しいわ。昨日からRedditでほとんど同じ内容のやつを3、4個見たぞ。
マジかよ、金? 欲しいわ。今日の実際の業務で比較した後に書いたんだけど、サブレディットも同じような雰囲気になってるのに気づいたんだ。
宣伝じゃなくて、快適なエコシステムに留まるか、最新のSOTAに飛び込むか悩んでる人がいるってこと。
俺もマジで乗り換えを考えてるんだよね。OpenAIが、IDがないと俺のクレジットカードは「大人」として認められないって言い出した後だし。😅
OpenAIではそんなこと何も言われなかったのに、Googleになった途端にAI Studioを使わせてくれないの、マジ笑える。俺のアカウントはまだ「大人じゃない」らしい😂
ああ、この「成人認証」の展開が、めちゃくちゃ一貫性がないのが超不思議だよね。IDアップロードをすぐに求められた人もいれば、全然何も表示されない人もいるし、それがもう丸一日続いてる。
裏でどこかからアカウントの情報を引っ張ってきてる感じだよね。Googleのログインデータとか、何かしら。
Googleはすでに俺たちのこと全部知ってるのにね。少なくとも二度手間にはならないだろうけど😂
他の人は知らないけど……
今日、gpt5.1 highがめっちゃ速いんだよね……Gemini 3くらい速い……マジでこのまま続いてほしい……普通のPlusアカウントだけど……
俺もスピードアップは感じなかったな。もしかしたら、アカウントの年齢に基づく新しいモデル利用ルールが適用されてるからかも。調整中にたまたま空き容量に当たっただけかもしれないし。わからん、ただの推測。
客観的に感じられる範囲では、G5 5.1 highの速度は全然変わってない。俺もPlusだよ。
そうそう、今のところ気づいたのは、「計画を続けろ」って言うと、いきなり先のことまで決めちゃうんだよね。
しかもUIを完全にぶっ壊してくれたしw まあ、Gemini との楽しい時間は10分で終わったってことだな。