ディスカッション (40件)
Anthropicさん、見てますか?
これまでChatGPT-5やClaude Sonnet 4.5をコード作成に使ってきましたが、Sonnetを気に入っていたので、正直なフィードバックを送ります。
エージェントを使ったコーディングは好きではありません。試してみましたが、コントロールを失うような感覚があり、自分で手を加えたり、修正したり、コードベースをきちんと理解しながら進めていく方が好きです。これは、私がChatGPTやClaudeなどをWebアプリから広範囲にコーディングしてきたことを伝えるためです。CLIやMCPなどは使いこなせていません。重要な点だと思います。
Sonnet 4.5の良い点:ソースファイルをアップロードすると、プロジェクトをゼロからある程度の規模まで管理してくれるところ。コーディングも概ね上手で、私の指示したスタイルに合わせてくれます。デバッグプリントが過剰に追加されるのを防ぐために、論理的に問題を解決できるように促す必要はありますが、素晴らしいツールです。
私は通常、1つのチャットで1つの機能やバグ修正に取り組みます。しかし、チャットが長くなると、リファクタリングの途中で長さ制限に引っかかるのが難点です。セッション制限や週制限にも引っかかります。私はあなたが週制限を始めた理由(24時間使い続けたり、アカウントを共有したりする人がいるから)ほどにはコーディングしていません。週に数日しか使いませんが、使う時は数時間集中して作業します。作業をして制限に引っかかり、セッション制限の時間が過ぎるのを待つ、という感じです。面倒ですが、なんとかやっていけます。ChatGPTは、Webアプリでファイルをプロジェクトに追加したり、トークンコンテキストを管理したりする点で、Sonnetほどのレベルではありません。しかし、ChatGPTには記憶機能があり、非常に便利です。数週間から数ヶ月かけてプロジェクトに取り組むと、私が何をしてきたか、次に何をしたいかを、言わなくても理解してくれます。Sonnetは毎回白紙の状態から始めるようなもので、指示を追加しても比較になりません。
これらはすべて些細な不満で、なんとか我慢していましたが...最近変わってしまいました。アップデートのせいか、プロジェクトが大きくなりすぎて、新しい動作モードになったのかはわかりません。以前は、すべて読むように指示すると本当に読んでくれていたのに、今は賢く必要なものを検索しようとしているように感じます。これは、コードベース全体を与えて、より高いレベルで何かをレビューしたり、特定のバグを見つけたり、より良い方法を計画したりするように依頼する場合に問題となります。全体像を見ることが苦手になってしまいました。以前はGemini Pro 2.5を使ったことがありましたが、Sonnetではうまくいかなかったため、Geminiを試してみることにしました。重要な機能を見落としたり、どこにあるのかわからなかったりするのです。Geminiの方がコンテキストが大きいので試してみたところ、素晴らしい結果が得られました。完璧ではありませんが、少し修正すればかなり正確です。まだ大量のコードをコーディングしたわけではありませんが、今は全体像を見て、バグを取り除いたり、特定の点を改善したりする手助けが必要なので、Geminiは優れています。全体像を捉えています。
Sonnet 4.5は非常に有能なツールなので、残念です。これはモデルの問題ではなく、モデルとユーザー、コードベースとのインターフェースの問題です。最近、コストを最適化するために、トークンの消費量を減らすなどの変更があったのではないでしょうか。とにかく、私にとってはそれが致命的でした。
これまでしてくれたことに感謝します。このフィードバックが誰かの役に立つことを願っています。
うーん、最新の「コード実行とファイル作成」機能に何かまずい経験があるみたいだね。俺はとりあえずその機能オフにしてるわ。(
問題はコード自体と、どうやってコードを手に入れてるかじゃないかな。俺が見てきた感じだと、AIにコードを書きすぎさせると、コードの仕組みを忘れちゃって後で苦労するんだよね。だから、128kとか200kのコンテキスト長じゃ足りないなら、コードのリファクタリングが必要なのかも。
俺はいつも最初にテストして、それからAIに修正させてる。リファクタリング中は何度もテストを実行させるようにしてる。
今んとこ、Sonnet 4.5が最高のコーディングLLMだと思う。最近、お金を節約してClaudeの制限を避けるためにGLM 4.6に切り替えたけど。それでもClaude Code CLIは使ってて、Sonnetの80%くらいの性能はあるかな。今はこれで十分。
例えば、Claude Max 100プランだと、3〜4時間/5時間のウィンドウごとにレート制限に引っかかるし、一度に1つのプロジェクトしかできない。7月は、複数のプロジェクトを同時に実行できたのに。GLM 4.6のコーディングプランなら、月額料金がはるかに安くて、制限もずっと緩い。
Gemini CLIに切り替えても、同じようにはいかないと思う。GLM 4.6でOpenCodeを試してみたけど、Claude Codeほど良くなかった。
皮肉なことに、一番フラストレーションが溜まったのは、プロジェクトのリファクタリングを試みたときだった。コメントアウトされたコードブロックの場所、もう必要のない古い関数、重複、リファクタリングの機会などをすべて見つけて教えてくれと頼んだんだけど、簡単なことさえ見落としてたんだ。この点ではGeminiの方がずっと優れていて、すべてを把握して整理を手伝ってくれた。でも、Sonnetを使う自信を失ってしまった。a) 何か変更があって、今はうまくいかないのか、b) コードのせいなのか、あるいはプロジェクトが大きくなりすぎて、しばらく作業しているうちにまた制限に引っかかり、必要なコンテキストをすべて把握していると信頼できなくなるのか。Claudeに見切りをつけたわけじゃないけど、何かが変わった気がする。拡張された思考連鎖のコメントを見ればわかる。以前はすべてのコードを読んでいるようだったのに、今はもっと小さなチャンクで、特定の小さなものを探そうとしている。でも、結果的には見落としがあるんだ。
俺はいつもリファクタリングで頭を抱えるんだよね。だから、プランモードを開いて、リファクタリング計画のmarkdownファイルを作成するように頼むことが多い。でも、重要なのは、まず手軽なものから取り組むようにプロセスをソートさせること。
例えば、メソッドを別のファイルに分割するのが最初のステップ。行数を1000行未満に抑えられれば、AIはファイル全体を一度に読めるから、リファクタリングの成功率が上がるんだ。
一番大きいファイルは3000行近くあるんだ。でも、ほとんどが関数中心だから、一度に1つの関数だけを扱うことが多い。他のファイルはほとんどが100〜200行と小さい。それが一番大きいファイル。分割して効果があるか試してみるけど、今のところミスがあったのは小さいファイルだったと思う。
これはマジで役に立ちそう。コンテキスト管理がマジ重要だよね。
あんなデカいファイルじゃ、すぐコンテキストがパンパンになってツールがバカになっちゃう。レスポンス遅くて、精度低くて、ミスも多くなるし。
だからClaude 200があるんだよな。
Geminiを試すたびに、ひどい結果になる。俺だけかもしれないけど。Sonnet 4.5をメインのコーダー、GPT-5 Highをデバッグに使ってきたけど、うまくいってる。Gemini 3が競争をもたらしてくれるといいな。
俺も全く同じ構成だわ。同じ構成の人を見かけるの嬉しいね。
+1
俺も同じ構成だ。Geminiは試したことないけど、もしGoogleが検索結果ページで見せてくるLLMと同じなら、マジでクソだね。「ライオンはトラより小さいか」って検索して、今やってるプロジェクトのファクトチェックに使おうとしたら、「いいえ、ライオンはトラより小さくありません。実際、トラの方がずっと大きいです。」って返ってきた。
俺も似たような感じでセットアップしてる。めっちゃ簡単なことにはClaude使って、長丁場になりそうな時はCodex CLIだな。
Gemini CLIはコーディングには使わないけど、モノレポのリサーチには使う。マジで速いし、長いコンテキスト扱うのが得意だから。今はGeminiでリサーチして、計画立てるのが定番。必要なファイルは全部計画に含めるようにして。そしたらClaude codeかCodexに渡して、計画を練り直したり、実行してもらったりする。
GPT-5をコーダーとしてもデバッガーとしても使わない理由って何?
Opusの上限に引っかかった後、Codexに切り替えたんだけど、パフォーマンスにマジで驚いたよ。遅いけど、精度が段違いに高いし、コードが完成したって言ったら、本当に完成してるんだ。
俺もCodex好きだよ。デバッグにもCodex High使うし。分析に関してはSonnetの方がCodexよりちょっと良いかなって思った。俺の仕事はコーディングと分析が混ざってるからね。Codexは君が言うように素晴らしいコーダーだと思うけど、Sonnetは一般的なタスクの方が得意だと思う。
俺はCCとzen mcpを使ってgpt-5-codexでダブルチェックしてる。ただ、API経由でcodexをハイレベルで使えるかどうかがイマイチわからん。
わかる。Geminiのことみんなベタ褒めしてるのを見るけど、いざ使ってみると、俺の使い方だとClaudeより全然劣ってるんだよね。
同じく。俺はCodexを遅いけど徹底的なコードレビュアーとして使ってる。
Geminiは今年の春頃、ほんの数週間だけマジで良かったんだよ。他よりマジで段違いだったのに、一夜にして弱体化させられた。Flutterには強いけどね。
マジそれな。Gemini Proの無料アカウント持ってるから好きになりたいんだけど、Geminiはしばらくは調子いいのに、すぐ迷子になったり、同じこと繰り返したりするんだよね。Claude、codex、GLMは調子いい感じ。
俺にとってGemini CLIは最高だよ。関数型のPHPを書いてて、すべてを1つの大きなファイル+ライブラリ(Composer)に入れてる。
有料版は試したことないけど、ClaudeもChatGPTも間違いなくファイルを読み飛ばして、全部「読んで」ないよ。
そして、思考をすべてAIに任せてるんだね。めっちゃクール。👍🏼
コードベースをUIにアップロードするのは、最も非効率的なやり方だし、ファイル全体やコードベース全体をコンテキストウィンドウにダンプして質問するのは、最悪のコンテキストウィンドウ管理方法だと思う。これはAnthropicのせいじゃない。彼らはこの問題を解決するためのツール、Claude codeを提供してくれたんだ。
Claude codeをプランニングモードで使うと、基本的にすべての問題が解決する。試してみて。ターミナルでClaudeを開いて、shift+tab+tabを押して。コードベースを検索して理解できるエージェントとのインタラクティブなチャットが表示される。プランニングモードでは、コードの変更は一切行われないよ。
間違ってたら訂正してほしいんだけど、Claude codeってCLIベースで、チャットUIじゃないよね?投稿で言ったように、LLMでコーディングするためにCLIを使うのは好きじゃないんだ。
いやいや、言っとくけどそれ自分でハンデ背負ってAnthropicのせいにしてるだけじゃん。LLMに実際に変更してほしくない?OK。それこそプランニングモードの出番でしょ。Web UI使うのと全く同じだけど、コードベースをより効率的に読めるってだけ。
よし、絶対試してみる。アドバイスありがとね。
マジで自分で自分の首絞めてるじゃん。
Claude CodeにLinuxのユーティリティとかパイプライン使わせてコンテキスト節約できるのに。
エージェントとかも設定できるし。
CLIとかIDE使わないとかありえないわ。
でも、ちょっと調べてみたんだ。他に気づいてないこともあるみたいだね。
Temperature(温度)だよ。CLIとWebアプリでモデルのパラメータが違うんだ。
それが何意味するか分からんのなら、LLMをちゃんと使うには知識不足だね。
まあ、一般的に、Web UIで動いてるLLMは、もっとクリエイティブなレスポンスになるようにtemperatureパラメータが上げられてるんだ。
大抵のIDEコーダーはtemperatureを0.2以下に設定する。
Web UIだと1に近い。
とにかく、CLI試したくないなら。
これを試してみて。
https://claude.ai/new?temperature=x (xは0から1のtemperature設定)。コーディングには0.2推奨。変わるかどうか試してみて。もし違ったら...
あと、CLIとかIDE使ってファイル参照すればコンテキスト節約できるのは確かだよね、特にClaudeに何使わせればいいか分かってれば。俺はClaude.mdファイルにClaudeがアクセスできるLinuxシェルのパイプラインセットを持ってる。
あと、それでもCLI使いたくないなら、せめてプロジェクト使ってみて。
俺もそれ言おうと思ってたw
Geminiはマジでイマイチ。Anthropicこそ至高。
エージェントを使うのが役立つのはこういう理由からなんだよね。コンテキストを保持できるから。そうしないとプロジェクトが大きくなるにつれて、システムはプロジェクト全体を考慮できなくなって、コンテキストの圧縮が原因でミスをし始めるんだよね…
俺も同じだけどコーディングじゃなくてね。Gemini > ClaudeとChatGPTだし、ClaudeとChatGPTのサブスクは解約しようと思ってる。
昨日GeminiのCLI使ってみたけど。Claudeには全然及ばない。
Codex CLIの方がGemini CLIより優れてる
難しいことにはOpus使って、たまにcode xも使うよ。
AIモデルを切り替えるっての、めっちゃ分かる!気分転換になるよね!新しいの試すときは、いつも決まったタスクをいくつかやってみて、コンテキストの扱いとか、クリエイティビティとか、正確さをチェックするようにしてるんだ。あと、モデルのスタイルに合わせてプロンプトを調整すると、ポテンシャルを最大限に引き出せるってのも発見したよ。GeminiとSonnetだけど、Geminiが特に優れてる点って何かある?Sonnetと比べて何がすごいのか気になるな。
Claude code試した?チャットとはマジで別次元だよ。
- ツールとレスポンスを最大限に活用するには、IDEのCLIから使うべきだと思う。自動編集とかエージェントをオンにする必要はないんだよ。これが一番良い方法なのに、なんでそうしたくないのか詳しく説明してないよね。もう一度試してみれば分かるかもよ。
- CLIツールでコンテキストをうまく管理して、ドリフトしてるなら思考をオフにしろ。上限に達したり、デバッグポイントをあちこちに追加してるってことは、いつも思考がオンになってるんじゃないの?
指示した通りに動いて欲しいときは、思考は必要ないんだよ。思考は賢くするだけじゃなくて、アプローチを再検討したり、新しい解決策を考えさせたりする。ブレインストーミング、アーキテクチャ設計、デバッグには最適だけど、ツールに指示した通りに動いてもらったり、コンテキストやトークン消費を抑えたりするには向いてない。
コンテキスト、ね。
マジで?Gemini、最後に数週間前に使った時はクレイジーだったよ。Dockerファイルのissueを修正してもらおうとしたら、M2 MacBook使ってるのに、Dockerイメージのアーキテクチャをarmからamdに変えやがった。
Geminiはクソだよ(笑)Opus使えよ。SonnetとGeminiはコードをめちゃくちゃにし続けたけど、Opusは速攻で直してくれた。
Geminiはクソの塊