ディスカッション (44件)
Claudeを使ってると、すぐに「会話の最大文字数に達しました。新しい会話を開始してください」って表示されて、チャットが終わっちゃうんだけど、同じような経験してる人います?
短いスレッド、例えば数回のやり取りでも頻繁に起こるんですよね。何か間違った使い方をしてるのかな?それとも、そういう仕様なの?
話題が盛り上がってきて、もっと深掘りしたいのに、数ターンごとに新しいチャットを始めなきゃいけないのは、マジでストレス。
サブスク解約したわ。短いのはまだしも、その短いチャットの中でさえ、基本的なことのコンテキストをすぐ忘れるのにマジでショックだった。
言ってることはわかるけど、総合的にこれより良いのまだ見つからないんだよね。色々試したけど。どこにも縛られてないから、もっと良いやつが現れたらすぐ乗り換えるけど。
Claude、あちこちでやらかしてるな。これとか、セッション上限とか。マジで乗り換えたいけど、もっとマシな選択肢あるのかな。
代替手段はすぐに出てくるでしょ。潤沢な資金を持つGoogleが、遅かれ早かれリーダーになるだろうし。中国のLLMも欧米のものに急速に追いついてるしね。市場はすごいスピードで発展してるから。Opus 4.1レベルのLLMで、最新のトレーニングがされてれば、Claudeより安ければ十分だわ。
今のところGoogle AIはマジでポンコツ。まあ、いずれはマシになるかもだけど。
Gemini 2.5 Proはなかなか良いと思うけどね。
昨日、週の制限に達しちゃった😩
MAXプランの中でも低い方だけど、Claudeのデスクトップアプリだと5回くらいやり取りしただけで上限に達しちゃうんだよね。でも、Claude Codeだと何時間もコード書けるのに制限に引っかからない。
一体何してるの? こっちは何百行ものコードで1ダース以上のやり取りができるけど。
こいつ、compact messages が結局同じことだってわかってないんだな。
デスクトップアプリだといつもこれだったから嫌だったんだよね。もちろん、ChatGPTも長く使ってると回答の質が落ちてくるけど、それでも完全に新しい会話を始めるよりはマシ。
GPTはすぐコンテキストを忘れることが多いんだよね。前のプロンプトに入ってないコードは繰り返してくれないし。
LLMは全部、すぐクオリティ落ちるよね。ベンチマークもいくつかあるけど(LimaとかLongBenchとかは除く)、だいたい40kトークン超えたあたりから急降下するのを示してる。
制限に変更あった?拡張思考をオンにしてると、3~5レスくらいで常に制限に引っかかるようになったんだけど。MAXプランなのに、こんなに酷かったっけ?
心配すんなって。前のチャットを参照できる機能が追加されたから、Claudeが君がやってたことの一部始終を把握してると教えてくれるよ。でも、結局最初からやり直すことになるんだけどね。だから今は、プロジェクトの設計ドキュメントを5メッセージごとに更新させてるよ。どうせすぐに振り出しに戻るってわかってるから。
設定でオンにした場合だけだよ。でも、プロジェクトがある場合はそれを見ないし、プロジェクトの中にいる場合は外を見ないよ。
一度やらせてみたら、実際にできたんだよね。でも、別の機会にまた頼んだら、できないって言われて、昔のチャットを参照するのは絶対に無理だって言われたよ。言い方の問題かな? でも、一度はできたのに、二度とできなかった(笑)。
相変わらず、自分の能力について、できることとできないことを、時々でっち上げるよ。新しいチャットを始めれば違う挙動になるかもしれないけど、技術的に機能してても、そこまで役に立つわけじゃない。
ウェブ検索はトークンをめっちゃ使うからね。
マジ? チャットにたくさんのMCPを設定しておけばそうなると思ってた。
ウェブ検索とMCPはどっちもトークンをめっちゃ使うんだよね。画像に出てるからウェブ検索って言ったまで。
だから? セッション全体の制限を使ってくれればいいのに、チャットごとの制限じゃなくてさ。もし俺が1つの会話で利用可能なトークンを全部使い切りたいなら、それは俺の責任だけど、途中でタスクを中断してくるのはマジで解約したくなる。
レート制限じゃないんだ、コンテキストウィンドウが文字通りいっぱいいっぱいなんだよ。ウィンドウからテキストを削除しない限り、回避策はないよ(ウェブインターフェースで前のメッセージに巻き戻すしか方法はないけどね)。
ウェブ検索を挟んだ10ターンの会話で、200kトークンウィンドウが埋まるなんてありえないっしょ。
まあ、プロジェクトのドキュメントもあるし、アーティファクトとかのツール使用に関する指示もあるし、それに加えて実行したウェブ検索の回数もあるし、さらにアンスロピックがバッファとして埋めるかもしれない200k以下の任意の値もあるし… 俺が測った感じだと、チャットはだいたい140k~160kトークンくらいで終わることが多いんだよね。隠れたトークンがたくさんあるんだよ。でもウェブ検索はマジで大きいよ。思ったよりずっと多くのトークンを使ってるはず。
今日、事前告知もなしにいきなりこれが出たんだけど。Anthropicどうなってんの?
"話題に深く入り込んでいると非常にイライラする"
研究リクエストで最初の質問をしただけでこのメッセージが出るから、深く入り込む以前の問題なんだよね。トークンをたくさん消費するのはわかるけど、フォローアップの質問すらできないってどうなの? Web検索やディープリサーチなしの普通のチャットでも同じことが起きたよ。
MCP(マスターコントロールプログラム)はいくつ繋いでる? 個人的なプロンプト(設定にあるマスターのやつ)はどんな感じ? プロジェクト中?それとも新しいチャット? プランのレベルは?
2、3回メッセージを送っただけで出たことが一度あるな。その時はかなり大規模なリサーチチャットで、Web検索の結果でコンテキストが詰まってしまったんだと思う。
個人的なゲームプロジェクトを始めたんだけど、ClaudeがLLMを使ったコーディングに最適だってわかったんだ。 まだゲームはそれほど複雑じゃないけど、コードファイルはたくさんあるのは普通のこと。 今はClaudeを選んだことを後悔してるよ。 ChatGPTなら、コードの修正とかやり取りがもっと必要だったとしても、制限に達することはないんだ。 Claudeだと金曜日まで待たなきゃいけない。 このプロジェクトはそのままにして、ChatGPTとGeminiで比較してみるつもり。 明らかにひどい制限にがっかりだよ。少なくとも競合他社と比べるとね。 それが残念。
参照したいセッションの最後のプロンプトを含めながら、過去のチャットを探すように明示的に依頼すれば、ほとんどの場合、ある程度の機能的なコンテキストを取り戻せるよ。
Web検索がコンテキストウィンドウに含まれてるんだと思う。 1〜3回のWeb検索を含めて3〜5回くらい応答したら制限に達したよ! しかもディープダイブでもなかったのに!!
このことについて先日文句を言ったら、低評価されたよ(笑)。 でも、マジでクソだよね。 デスクトップアプリにはCCのようなコンパクトな機能があるべきだよ。
確認すべきことの1つは、アクティブなコネクタ/MCP。 気をつけないとコンテキストをすぐに食いつぶしてしまう可能性があるよ。
マジで体験が悪くなったわ。3つ質問しただけで最初からやり直しになるから、サブスク解約した。ここ1ヶ月くらいでどんどん悪化してるし。
悪化してんのに値段も高くなるって、ビジネスとしてどうなのよ?
マジで残念。Claudeの方が好きだけど、この制限とコンテキストを保存できないせいで、結局ChatGPTをメインで使うことになっちゃった。
APIの料金モデルに合わせて移行してるんじゃないかな。100万トークンで15ドルだから、Proプランだと月150万トークンくらいになるんじゃない?
Claudeみたいに、容量が足りなくなってきたら教えてくれて、コンテキストを圧縮して継続できるようにしてほしい。
誰かが言ってくれて嬉しいよ! Claudeにウェブスクレイパーを手伝ってもらいたくて、もう3回目の会話だよ! まだ全然終わってないのに。まるでプロジェクトのステップごとに1つの会話が必要みたい。ドキュメントは共有してるんだけど、俺はあんまり技術に詳しくないから、ウェブブラウザ版でチャットしてるんだ。悲惨なのは、最初の時はめっちゃうまく行って色々終わらせられたのに、また最初からやり直しで、全部説明し直さなきゃいけなくて、何も終わらなかったこと。まあ、彼のせいじゃないんだけどね、特定の要素のトラブルシューティングをしてたから。とにかく、もっと長く話せたら色々終わらせられるのに!
それに、利用制限もね。今日上限に達しちゃって、明日の夜までリフレッシュされないんだ。マジありえない。
俺も同じ。無料モードだと4時間ごとに1〜2回しかリクエストを送れないのも相まって、使うのをやめた。デバッグがマジで大変になる。
LLMは全部、コンテキストが増えるにつれてクソになる。なぜかClaudeは特にその影響を受けやすいんだよね。
ハードリミットをかなり下回ってても、使い物にならなくなることが多い。
それに、モデルはコンテキストが増えるほど、実行に必要なリソースが大幅に増える。ユーザーにコンテキストをクリアさせたいのは当然だよ。だって、コンテキストをクリアすれば、はるかに少ないコンピューティングリソースで、ずっと良いレスポンスが得られることが多いから。
実際にトークンを消費してるものが何なのか、誰か知ってる? LCRがトークンを消費してるのは知ってるけど、トークン消費のカテゴリを把握したことがないんだよね。何かがバックグラウンドで動いてるみたいだ。
どれだけ食わせるかによるんじゃない? 俺は最初のメッセージだけでフルコンテキストに到達しちゃったし、最大x20プランだよ(笑)。
有効にしてるMCP/コネクタを確認してみ。特定のメッセージに必要なものだけを有効にするといいよ。