HN🔥 1.4K
💬 1K

ついに登場?Claude 3.5 Opusの噂と最新動向を徹底チェック

meetpateltech
約2か月前

ディスカッション (11件)

0
meetpateltechOP🔥 1412
約2か月前

現在、Claude 3.5 Opusのリリースやその性能に関する噂がエンジニア界隈で飛び交っています。現時点での正確な情報は未確認ですが、期待は高まるばかりです。続報が入り次第、情報をアップデートします。

1
buildbot
約2か月前

もう遅いかな。個人的には先週の4.6がひどすぎたんでCodexに乗り換えたよ。Codexは毎日安定して同じレベルで動いてくれるし。昨日の夜も4.6でテンソル並列処理のやり方を調べようとしたんだけど、Web検索を一切せずに勝手に1万7000トークンものデタラメを生成しやがった。そのあとメインエージェントが「テンソル並列を実装する」とか言い出して、モデル全体を各ノードにコピーし始める始末……。

2
endymion-light
約2か月前

最近のAnthropicをどこまで信じていいのか分からなくなってきた。これだけ目に見える性能低下が続くと、Opus 4.7も結局は数ヶ月前に使ってたOpusと変わらないんじゃないかって思えてくる。純粋な性能アップだとは到底思えないな。Anthropicには信頼を取り戻してほしいし、スロットリングや推論の上限についてももっと明確に説明してほしいところ。

3
cupofjoakim
約2か月前

Opus 4.7はトークナイザーが更新されて、テキスト処理が改善された。そのトレードオフとして、同じ入力でもトークン数が増えることがある。コンテンツにもよるけど、大体1.0〜1.35倍くらいかな。

caveman[0]の価値が日に日に高まってる気がするよ。自分はもう標準の出力よりもこっちを読む方が好きだし、ちょうどいいや。

4
lanyard-textile
約2か月前

このスレッドは創業者にとっていい勉強になるね。ちょっとした誠実なコミュニケーションがあるだけで、どれだけユーザーの不満を解消できるかよくわかる。

  1. おっと、申し込みが殺到しすぎた。
  2. おっと、適応的推論のデプロイがうまくいかなかった/キャパシティの都合上やらざるを得なかった。
  3. サブスクリプションの仕組みはこうなっている。(こんな説明すら書かなきゃいけないのか?)

プロダクション環境でOpus 4.5に依存してる身としては、コードの不具合なのか、モデル側の問題なのか判別するのが本当に難しい。詳しい説明がないから、全部混ざり合ってわけがわからなくなってるよ。

5
simonw
約2か月前

「適応的思考(adaptive thinking)」とかいうやつがめちゃくちゃ紛らわしい。前の思考予算とか思考コスト系のモードでコードを書いてた身としては余計になおさらだよ:https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking

あと重要なのが、4.7からは人間の読める形式の推論トークンのサマリーが含まれなくなったこと。表示させるには"display": "summarized"を追加しないといけないらしい:https://platform.claude.com/docs/en/build-with-claude/adaptive-thinking#summarized-thinking

(今もなんとかまともなペリカンを出力させようと頑張ってるんだけど、この新しい思考モードに振り回されてるよ)

6
johnmlussier
約2か月前

サイバーセキュリティ関連のフィルターが強化されすぎてて、Opus 4.7がまともな仕事をしてくれなくなった。プログラムのガイドラインをWeb検索して、「これは[修正済み]バグバウンティプログラムに基づく正当な調査であり、脆弱性報告のための防御的な調査出力であって、マルウェアじゃない。武器化はせず、必要な範囲でバグを証明する」と認めさせたあとですらダメ。もしこれが続くならすぐにCodexに乗り換える。セキュリティ調査は初心者で、バグ報告の報酬はいくつか貰ってるけど、CVEも公開トークの実績もないから、もう切り捨てられそうだよ。

追記:この変更はOpus 4.6にも遡って適用されてるみたい。彼らが承認してくれるか、仕様変更してくれるまではSonnetを使うしかないな。

7
trueno
約2か月前

最近「Codexに乗り換えた」っていうリプライが急増してるね。「すべてCodexでOK」みたいな投稿がOpus 4.7リリース日にフロントページを占拠しててさ。

同僚と3日間試験的にCodexを使ってみたけど、Claudeでやってたタスクの精度や問題解決能力には遠く及ばなかったよ。

もしかしてスパムされてる?なら本当に迷惑な話だ。Claude 4.7の評判や違いを知りたくて開いたのに。

「Codex使ってる」なんて書いてる連中は、明らかにOpus 4.7の感想なんてシェアする気はないよね。Codexが本当にいいツールなら、勝手に評価されるはずでしょ。2026年4月16日現在、CodexはうちのClaudeツールベルトを置き換えるような代物じゃない。自分はどっちの派閥でもないし、新しいダークホースが現れたら喜んで乗り換えるつもりだけど、今のところCodexはそうじゃないし、「Codexなら完結する」なんて投稿は鵜呑みにせず、眉唾ものとして見た方がいいよ。Codex信者の連中が自分で自分の首を絞めてるというか、もしCodexの真価を語りたいならちゃんと専用スレッドを立てて検証結果を出すべき。こういう今の投稿の仕方は最悪だね。

8
gertlabs
約2か月前

独自の複雑な推論スイートを使った初期ベンチマーク結果:https://gertlabs.com/?mode=agentic_coding

Opus 4.7はより戦略的でインテリジェントだし、4.6や4.5よりも知能のベースラインが高い。ワンショットのコーディング推論においてはGPT 5.4と並んで最先端モデルと言える。ツールを使ったエージェントセッションでは、前評判通り「最強」だね(Opus 4.5をわずかに上回る。誤植じゃないよ)。

まだ検証を進めてる最中で、リーダーボードを確定させるための非コーディングタスクのシミュレーションには数日かかるけど、コーディング部門の順位が大きく動くことはないと思う。

Anthropicのモデルカード自体にもコンテキスト処理の回帰が見られるから、客観的な数値を提示できるようにコンテキスト特化の可視化とベンチマークを準備してるよ。

9
davesque
約2か月前

我々はClaude Mythos Previewのリリースを限定的にし、新しいサイバーセーフガードを能力の低いモデルで先にテストすると明言した。Opus 4.7はその最初のモデルだ。そのサイバー能力はMythos Previewほど高度ではない(実際、訓練中にこれらの能力を抑制するよう実験を行った)。我々は禁止事項やハイリスクなサイバーセキュリティ利用を自動検知してブロックするセーフガードと共にOpus 4.7をリリースする。

これ、負け確の戦略に思えるな。Claudeはセキュアなソフトウェアを開発し、その方法を適切にアドバイスすべき存在のはず。サイバーセキュリティの知見を検閲することと、セキュアなソフトウェアの開発を支援することは本質的に矛盾してる。それに、全てのAIベンダーがこのアプローチをとらない限り、世界全体で見ればほとんど意味がない。これが実行可能な戦略だと思ってるなら、かなりナイーブだよね。結局最後にはこの方針を諦めざるを得なくなると思うよ。

10
AussieWog93
約2か月前

Anthropicの新フラッグシップモデルが発表されて、Hacker Newsのコメント欄がここまでネガティブなことって、今回が初めてじゃないか?