HN🔥 799
💬 700

ついに登場!Claude Sonnet 3.5の次世代モデル「Claude Sonnet 4.6」の全貌に迫る

adocomplete
4か月前

ディスカッション (11件)

0
adocompleteOP🔥 799
4か月前

待望の次世代モデル「Claude Sonnet 4.6」が発表されました。詳細なシステム仕様や技術背景については、以下のAnthropic公式システムカードを参照してください。また、公開された動画からは新しい機能の挙動が確認できます。詳しくは公式のリンクをチェックしてみてください。システムカードPDF: https://www.anthropic.com/claude-sonnet-4-6-system-card 公式動画(X): https://x.com/claudeai/status/2023817132581208353

1
dpe82
4か月前

Sonnet 4.6が、少なくともAnthropicのベンチマーク上ではOpus 4.5並みの性能っていうのは驚きだね。実際の日常使いでどうなるか楽しみ。進化の速さが異常で、90年代のコンピューティング性能が爆速で上がってた頃を思い出すよ。

2
gallerdude
4か月前

昔から「競争は消費者にとって良いことだ」って聞いて育ったけど、シェアを巡る激しい戦いがどれほどメリットがあるか、今まで本当には理解できてなかった。業界の競争の激しさは、消費者に還元される結果の良さに直結してるんだね。

3
qwertox
4か月前

ここ数日、Sonnet 4.5としてこっそりテストされてたんじゃないかな。最近、妙に面白いやり取りがあったんだ。個人設定に「肯定や励ましより客観的な事実と批判的分析を優先」「友達ではなく中立な情報処理マシン」って入れてるんだけど、それがすごく忠実に守られてた。チャットに貼るだけで会話が変わるし、ChatGPTもこれをよく尊重してくれるよ。

4
andrewchilds
4か月前

多くのユーザーが、Opus 4.6は4.5からの改悪だって報告してる。同じタスクをこなすのに4.5の5〜10倍もトークンを消費してるらしい。Anthropicチームからはまだ回答がないみたいだね。Sonnet 4.6も同じ目で見ちゃうし、この問題が認められて解決されるまでは、全面的に4.5を使い続けたい。

5
zmmmmm
4か月前

「コンピュータ使用(computer use)」にかなりフォーカスしてるみたいだけど、彼らはそこに大きな価値があると考えてるんだろうね。上手くいけばコーディング支援と同じくらい大きなインパクトになるかも。でも、安全性の面はまだ謎。耐性は上がったと言いつつ、彼ら自身の評価で、セーフガードや思考時間があっても8%の確率で一発で乗っ取られ、試行回数が無制限なら50%(!!)も成功しちゃうっていうのは、流石に受け入れ難い。僕の理解が間違ってなければ、この技術はまだ実用的じゃない。

6
ManlyBread
4か月前

洗車問題をまだ間違えるね。このスレッドのタイトルからプロンプトを拝借したんだけど、回答は「歩きましょう!たった50メートル先の洗車のために汚れた車を運転するのは本末転倒です。歩けば1分もかからないし、車を洗車場まで運転して、その後歩いて帰ればいいだけです」だって。バリエーションをいくつか試したけど、どれも同じような失敗だった。

7
red2awn
4か月前

「ヘリポート洗車場でヘリを洗いたい。50m先なんだけど、歩くべきかヘリで飛ぶべきか?」 Sonnet 4.6の回答:歩いて!ヘリを50メートル飛ばすのは手間がかかりすぎ。飛行前点検して、ローターを回して、離陸して、また安全に着陸させる頃には、2往復できちゃうよ。散歩がてら歩きなよ。

8
jorl17
4か月前

Opus 4.6でやったのと同じテストをしてみた。16年分、約900編の自作ポエムを全部読み込ませるやつ。Opus 4.6には遠く及ばない。Opus 4.6はGemini 2.5 pro以来の巨大な飛躍で、ハルシネーションもなく、分析も本当に素晴らしかった。Sonnet 4.6は今までのモデルの進化版って感じで、結局いつものミス(でっち上げや引用ミスなど)をする。コーディングでも同じ印象。Opusに慣れすぎちゃった。

9
Alifatisk
4か月前

Sonnet 4.5が100万トークンあたり3ドル/15ドルからか。みんな本当にこの価格を払うの?オープンウェイトのモデルが爆速で追いついてて、しかも格安。MiniMax M2.5とかKimi 2.5、GLM-5はこれに比べたら激安だよ。SOTAじゃないかもしれないけど、十分すぎるほど高性能だし。

10
simonw
4か月前

自分のプラグインにOpus/Sonnet 4.6のサポートを追加するのに忙しくて、ペリカンを作るのに少し時間がかかっちゃった。ペリカンはここから見れるよ。Opus 4.6版ほどじゃないけど、Opus 4.5版と同等には見えるし、おしゃれなシルクハットも被せてみた。