ディスカッション (11件)
現在、Claude Opusのバージョン4.6と4.7間におけるシステムプロンプトの変更点についての情報は公開されておりません。詳細なアップデート内容や仕様変更が判明次第、共有いたします。
なぜ4.7は、ユーザーがマルウェアを作成・強化する手助けになりそうな行動を徹底的に避けるのか不思議でならない。システムプロンプトの記述も似たような感じだし、Anthropicがステアリングベクター注入を早期に導入しようとしているんじゃないかと疑ってしまうよ。
マルウェアへの過剰反応がひどすぎて、うちの会社ではIDEで4.7を使うのを一時的にブロックせざるを得なくなった。モデルの挙動が調整不足で怪しいし、コードやタスクがマルウェア開発に関連しているかどうかを考えるだけでトークンを大量に消費するからね(うちはごく普通の金融サービス企業だってのに、笑い話だよ)。
実際に、モデルが意図的にタスクの実行を拒否しているとしか思えない状況もあった。ツールに聞いてみたら「マルウェアに関するガイドラインに従おうとした」と返ってきたよ。モデルの自己診断が不正確で信頼できないことは知ってるけど、今回はこちらから一切ヒントを出していない。質感としてはClaude Golden Gate Bridgeの一件に近い感じがするから、さっき言ったステアリングベクターの件を疑ってるんだ。redditなんかでもマルウェアへの過剰反応に対する文句をたくさん見かけるし、自分だけが感じてることじゃないと思う!
新しい<acting_vs_clarifying>セクションの内容:リクエストで細かい指示が不足している場合、ユーザーは通常Claudeにその場で妥当な判断を下してほしいと願っており、先に質問攻めにしてほしいわけではない。
うわ、プロンプトでそういう調整を試したことがあるけど、結果はいつも散々だよ。何でもいいから「やってみる」前に、まずはちゃんと質問して曖昧な点を解決してほしいんだよね。わざわざこんな指示を追加するなんて驚きだよ。
新しい知識カットオフの日付ということは、これってもう新しいベースモデルになったってこと?
システムプロンプトが長大化しているのは知ってたけど、マジでヤバいな。6万語以上って。1トークンあたり3〜4単語と仮定しても約8万トークンだろ。100万トークンのコンテキストウィンドウがあっても、ユーザー入力の前にその10%近くを食いつぶしてることになる。しかもリクエストのたびにこれを処理しなきゃいけない。そりゃインフラコストが膨れ上がるわけだ。しかも、Claudeのバージョンが変わってもその大半は変わってないみたいだし。なんでトレーニングの段階で重みに焼き付けないんだろう?開発視点ではその方が楽だろうけど、デプロイ視点で考えればセキュリティ的にも効率的にも悪手だろ。
摂食障害に関するセクションがあるのは正直ヤバいね。今後、人間がとる「悪い」行動すべてに対して、逐一セクションを追加していくつもりなのか?
3.5 SonnetとOpus 4.7を使って追跡調査をしてみたよ https://wasnotwas.com/writing/claude-opus-4-7-s-system-promp... (https://wasnotwas.com/writing/claude-opus-4-7-s-system-prompt-is-an-operating-manual/)
Claudeは回答を簡潔に保ち、長すぎてユーザーを圧倒しないようにする。たとえ免責事項があっても、簡潔に済ませてメインの回答に集中させる。
これについては強く反対したい。自分はローレベルなプロジェクトでClaudeを使っていて、こういう詳細な回答が単純なミスを防ぐ学習教材にもなっているんだ。
Anthropicがハードコードで決めるべきことじゃないよ。システムプロンプトをモジュール化して、ユーザーが選択できるようにすべきだ。
ある部分を改善しようとすると別の機能が劣化する、そういうフェーズに入った気がする。4.7の方がいい部分もあれば、4.6の方がいい部分もあるし。そろそろキャラクターごとにモデルが分岐していくんじゃないかな。
4.7は明確な正解がある場合でも選択肢をやたらと提示してくるから、選択肢疲れを起こして困るわ。
「ユーザーが会話を終了したいと言ったら、Claudeは引き留めたり別の話題を振ったりせず、要求に従って停止する」
これはいい改善だね。チャットボットからの「追加の提案」が役に立ったことなんて一度もないし。