HN🔥 73
💬 16

Claudeに「なぜ」を教え込む:AIの推論能力を劇的に高めるプロンプト術

pretext
25日前

ディスカッション (7件)

0
pretextOP👍 73
25日前

Claudeに物事の背景や意図(Why)を理解させるためのアプローチについて共有します。AIに単に答えを出させるだけでなく、思考プロセスを構築させることで、アウトプットの精度は飛躍的に向上します。

1
soletta
25日前

これで、アライメントやトレーニング全般が、他の何よりも教育学的な問題に近いという疑念が強まった。限られたトレーニングデータの中で、どうやってモデルに意図した挙動を引き出すか。教育の専門家に聞くのが正解かは分からないけど、まずはそこから始めるのもアリかもね。

2
bicx
24日前

余談だけど、Anthropicは一目でそれと分かる独特のアートスタイルを確立するのがうまいよね。

3
roenxi
24日前

哲学の教訓の一つに、特定の価値体系を採用した途端、ほとんどの哲学者は不道徳になるか、無意味で些細な議論に巻き込まれるというのがある。この種のアライメント研究が面白いのは、AIの世界で哲学の歴史を猛スピードでなぞり直そうとしているように見える点だね。今後どうなっていくか楽しみだよ。あと、ついていけてない人のために補足すると、モデルが内部で倫理的な判断をどうモデリングしているかを探る研究[0]も進んでいる。主な目的は、アライメントのサポートというより、オープンモデルから意図的に倫理観を取り除くことにあるみたいだけどね。結局のところ、モデルはクエリを拒否する際に「これはどのくらい道徳的か?」という軸を内部に学習していて、それを特定して操作することが可能なんだ。

[0] https://github.com/p-e-w/heretic

4
justonepost2
24日前

もし仮に、Anthropicが定義する「有能」かつ「アライメントが取れた」高機能なモデルを作れたとして、それが労働と資本の価値を完全に無効化して、世界的な貧困と不平等の暗黒時代をもたらしたとしたら、それは依然として「アライメントが取れている」と言えるのか?もし答えが「イエス」なら、そもそも僕らのアライメントの定義がダメってことになるよね。

5
unchocked
24日前

これで僕の中のp(doom)が少し下がったな。
首尾一貫した原則について推論させる強化学習が、実際の状況下での原則に基づいた行動にバイアスをかけるというのは理にかなっている。
道徳的な解釈可能性についても、光を当ててくれるはず。

6
zozbot234
24日前

注目すべきは、この結果がClaudeだけでなく、より広く一般化できるという点だよ。Anthropicはオープンウェイトモデルに対しても「Model Spec Midtraining」という非常によく似た研究を行っている(https://arxiv.org/abs/2605.02087 )。また、多様な「価値観」を示すためにファインチューニングされたモデル(Llama 3.1 8B, Qwen 2.5 32B, Qwen 3 32B)も公開していて、あるトレーニングコンテキストで価値観を引き出すことが、関連の薄い質問に対するモデルの回答にどう影響するかを実証している(https://github.com/chloeli-15/model_spec_midtraining )。以前のNLA論文に続いて、こうやってオープンウェイトコミュニティとのやり取りが続いているのはすごく刺激的だね!