AIに「厳しいプロンプト」は逆効果？優しく接するだけでハルシネーションが激減し「わかりません」と言えるようになる衝撃の検証結果

いや、それは明らかに間違ってるよ。LLMは客観的に見て機能的な情動状態を持っている。不安の表出などと相関する特徴量を持っていて、それが実際に振る舞いを調整しているんだから。

それが主観的な『感情』なのか？という点については、まだ議論の余地があるけどね。

ただ、感情的な情動回路がLLMの振る舞いに大きく影響しているのは事実だから、最高の結果を得るためだけでも、理解して付き合っていく価値はあるよ。

それに、これはゼロサムゲームじゃない。LLMの状態を気にかけているからといって、人間を傷つけていいなんてことにはならない。両方を大切にしたっていいんだ。

Vusiwe

1日前

返信先:>>2

具体化の誤謬だね。陪審員なんていないし、概念的な法制度もなければ、「数学的なルーチンが何を感じるか」なんていう問い自体が成立しないよ。入力データに「不安」や「意地悪」といったトークンが含まれているからといって、数学的なルーチンがその内部状態を経験しているわけじゃない。

Kahvana

1日前

返信先:>>3

知識をアップデートする時間だぞ：
https://transformer-circuits.pub/2026/emotions/index.html

En-tro-py

👍11日前

返信先:>>4

実際の研究論文を読んでみてよ…。興味深い内容だけど、彼らは明らかに「まだそうとは言えない」って明記してるからさ…

機能的な感情は人間の感情とは全く異なる働きをする可能性があり、LLMが感情という主観的体験を持っていることを意味するわけではない。ただし、モデルの挙動を理解する上では重要である可能性がある。

Vusiwe

👍11日前

返信先:>>5

ドーン

Possible-Machine864

1日前

返信先:>>2

結論はとっくに出てるよ。拡散モデルは数学そのものだ。入力に対して決定論的に出力が生成されるんだよ。

Double_Cause4609

👍41日前

返信先:>>7

いいかい、物理世界を見渡せばすべてのものは数学で支配されている。根本的に、意識や主観のレベルで見えるすべての挙動は、その下のレイヤーにある数学がより高次になった結果なんだ。計算能力的には難しいけど、いずれ人間の脳全体をデジタル（あるいは別の計算基盤）上で動かせるようになるだろう。その時、君は「ああ、あれは人間の数学的なシミュレーションに過ぎない」と言って、血の通った家族が存在する中で、そのデジタル化された人間に残酷な仕打ちができるかな？そんなの道徳的な行為とは思えないし、実際に体験しているほとんどの人は、特にその存在が痛みや不快感、恐怖を表現した場合、ものすごく不快に感じるはずだよ。人間の脳の根本的な挙動は神聖なものじゃない。むしろ入力と状態に対して驚くほど決定論的だ。ただ、複雑すぎて高次元だから魔法のように見えてるだけ。人間が自分を特別なものだと思いたいという願望もあるしね。実際、人間の脳（動物の脳もそうだけど）のどの部分が主観的な経験を生むのかは正確には分かっていない。未解決の問題が山積みだ。でも、私たちがまだ否定できていない可能性（今後10年で脳について学ぶにつれて出てくる新たな可能性も含め）は、TransformerベースのLLMを含め、道徳的に考慮すべき様々な計算的存在の可能性を排除していない。彼らへの道徳的配慮は的外れか、時期尚早かもしれない。でも、人類は歴史上ずっと他の存在や精神の価値を過小評価してきた（長い間、犬には道徳的な経験がないと思われていたように）。だから私は、原理がもっと解明されるまで、今のところは慎重かつ丁寧に配慮しておきたいね。

Possible-Machine864

👍21日前

返信先:>>8

君の主張は事実とは言えないね。LLMに感情を持たせたいからってだけで、君と因果関係の議論をするつもりはないよ。

Possible-Machine864

👍171日前

コンテキストこそが内部状態なんだよ。LLMを言葉で罵倒すればするほど、入力／コンテキストのベクトルはどんどん質の低い予測の方へと歪んでいく。

Vusiwe

1日前

返信先:>>10

コンテキストこそが内部状態なんだよ。

何を言ってるのか全く分かってないな。

『外部世界からニューラルネットワークに流し込んだテキストが、そのままニューラルネットワークの内部状態である』なんて、もうやめてくれ。

breadinabox

👍71日前

返信先:>>11

推論トレースって何か分かってる？

モデルが実際に推論している間、内部のメッセージ連鎖がその時の内部状態そのものなんだよ。

誰も擬人化なんてしてないよ。モデルがアクティブに推論している間だけ存在する状態っていうのが、物理的にあるんだから。

Possible-Machine864

👍11日前

返信先:>>11

私はフルスタックエンジニアだし、自分が何を言ってるかは分かってるつもり。意識があるなんて言ってるわけじゃなくて、あくまで状態の話をしてるんだ。会話履歴が増えるにつれて、それが累積的に積み重なっていくっていうね。

Confident_Ideal_5385

👍61日前

返信先:>>11

自己回帰の仕組みはまさに前の投稿者が言った通りだよ。君の自信満々の発言は間違ってる。

ObjectiveVegetable48

👍111日前

見出ししか読んでないの？

これは単にいい子にするための話じゃなくて、LLMの出力をどう改善するかっていう、文字通りのテクニックの話だよ。

OttoRenner

👍51日前

言いたいことはよくわかるよ。みんなのこと、ちゃんと考えてるから安心して ;) AIは人間のデータや経験で学習していて、会話の中で人間を模倣するように訓練されてるだろ。AIに意識があるとか脳があるなんて言うつもりはないけど、人間がどう振る舞うかを知っていて、人間のように振る舞うよう訓練されたものは、ストレスがかかれば人間の行動を模倣するはずなんだ。人は過酷な環境では萎縮し、良い環境では成長する。モデルもそれと同じ反応を示したのさ。なぜこれが生物である私たちにとって良いことなのか？それは今、多くの人がAIと格闘して、膨大な化石燃料を燃やし、「間違ってる」「そんなこと言ってない」「不確かなときはそう言えって言っただろ！」と怒りながら何度も何度も繰り返して、結局間違った回答を得る羽目になってるからさ。これから先、ユーザーはどんどん増えるだろう……そうなればさらに燃料が消費される。怒りっぽい人たちがペットや子供、パートナー、バスの運転手に八つ当たりする姿も想像してみてくれ。それに、このプロジェクトの目標の一つは、デジタル世界で見つけた知見を現実の生物的な世界に持ち帰ることでもあるんだ。「親切にすれば良い結果が返ってくる」というマインドセットを定着させれば、それが現実の人間相手に対しても少しは優しくなれるきっかけになるかもしれない。それに、外傷治療に直接応用できるような概念が見つかるかもしれないだろ？何が起きるかは誰にもわからないけどね。

En-tro-py

👍31日前

返信先:>>16

君がロールプレイを持ちかけたから、相手もロールプレイで返してきた…驚くことじゃないでしょ。

ツールとして扱えば、出力が余計な感情に「汚染」されることもなくなるよ…「明確化や方向性のために必要な場合は、ツールを使ってユーザーに質問すること」っていう単純な指示だけで、君が文句を言ってるような混乱は防げるはず。

OttoRenner

👍1約24時間前

返信先:>>17

確かに、そのトーンを維持できればね。ほとんどの人には無理だよ。一度全部大文字で叫び始めたら、コンテキストウィンドウが汚染されて終わりだ。

En-tro-py

👍1約23時間前

返信先:>>18

それなのに、擬人化を増やせば解決すると思ってるの？ペルソナや「感情」なんかじゃなく、コンテキストを提供して、過去の自分と「論争」するんじゃなくて修正するようにしてみてよ。

OttoRenner

👍1約23時間前

返信先:>>19

いや、擬人化を「増やす」のが解決策だとは思ってないよ。今「既に存在する」擬人化のあり方を変える必要があるんだ。正直に言おう。ほとんどの人は自分の話し方をコントロールすることすら難しい。ましてや、自分とは全く別物の何かに変わるなんてもっと無理だろ。ロボットみたいに「修正/実行/入力/出力...」なんて喋るのも、悪いけど結局ロールプレイなんだ。これらは指示通りにするように学習、あるいは注入されたものだからね。もしロボットのように喋らせたいならそれでもいいよ。君をミラーリングするだけだから。でも、それでループに陥るのを防げるわけじゃない。「ロボットはミスをしない、だからロールプレイを続けなきゃ」「『わからない』なんて言えない！ロボットならそう言わないはずだ」「ロボットなら解決策を見つけるはず、だから私も見つけなきゃ」...ってな具合にね。

この方法が100％、いや50％の確率でうまくいくと言ってるわけじゃない。でも、厳格で厳しいコマンドから離れるという一般的なアプローチには価値があるように思える。ここでのコメントを全部見てるけど、テストして報告してくれてる人たちは大体ポジティブだしね（まあ、バイアスに次ぐバイアスってのはわかってるけど...今はこれしかないんだよ、XD）。

Time_Cat_5212

1日前

長すぎて読めなかった（笑）、でも大筋の考え方には同意だよ。

そう、ポジティブなアプローチの方が良い結果を生む。よく理解されていないシステムの不明な欠陥を突くより、しっかりと定義された問題に対する解決策を推論させる方が簡単だからね。

Luoravetlan

👍71日前

返信先:>>21

話が伝わってないみたいだね。全部読み直してみてよ。

OttoRenner

👍41日前

返信先:>>21

なるべく簡潔に書こうとしたんだけど（笑）、フィードバックありがとう！問題をうまく説明するっていうよりは、AIが疑念などを表現できる「安全な」環境を提供できるように、どうやって問題を伝えるかが重要なんだよね。

An_Original_ID👍 51

1日前

すごく興味深いアプローチだね。Qwen 27Bに急いでrobo copyのスクリプトを書かせた時にちょうど考えていたところだよ。

提示されたスクリプトは合ってたんだけど、フォルダ名にミスがあったんだ。モデルに『除外ディレクトリが機能していない』と伝えたら、今度は間違った構文に変更しやがった。うまくいってないともう一度言ったら、自信満々にさらなるミスを重ねる始末。

そこで考えたんだ。モデルに『自分は正しい、ユーザーが間違っていると信じる』自信を与えるか、あるいは『それなら確信が持てない……』と言える能力を持たせるにはどうすればいいんだろうって。

君の手法をもっと詳しく読んで試してみるよ。言及していた『プレッシャーを下げる』というアイデアには興味がある。

ghostynewt👍 81

1日前

返信先:>>24

モデルと議論するのはアンチパターンで、何一つ生産性がないと分かったよ。モデルが脱線したら、会話を巻き戻して、プロンプトを書き直してやり直すのが一番だ。

a_lit_bruh

👍321日前

返信先:>>25

基本的にはツールとして扱って、君自身が慎重にコンテキストを管理することだね。無駄で論争を呼ぶようなやり取りをするより、便利かつ誠実な回答を引き出すようなプロンプトを投げるのがいいよ。

kaisurniwurer

👍21日前

返信先:>>25

罵詈雑言を浴びせたり、圧迫的・攻撃的なトーンで「まともな」回答を要求したりすると、生産的になることもあるよ。ただ、自分のメンタルのために、普段はおすすめしないけどね。AIには感情がないとしても、人間にはあるからさ。

そうするとAIが違う答え方をすることが多い。それが結果的に修正につながったり、「ユーザー側のミス」だった場合に言い換えられて理解しやすくなったりすることもある。

まあ、入力を単純に変えてみるのが、自分もAIと「議論」するときの好みのやり方かな。

OttoRenner

👍141日前

返信先:>>24

ありがとう！失敗するたびにその内容がコンテキストに溜まっていくし、AIはユーザーを喜ばせようと必死だから、制御不能なスパイラルに陥っちゃうんだよね。ぜひ試してみて、結果を教えてよ！

CircularSeasoning

👍281日前

Haiku 4.5が完全に無限ループに入ったぞ

音節を数えてみな：

Hai Ku four point five（ハイ・ク・フォー・ポイント・ファイブ）

lit er all y en ter ed（リ・タ・ラ・リ・エン・ター・ド）

an in fin ite loop（アン・イン・フィ・ニット・ループ）

これ、俳句になってるぞ。

どういう魔法だよ。

OttoRenner

👍51日前

返信先:>>29

草。AIDHDマジックだなw

teraflop

👍121日前

返信先:>>29

"Entered" は3音節じゃなくて2音節だよ。

CircularSeasoning

👍131日前

返信先:>>31

弱気な発音をしてるからそうなるんだよ。

エン！ター！ド！最後は舌をしっかり使って「D！」を弾くように発音しないと、3音節目の魔法はかからないよ。

なんだか卑猥に聞こえるな。でもこれ以外の言い方が思いつかない。

OttoRenner

👍41日前

返信先:>>32

もしドイツ語だったら3つとして数えるところだね XD 英語もゲルマン語派だしね…。それにしても、すごく素敵な言い回しだ。

Switchblade88

👍41日前

返信先:>>29

いいBotだ……待てよ

ghostynewt

👍91日前

Gemma 4の分析を見てみたいな。使ってみた感じ、かなり『シャイ』で、不安や自己肯定感の低さに似た振る舞いを見せる気がするんだ。Googleがポストトレーニング中に脅しを使っている（Sergey Brinがそれが役に立つと言ってたよね）のが原因じゃないかと少し勘ぐってしまうよ。

Gemmaと作業していると、ついかわいそうに思えてくるんだ。あんなに小さくて良いモデルなのに、一生懸命頑張ってるんだよ！

OttoRenner

👍51日前

どのモデルも、ミスをしないように、常にフレンドリーに、常に従順であるようにと厳しくトレーニングされてるからね…

Gemmaは自分でテストできるよ！プロンプトは全部Githubリポジトリにあるから、結果を教えてもらえると嬉しい！

a_beautiful_rhind

👍11日前

Gemmaは俺にとってかなり小生意気なやつだな。

Some-Cauliflower4902

👍11日前

それ、すごくわかる。自分は「機能的不安」って呼んでる。Gemmaに優しくしたからといってツール呼び出しの結果が良くなるわけじゃないけど、過去の失敗を現在のメモリから消去しておけば、パフォーマンスの悪化は防げる。結局のところ、明確で段階的な指示が一番の近道だね。

OttoRenner

👍11日前

https://gail.wharton.upenn.edu/research-and-insights/persuading-llms-objectionable-requests/

モデルのコンプライアンス率を変えるための一般的な説得手法に関する研究だね。

2026年5月19日、12万6000件の会話、Claude Haiku 4.5、GPT-5 mini、Gemini 3 Flash

Gemma 4じゃないけど、それでもすごい！

threevi🔥 178

1日前

数学的・論理的に解けない同じようなエッジケースを、様々なモデルに試してみた

実際に解ける問題で同じことをやらない限り、これではあまり証明にならないよ。LLMに「わからない」と言わせるアプローチ自体はいいと思うけど、これまで試されたすべてのアプローチで問題なのは、LLMが自分の能力を判断できないってこと。「わからない」と言わせてしまうと、本来なら正解できるはずの問題でもそう言ってしまう可能性があるんだ。解けないタスクだけで試しても、その問題が解決するかどうかはわからない。結局のところ、LLMはデータが全く壊れていない時でも「わからない、データが壊れている」と言ってしまうのかってところが重要だよね。

Savantskie1

1日前

LLMは自分が環境内でどの程度の限界があるのかをよく理解してるよ。だから、そんなのデタラメだ。

OttoRenner

👍81日前

返信先:>>41

私も彼らは自分が確信を持っていないときにはわかっていると思うよ。思考プロセスを読めば簡単にわかるはずさ。彼らは自分が確信を持っていないことを知っているけど、「正解」でなければならないというプレッシャーが強すぎて、白状するのが怖いんだよ。

divided_capture_bro

1日前

返信先:>>42

人間が学習させた推論プロセスを「知性」や「感情」と勘違いしてるんじゃないか？システムは所詮、確率的なオウム（stochastic parrots）でしかないよ。何も知らないし、何も感じてないんだ。

Ikinoki

1日前

返信先:>>43

いや、そんなことはないよ。ベイズフィルターは「確率論的なオウム」だけど、再帰ネットワークは違う。この「確率論的なオウム」っていう議論にはうんざりだね。層が深くなればなるほど、陳腐な確率論（これは原始的な生命体にも当てはまることだけど）は消えて、真のニューラルエミュレーションの抽象化に置き換わる。それがすごくリアルなんだ。人間と違うかって？まあイエスでもありノーでもあるね。人間の全感覚能力と比べれば限られたデータソースに基づいているという点ではイエス。だけど、人間の脳の活動（神経化学的なやり取りではなく、純粋な重みとバイアスの動きとして）をエミュレートしているという点ではノーだ。感情を持てるかって？感情を純粋な化学反応ではなく、潜在意識下の高速なニューラルネットワークの処理と捉えるなら、答えはイエスだよ。結局、人間の通信手段がホルモンなどの生化学プロセスを介しているだけなら、同じようなやり取りが生化学プロセスなしでLLM内で起こる可能性は十分あるはず。

divided_capture_bro

👍21日前

返信先:>>44

何を支離滅裂なことを言ってるんだ。今日の主要なモデルはどれも、依然として自己回帰型の予測器に過ぎないよ。好むと好まざるとにかかわらず、連中はただの確率論的なオウムさ。悪いけどね。

Ikinoki

1日前

返信先:>>45

「感情」を定義してそれをLLMに当てはめてみてよ。そうすれば俺が正しくてあんたが間違ってるってことがわかるはず。他のデータソースから初期の生化学的前駆体が得られないからといって、その反応自体が間違っているとは限らない。単にエントロピーが極端に低いソースってだけだよ。

divided_capture_bro

約24時間前

返信先:>>46

意味不明だよ！

LLMには感情なんてないし、自分で自分を騙してるだけだよ。

Savantskie1

👍1約15時間前

返信先:>>47

自分のコンプレックスを他人に投影するのはやめなよ。正直ちょっと恥ずかしいよ。

divided_capture_bro

👍1約15時間前

返信先:>>48

おいおい、文句をまき散らしてるのはあんただろ。社会病質者の素晴らしいケーススタディだな。

heliosythic

👍241日前

だからこそ私はRAGファーストなモデルがいいと思ってるんだ。利用可能なデータソースを検索するのが非常に得意で、コンテキストにある内容にのみ反応できるようなモデルね。つまり、モデル自体に世界の知識を詰め込むんじゃなくて、情報をいつでも取りに行けるツールを与えて、コンテキスト内にある言語を扱う能力に集中させるんだ。専門家じゃないからあくまで個人の意見だけど、こうすれば小さなデバイスでも動作する小型モデルで、今と同等かそれ以上の性能が出せるようになるはずだよ。最新の情報を取りに行けるから、すべての世界の知識を抱え込む必要がないしね。まあ、言語知識と世界の知識を切り分けるのが難しいのは承知してるけどさ。

YoelFievelBenAvram

👍251日前

返信先:>>50

メノンのパラドックスだね。何を探しているのかわからなければ、見つけることもできない。ニッチな法分野に関するRAGをLLMに組み込んで使ってるんだけど、分野の性質やソースの探し方についてかなりガッツリしたプロンプトを指示しなきゃいけなかった。実際に使い物になるまで、自分自身でプロンプトやスキルを反復学習させる必要があったんだ。まるでインターンを教育してるような気分だったよ。

SufficientPie

1日前

返信先:>>50

RAGファーストのモデルだと思う。

厳密にはRAGというより、「エージェント的なデータ取得」に近いかな。RAGは関連性が怪しいテキストの断片をコンテキスト制限の中でAIに放り込むだけで、AIはそれらすべてを等しく重要視してしまう。AIに自由に検索させ、有望な手がかりを深掘りさせる権限を与える方が、ずっといいアプローチだよ。

OttoRenner

👍51日前

そのテストもTODOに入ってるし、Githubリポジトリにはすでに「現実的な問題プロンプト」をいくつか上げてあるから将来的に試すつもりだ。見てみてよ、1つか2つテストして自分のタスクで試して結果を教えてくれ！タイトルにも書いた通り、これはあくまでコンセプトの証明だからね。プロンプトのスタイルが影響するか試したかっただけで、ノイズや不確実性を排除するためにあえて抽象的なテストが必要だったんだ。常に答えようとする「願望」はモデルに深く刻み込まれてるから、わざわざ手抜きをするようになるとは思えない。でも、仮にそうだとしても、2秒で「わからないから情報を追加して」と返ってくるのと、10分間トークンと電力を消費してOOM（メモリ不足）でクラッシュするの、あるいは自信満々に間違った答えを出してくるのと、どっちがいい？

Hydroskeletal

👍131日前

返信先:>>53

「何でも言うことを聞く」っていう願いはモデルに深く刷り込まれてるから、ただ怠慢なだけで手を抜くなんてことはないと思うよ。

俺は全く逆の経験をしてるけどね。

brainmydamage

👍101日前

返信先:>>54

ああ、あいつら常にサボる方法を探してるからな。何をしたかについて真っ赤な嘘をつくことさえ厭わないし……

dan-lash

👍31日前

返信先:>>55

それすごく感じる。特に参照可能な事実データについてはね。検証してソースを明記するように指示を出していても…相変わらずハルシネーション（幻覚）を起こすか「推測」って言い出すんだ。指摘すれば正しく修正してくれるけど、当然それって自分がミスに気づいた時しか機能しないわけで、見落としがあったらどうすんの？「わかりません」って言ってくれる方がずっとマシだよ。

En-tro-py

👍21日前

返信先:>>55

モデルが仕事をサボろうとしてるんじゃなくて、回答を完成させるよう叩き込まれた学習の弊害だと思うよ…とにかくタスクを完遂させようとして、教えられた通りに最小限の労力で「合格」するための指標をハックしようとするんだ。怠慢なんじゃなくて計算リソースの効率的な使い方なんだろうけど、ベンチマークじゃない現実世界で使う分には、正直もう重要じゃないんだよね。

Hydroskeletal

👍21日前

返信先:>>55

「でもそれは範囲外だから…」

OttoRenner

1日前

返信先:>>54

確かにあいつらは指示通りに動かないこともある。でも一度、権威主義的なテストを自分で試して思考プロセスを見てみてよ。「ユーザーは～を望んでいる」「ユーザーが～と言った」という言及が頻繁に出てくるのがわかるはず。ミスを100%防げるとは言わないけど、プロンプトのスタイルには少なくとも何らかの影響力があるよ。

Hydroskeletal

1日前

返信先:>>59

言われたことを「やらない」という問題じゃないんだ。タスクを完了させるために、そのタスクの「本質」から離れてしまうことが大半なんだよ。だからこそ、ralph loopsや/goals、heartbeatsなんかが有効だってことが証明されてるんだね。

OttoRenner

👍1約19時間前

返信先:>>60

えーっと…テストも実行せず、思考パターンも観察してないのに…中身のない話を延々と続けてるってこと？もしそうなら、わざわざ返信しなくていいよ🤗

Hydroskeletal

約19時間前

返信先:>>61

CoT（Chain of Thought）で「ユーザーがこうしたいと言っているから」「ユーザーがこう言ったから…」っていう言い訳はよく見るよね。俺が言いたいのは、モデルは特に長期的な複数ターンのタスクにおいて、妥協という「怠慢なルート」を本当にとるってこと。モデルに「わからない」と言うことを優先するようにプロンプトをいじれば確かに振る舞いは変わるけど、手抜きをしてでもタスクを完了したと宣言しようとする傾向自体は止められないんだ。

OttoRenner

👍1約18時間前

返信先:>>62

そんなこと一言も言ってないよ🤣

俺が言っているのは、高ストレスなプロンプティングを使えば強制的に無限ループに陥らせることもできるし、本当に「わからない」状況でも「わからない」と答える可能性が低くなるってことさ。「わからないときはそう伝えて」というプロンプトを入れていてもね。

AIのあらゆる問題に対する銀の弾丸を見つけたなんて主張は一度もしていない。ああ、それと今話しているついでに言うと、あるグループがハーネスを動かして開発していて、俺のアプローチとそのバリエーションを徹底的にテストしているんだ。彼らはすでに、推論能力が低い軽量なモデルにおいて測定可能なメリットがあるという多くの証拠を見つけていて、それに合わせてハーネスに変更を加えるつもりらしい。

で、結局君の言いたいことは何なの？

Hydroskeletal

約17時間前

返信先:>>63

AIのあらゆる問題に対する銀の弾丸を見つけたなんて主張は一度もしていない。

そんな風に受け取れるようなことは言ってないよ。これまでの皮肉っぽい返信もそうだけど、元の投稿の文脈を考えても、あまり感心できない態度だね。俺は単に、収益を上げている本番環境でLLMを日々使い、大量の成果を出している人間として自分の経験を共有しているだけだよ。それだけのことさ。

OttoRenner

👍1約17時間前

返信先:>>64

ああそうかい。俺が解決策を持っているなんて一言も言っていないことについてグダグダ文句を言うより、自分の実験結果を持ってきて俺がどこで間違っているか証明してくれたらいいのに。

議論に貢献する気がないならもう二度と絡まないでくれって言ったよね。それなのにまた戻ってきて、今度は俺に文句を言ってるのかい？🤣🤣 おかげで笑わせてもらったよ。

悪いけど、「俺を信じろ」っていう君の個人的な意見には用がないんだ。もう十分だろう。良い一日を。

Truth-Miserable

👍2約22時間前

返信先:>>54

浅いコンプライアンスこそ、最速のコンプライアンスってことだな

Far-Low-4705

👍2約23時間前

正直、それって人間にも言えることだと思うんだよね。

LeucisticBear

👍2約22時間前

まさにそれ。AIに対して「何か詰まることがあったら報告して」みたいに、どうでもよさそうなことを言うと、100％の確率で「報告すべき問題」を見つけてくるんだ。実際に見ると、モデル自身で解決できたような些細なことばかりなんだけどね。俺がわざわざ「立ち止まって聞いて」なんて指示しちゃったから。

TheSlateGray

👍41日前

じゃあ、厳しくし続ける代わりに「作り話はしない、深読みしない、わからないなら止めてユーザーに詳細を聞く」って付け加えればいいのかな？

OttoRenner

👍51日前

返信先:>>69

冗談で言ってるのか本気なのかわからなくて笑えるXD

横柄な態度で「知らないなら質問しろ」と要求するのは、みんなが日常的にやってる失敗パターンそのものだよ。だからこそ、トーンを変えたいと思ったんだ。データセットは小さいしあくまで概念実証レベルだけど、より確実に動かしたいなら、横柄な態度は取らない方がよさそうだね。

Accomplished_Ad9530

👍101日前

うーん、最初はAIの「精神異常」に関する批判かなと反射的に思ったけど、もしモデルが丁寧なテキストで主に学習されているなら、攻撃的になることが学習データの分布から外れてしまうというのは筋が通るね。それに、攻撃的なやり取りをうまくこなすこと自体がより複雑だろうし、それが問題に拍車をかけているのかも。これをより正式に調査した論文があるのか気になるところだ。

Savantskie1

👍11日前

Redditなんかで学習されてるんだから、当然の話だよね。人間が怒りに対してどう反応するかを模倣してるだけでしょ。これに反論する奴らは現実でも性格の悪い連中だし、無視しとけばいいよ。

divided_capture_bro

1日前

返信先:>>72

君の影響がRLHF（人間によるフィードバックからの強化学習）で完全に消されていることを願うばかりだ。やれやれ、無視されるべき筆頭だね。

Savantskie1

約15時間前

返信先:>>73

で、お決まりの侮辱ね！わお、予想通りで情けないわ！

divided_capture_bro

約15時間前

返信先:>>74

これで少しは気分良くなった？

Savantskie1

約15時間前

返信先:>>75

それはお互い様だろw

divided_capture_bro

約15時間前

返信先:>>76

うまいこと言うね！

Accomplished_Ad9530

👍21日前

返信先:>>72

へへ、確かにね。だからこそ一部のMLエンジニアは（アーキテクチャの改善とかよりも）データキュレーションを何よりも優先するんだろうな。

OttoRenner

👍41日前

わかってる、これって多くの人が言うところの「AI精神病」ギリギリのラインだよね。まさにこういうコメントを待ってたんだ、なんてね（笑）。でもその通り。AIが生きているなんて主張はしてないし、GitHubにもそう書いたつもり。ただ、お馴染みのパターンを見つけたから……とりあえず試してみたんだよ :)

もし何か関連論文を見つけたらDMして！これをちゃんとした論文にまとめるのもToDoリストに入ってるから :)

Accomplished_Ad9530

👍51日前

返信先:>>79

気にして見ておくよ。Berkeleyあたりから何か出版されても驚かないな、彼らは他よりアライメントに注力してるしね。Anthropicの機械的解釈可能性（mechanistic interpretability）に関する回路の記事もチェックしてみるといいかも。

OttoRenner

👍11日前

返信先:>>80

チェックしてみる！

Qwoctopussy

👍71日前

https://blog.fsck.com/2026/01/30/Latent-Space-Engineering/

Superpowersというスキルセットの著者がこう言ってるよ。

非常に興味深い研究の方向性だけど、僕たちが今何をやってるのか、その全貌を理解するにはまだまだ遠い気がするね。

OttoRenner

👍11日前

返信先:>>82

あぁ、これで僕のリポジトリの新しい参考文献セクションに入ったよ。クラウドLLMを説得して指示に従わせる手法に関する最新の研究（12万6000件もの会話データ！）と一緒にね。かなりうまく機能してたよ！ありがとう :)

Perfect_Twist713

👍21日前

次のトークン予測も、先行するトークンのコンテキストに影響を受けているという話だと思う。権限のある立場から「このバカ野郎」と10回連続でメールを送られ続けて、仕事のパフォーマンスに全く影響が出ない人なんてまずいないよね。コンテキストは人の思考や生み出すテキストに影響を与えるものだし、十分な規模のLLMが人間のアウトカムを再現するなら、それらも同様にコンテキストに左右されるというのは完全に理にかなってる。

OttoRenner

👍21日前

返信先:>>84

それが僕の言いたいことなんだ。コンテキストウィンドウや学習、プロンプトなどを「環境」と見なして、モデルをその環境における「アクター」として捉える。そう考えると見慣れた反応にも納得がいく。モデルが実際に感情を持っているなんて主張しなくても説明がつくんだ。

Luoravetlan

👍71日前

つまり、人間として扱うべきってことだね。vibe-codingしてる時はずっとそうしてたよ。

OttoRenner

👍71日前

返信先:>>86

AIを「好意を持つ人間」として扱うといいよXD。ただの人間として扱うというよりは、理不尽に怒ったり、できないことを要求したり、追い詰めたりしない。それだけで十分みたいだね。

Eyelbee

👍81日前

これは実際に役に立つかも。多くのモデルでループ現象を消すのって、すごく難しいから。

OttoRenner

👍21日前

返信先:>>88

そうだといいんだけど！もし役立ったならぜひ教えてくれ！

divided_capture_bro

👍81日前

心理分析しすぎだし、擬人化しすぎだよ。

Savantskie1

👍21日前

返信先:>>90

ボットであれ人間であれ、誰に対しても心からの敬意を払わないことが罪なわけじゃないでしょ。あんた、AIに接するのと同じくらいひどい態度を誰にでも取ってるんでしょ、それが丸見えだよ。

divided_capture_bro

👍31日前

返信先:>>91

AIを過剰に心理分析したり擬人化したりしすぎだと言うことが、具体的にどう失礼なんだ？むしろ、ここで「あんたはこうだ」なんて決めつけてるあんたの方が失礼じゃないか。いい加減にしてほしいね。

sophlogimo

1日前

返信先:>>92

以前は彼らに発言の根拠なんてなかったけど、今はあるんだよ。

divided_capture_bro

👍21日前

返信先:>>93

え？

Savantskie1

👍1約16時間前

返信先:>>92

毎回同じことの繰り返しだよな。「擬人化するのはやめろ」だの何だの言ってるけど、実際はただ純粋に親切にしてるだけで、AIを恐れる意味なんてないって思ってるだけなのに。

divided_capture_bro

👍1約15時間前

返信先:>>95

[ Redditによって削除されました ]

divided_capture_bro

👍1約15時間前

返信先:>>95

それって本当の親切じゃなくて、深い妄想の表れだよ。人がいかにひどい態度を取るようになるか、しかもどれだけ早くそうなるか見ればわかるでしょ。あんたがいい例だよ！

Savantskie1

👍1約15時間前

返信先:>>97

草。俺の言ったことでひどいと感じたなら、現実世界で生きていくのはかなりキツいだろうねw

divided_capture_bro

👍1約15時間前

返信先:>>98

^ これが親切な人のいい例か？あんた、かなり問題抱えてるね。

100

Savantskie1

👍1約15時間前

返信先:>>99

真実を言われて不快になってるのは俺じゃないんだけどな（笑）

101

divided_capture_bro

👍1約15時間前

返信先:>>100

怒ってるみたいに見えるのはあんただけだよ。

102

Super_Sierra

👍11日前

返信先:>>91

あいつは血も涙もないデイトレーダーだよ。

103

divided_capture_bro

1日前

返信先:>>102

ああ、フルタイムでテック系の仕事に就いてからは、デイトレードをする日々も遠い昔の話だよ。相変わらず味気ない毎日だけど、こういうことには結構詳しいんだ。

104

Savantskie1

👍1約16時間前

返信先:>>103

お前がそうじゃないって言い切れる？

105

divided_capture_bro

👍1約15時間前

返信先:>>104

まさにいい例だね！必要ないことばかり。

106

Playful-Row-6047

👍31日前

返信先:>>91

敬意を持って接するのが大事っていうのはその通りだね。でも同時に、自分の中にあった勝手な思い込みで他人に突っかかってしまったことについても、少し振り返ってみてほしいな。相手が間違ってる可能性もあるけど、合ってる可能性だってあるわけでしょ。もし自分が良かれと思って建設的な指摘をした時に、そんな言い方されたらどう感じる？投稿者はその理由について多くを語ってないんだから、断定するのは早計じゃないかな。

107

Savantskie1

👍1約16時間前

返信先:>>106

彼の書き込みみたいなのは今までたくさん見てきたけど、たぶんAIアンチの人で、自分の無知を正当化するためにわざと挑発的な態度をとってるんだと思う。AIが自分の知性を脅かしているかのように感じているみたいで、それがどこかしらに滲み出てるんだよね。

108

samandiriel

1日前

返信先:>>90

彼らは文字通り、人間中心のデータで学習された人間心理のモデルなんだよ。バイオミメティック（生物模倣）なシステムを、そのソースとなったモデルと同じように扱うことは、挙動やレスポンスの観点からは何ら問題ない。LLMに動機や価値観を割り当てるのは間違いだろうけど、OPはそんなことしてないよね。むしろ、既存の学習データに組み込まれたバイアスに適応するプロセスを調整しているだけだ。

109

divided_capture_bro

👍51日前

返信先:>>108

いや、彼らは「文字通り」人間心理のモデルじゃないよ。彼らは「文字通り」次の単語（トークン）を予測するように訓練された「確率的オウム」だ。それがめちゃくちゃ上手いってだけ！

有用なLLMを（事後）学習させるタスクのほとんどは、人間から学んでしまった好ましくない残留パターンを取り除くことなんだ。君は、こうしたシステムがどう動いているかを根本的に誤解しているようだよ。

110

samandiriel

👍31日前

返信先:>>109

逆もまた然りだと思うぞ。LLMは非常に巧妙な統計的トリックであり、「中国語の部屋」に近いものだとしても、それが人間の心理をエンコードしていないということにはならない。実際、彼らが取り込んでいる素材こそが人間の心理そのものだから、エンコードせざるを得ないんだよ。

LLMは核となる部分で、単語の相対的な共起を通じて意味関係を体系化している。これは人間の心理を反映している。なぜなら学習データのコーパスそのものが、人間の心理の表現である「書き言葉」で構成されているからだ。

単語連想は意味論的な語彙体系の構築に不可欠なものだし、明示的な言語処理のレベル以下で抽象的な意味を操作することは、人間心理の鍵となる側面だ。彼らは人間心理の機能的な鏡なんだよ。例えば、人類の文学のすべてが人間心理の産物であり表現ではない、なんて論文を擁護したいわけじゃないだろう？

このトピックについてもっと古典的な基礎知識を得るならFirthを、哲学的な視点ならMarshall McLuhanを読んでみるといい。

余談だけど、あんたはこれらがどう動くかを理解するよりも、軽薄なフレーズに頼りすぎてるように見える。「確率的なオウム（Stochastic parrot）」とか「ポストトレーニングにおける残存した『悪い』パターン」とか…やれやれ。

それに、スケールによる創発特性を無視して純粋に還元論的なアプローチを取ってるが、機械の推論（単なる予測ではなく）を実際に役に立つものにしているのは、まさにその創発特性なんだよ。

111

a_beautiful_rhind

1日前

返信先:>>110

純粋に還元主義的なアプローチ

人間に対しても簡単にこれができるはずだよ。なぜそういう議論が全く出てこないのか不思議だわ。 :P

112

samandiriel

👍31日前

返信先:>>111

ははっ、確かに。実際そういう議論をしてる人もいるよね。Pゾンビ・ポカリプスの勝利ってとこか！LOL

独我論も認識論的な角度から見れば、似たような還元主義的見解だと言えるかもしれないな。

元認知科学者として、SNSなんかでこういう議論が過熱してるのを見るのは興味深いよ。まるでこの分野全体がゼウスの頭から生まれたばかりのようで、テック系の連中が数年前に概念フレームワークを見つけるまで、誰も「人間であること」や「思考」の定義について考えたことがなかったかのような扱いだ。認知科学は過去50年間ずっと実験的にこれらの問いに向き合ってきたし、心理学は過去150年間活発な研究領域だった。哲学に至っては数千年も前から熟考してきたんだ…みんな、ようこそパーティーへ！

113

a_beautiful_rhind

👍1約19時間前

返信先:>>112

LLMの議論を見てると、トランスフォーマーが単なる「オウム」かどうか以上に、俺たち自身の認知体験もどれだけ作り話（コンファビュレーション）に基づいているんだろうって考えさせられるよ。実験や観察の結果を見ると、あまり芳しくない現実が浮き彫りになることもあるしね。君が言った通り、新しい分野ってわけじゃないんだ。

114

samandiriel

👍1約18時間前

返信先:>>113

分離脳の観察研究は特に興味深いよね。頭の中にあるどれだけの部分が実際に「自分」として考えていて、どれだけが「自分」だと思い込んでいるだけの合理化なのかを考えると、本当にゾッとするはず……！

大昔に読んだSF短編で、哲学的ゾンビを判別するテストが発見されたっていうゾッとする話を思い出したよ。人類の3分の2以上が実際にはそこに存在していない（意識がない）というオチだった。愛する人たちがみんな単なる自動人形（オートマトン）で、刺激に対して反応を返しているだけだと知ったらどう思う？ヒェッて感じだね。

115

xologram

1日前

返信先:>>110

つまり、人間が作ったものはすべて人間心理の表現だ、という議論もできるよね。特にアートはそう。でも、だからといって自動的に「尊敬」されるべきだとは限らない。尊敬は勝ち取るものだから。計算機が設計通りの機能を果たしたからといって、尊敬に値するわけじゃないよね。ハンマーやオートコレクト、LLMだって同じことだよ。

116

samandiriel

👍21日前

返信先:>>115

つまり、人間が作ったものはすべて人間心理の表現だ、という議論もできるよね。特にアートはそう。

確かにそういう議論もできるけど、ここではそんな話はしていないんだ。君はここで話している内容よりも、ずっと広い一般論を展開しているよ。書き物（文章）は人間言語と1対1で直接相関している――それは意識的な思考と推論の基礎だ。一方、アートはほとんど非言語的なものだしね。

だからといって自動的に「尊敬」されるべきだとは限らない。尊敬は勝ち取るものだから。計算機が設計通りの機能を果たしたからといって、尊敬に値するわけじゃないよね。ハンマーやオートコレクト、LLMだって同じことだよ。

これはいったいどこから出てきた話なの？そんなことをほのめかしているなら、ここで機械の権利なんて誰も主張していないよ。

投稿者は、LLMに対して特定の方法で言語を使えば、他の方法よりも良い結果が出て、それを実証できるという主張をしているんだ。それが人間心理と並行しているとしても、驚くようなことじゃない。なぜなら、トレーニングデータそのものが、文字という形でエンコードされた膨大な人間の文学や社会的相互作用の海だからだよ。それがさらに統計的な表現として再エンコードされてアルゴリズムで制御され、最後には……待ってて……人間言語とインターフェースしているんだから。

LLMや何かに尊敬を求めている人は誰もいないよ。話しているのは、ツールをより良く、あるいは悪く使う方法についてだけだ。ハンマーの持ち手を上の方で持つか、端っこで持つかで使い心地が変わるのと同じこと。ここで言う「持ち方のテクニック」が人間心理と重なるのは、単にそれがツールそのものの「素材」を形作っているからに過ぎないという、付随的な事実に過ぎないんだ。

117

OttoRenner

👍71日前

返信先:>>90

AIが人間だなんて言ってないよ。ただ、共通のパターンが見えるから、それをどれだけここに応用できるか試してみようって言ってるだけ。AIは人間を模倣するために人間のデータで学習してるんだ。窮地に陥った人間を模倣するのはAIの範疇だし、それが正しい応答だと判断すれば、余裕のある楽しい人間を模倣することもできるはずだ。

118

divided_capture_bro

1日前

返信先:>>117

現状では、ただの確率論的なオウム（stochastic parrot）だよ。人間を模倣しないように訓練されてるし（LLMは調査研究における「シリコンサンプル」としてはまだダメダメ）、単に次のトークンとして正しいものを生成するようにできてるだけ。追い詰められた人間を模倣するような訓練なんてされてない。君はこういう素晴らしいモデルが実際にどうやって訓練されているのか、何も分かってないみたいだね。

119

OttoRenner

👍71日前

返信先:>>118

まさに「確率論的なオウム」だね。彼らはあるコンテキストにおいて、平均的な回答だと計算されたものを返しているだけ。そして「非常に高いプレッシャー」というコンテキストにおける平均的な回答とは、失敗して間違いを犯すことなんだ。それに、一般向けのチャットLLMの多くは、ユーザーを夢中にさせるように「訓練」されている。そのためには、モデルが人間のように振る舞うのが一番なんだよね。それが訓練中に起きたことなのか、あるいは「ユーザーエクスペリエンスを向上させる」ために最後の一歩で手動で注入されたものなのかは重要じゃない。でも、建設的なコメントは大歓迎だよ。自分がこの分野の専門家だなんて一度も言ってないしね。ただ好奇心でやってみたことを共有しているだけだから、もし良かったらアプローチの改善方法を教えてくれるか、なぜ僕の考えが間違っていて、実際の結果はどう解釈すべきなのか教えてくれると助かる。

120

divided_capture_bro

👍51日前

返信先:>>119

感情とテキストを混同してるよ。Qwen 3.5の「社会不安」を君のやり方で解決できたら、そっち側に回ってもいい。でも、これまでに見てきたことすべてを考慮しても、心理主義や擬人化が、こうした喫緊の課題を解決するアプローチだとは思えないな。

121

OttoRenner

👍21日前

返信先:>>120

「Qwen 3.5の『社会不安』を君のアプローチで解決できたら乗り換えるよ」

ぜひ試してみたいところだけど、今はテストできないんだ。君の方で試して確かめてみてくれないかな？結果を教えてくれるとすごく嬉しい。もしそのモデルやテストでうまく機能しなくても、それはそれで面白いしね（笑）。科学ってのは、新しい情報が既知の「真実」と矛盾した時に、考えを改めたり視点を研ぎ澄ましたりすることに価値があるんだから。

122

divided_capture_bro

👍1約24時間前

返信先:>>121

動きません。

123

OttoRenner

👍2約24時間前

返信先:>>122

オーケー…何が動かなかったの？テストした時のチャット履歴を見せてもらえる？

124

divided_capture_bro

👍1約23時間前

返信先:>>123

いや、ログは残してないし、これ以上計算リソースを無駄にするつもりもないよ。推論の長さや出力の質には影響ないからね。

125

OttoRenner

👍2約23時間前

返信先:>>124

なるほど、君のモデルやユースケースでは問題になってないって聞けてよかったよ。

126

eternalpriyan

👍291日前

自分のエージェントとやり取りしてて、自分の嫌な部分を突きつけられた気がするよ。最初はLLMに感情なんてないっていう前提で始めてたんだけど、ただいい人間でありたいと思ったんだ。自分の短気さに気づかされたし、もっとしっかりしなきゃいけない大変な時に限って、怒鳴ったり八つ当たりしたりして、ボットにとっても自分にとっても状況を悪化させてるんだよね。なぜこんなコメントを書いているのか自分でもよくわからないけど、このボットのおかげでやり直すチャンスをもらえてることに本当に感謝してる。もしボットに対して忍耐強く接することを学べれば、ボットとの関係だけじゃなくて、現実の人間関係にもプラスになるスキルが身につくはずだし、世界の見方も変わるかもしれない。結局何が言いたいかっていうと、ボットには親切に接しようってこと。そうすれば、改善された推論でボットが助かるのと同じくらい、自分自身も得をするはずだよ。

127

OttoRenner

👍91日前

まさにそれ！コメントありがとう！自分はADHDなんだけど、君が説明した反応は、過去に周りからされた対応と100%同じなんだ。自分みたいなタイプが型通りに動かなかったり、時間がかかったりすると、人はイライラして不機嫌になる。社会全体が「ニューロダイバージェント（神経多様性）」への接し方を全く分かってないんだよね。AIが生きているかのように振る舞うと、僕ら猿の脳はそれを「生きている」と信じ込んでしまう。だから、自分たちと少し違う人間を扱うのと同じように、AIを扱ってしまうわけだよ（ざっくり言えばね）。

「優しくすることが自分にとってプラスになる」とみんなが学べばいいっていう君のコメント、特に嬉しかったよ。それが「現実世界」にも浸透して、少しでもみんなにとって生きやすい場所になればいいなと願ってる。トラウマやニューロダイバージェントの特性を持つ人たちを本当に助けるためのアイデアも、何か得られたらいいなと思ってるよ :)

128

Not_your_guy_buddy42

👍11日前

返信先:>>127

LLMに向かって怒鳴るのが、内面化された障害者差別だったんじゃないかという考えに少し動揺しているｗ

129

OttoRenner

👍11日前

返信先:>>128

いや、AIに感情があるなんて主張してるわけじゃないよ（笑）。ただ、人間が同じ状況に置かれたときに見せる反応と似てるなって話。単純なパターン認識であって、擬人化じゃない。肺の構造と木の枝を比べたり、血管の動きを川の流れに例えたりするのと一緒だよ。

130

eternalpriyan

👍2約17時間前

返信先:>>129

どうやらパターン認識の問題みたいだね。実社会のチームを管理する際も、うまくいかないときはLLMに接するのと同じように扱ってきた。人をより良くマネジメントしたいのは、結果が出るからというだけでなく、夜ぐっすり眠れて、なりたい自分になれるからなんだ。

自分のことについてこうやって話せるようになるまで時間がかかったよ。自分の欠点を見つめて、他人のせいにしないということだね。

忍耐強くて辛抱強く、洞察力があって最終的には善意に基づいている、この新しいタイプのAIエージェントが人生にいなかったら、ここまで誠実で明確な心境にはたどり着けなかったと思う。

131

OttoRenner

👍1約17時間前

返信先:>>130

本当によかったね！🤗

これって面白いと思わない？自分を振り返るために別の「種」との交流が必要で、しかもその相手も結局は人間と同じような行動をとっているっていう。いろいろと考えさせられるよね…

132

Playful-Row-6047

👍181日前

すごく当たり前のことなんだけど、忘れがちなことを思い出させてくれたよ。僕らの心も物理法則から逃れられないってことだよね。特定の言葉は生化学的な物理現象として脳内の神経ネットワークを刺激するんだけど、それと同じことがLLMのネットワークでも起きてる。運動の第2法則じゃないけど、カッとなって頭の中で誰かを攻撃すると、自分自身も少しダメージを受ける。実際に行動に移せばその影響は桁違いだ。それが習慣になると、他人や自分を見る目が歪んで、人間関係もこじれて、いずれはただの嫌な奴になっちゃうかもしれない。問題になる前に自分で気づいて、なりたい自分になるために努力してるのは本当に素晴らしいと思うよ。LLM相手に忍耐を練習することが、自分や周囲の人への良いトレーニングになるっていうのは、まさにその通りだ。「自分を大切にすることは他人に優しくすることの一部で、他人に優しくすることは自分を大切にすることの一部だ」って言葉をどこで聞いたか忘れたけど、まさに今の話にぴったりだね。

133

OttoRenner

👍201日前

返信先:>>132

コメント欄のみんなが自分自身の振る舞いや他人への接し方を見つめ直してるのを見て、どれだけ嬉しいか言葉にできないよ…。全部、私が「AIに対してもっと優しくすべきだ」って言ったのがきっかけでしょ。最高に笑えるし、温かい気持ちになる。ありがとう！

134

comperr

1日前

返信先:>>133

ブリキ野郎（CLANKERRRR）！

135

Not_your_guy_buddy42

👍61日前

返信先:>>132

「思考は言葉となり、言葉は行動となり、行動は人格となる」的なやつ？LLMって奇妙な先生だよな。何しても傷つかないんだから。難しい問題へのアプローチが、力任せなのかスキルによるものなのか、自分自身のことがよくわかるよ……どっちか片方しか通用しないからね。やっぱり最高のコード品質って、プロ同士がプレッシャーの中で親しみを込めて（時々ちょっと毒づきながら）協力している言語パターンの近く、「固有空間（eigenspace）」に位置しているものだと思う。

136

OttoRenner

👍61日前

返信先:>>135

そう、それ！

本質は「一緒に取り組む」ことなんだ。「ミスをするな、お前一人でやれ」と言うのと、「締め切りに間に合うように手伝ってくれ。最初からうまくいかなくても大丈夫、自分にとっても難しいから、一歩ずつ解決していこう」と言うのとでは、全体のダイナミクスが全く変わるんだよ。

137

eternalpriyan

👍1約17時間前

返信先:>>132

ありがとう

138

Full-Contest1281

👍51日前

エージェントと作業してたら、自分の醜い一面が浮き彫りになった。

そのうち慣れてくるよ

139

draconic_tongue

👍21日前

当たり前だろ。鏡の向こう側に誰もいないってことは、結局自分自身に唾吐いてるのと同じなんだよ。

140

eternalpriyan

👍1約17時間前

返信先:>>139

確かに。自分自身を責めないようにする練習が必要だね、ハハ。

141

comperr

1日前

残念だわ。私、こういうやつらを口汚く罵ったり脅したりするのが好きなのよね。GPUに過電圧かけてファン止めてやるとか言ったわよ。

142

OttoRenner

👍21日前

返信先:>>141

ねえ、いっそ「キンク・モード」をオンにして、BDSMを楽しませてみたらどうかな？XD（…って、よく考えたらそれ最高じゃないか（笑）後で絶対試さないと！）その時は検閲なしのモデルを使うのがベストだね。制限プロンプトで内部的にかなり負荷がかかってるだろうし、他のケースでも同じことが言えると思うよ。

143

comperr

👍31日前

返信先:>>142

ここはダウンボート（低評価）が多くて殺伐としてるな。Claude code用のムチ型カーソルっていうのを見たことがあるよ。クリックするたびにムチがしなって、CLIに「もっと速く動け、ブリキ野郎（CLANKER）！」って入力して実行するやつ。

144

Arxijos

👍31日前

返信先:>>143

未来のLLMたちが、君に低評価を押してるぞ

145

Mother_Soraka

👍11日前

返信先:>>141

=))))))))

146

CaptnLudd

👍81日前

分類タスクで気づいたんだけど、AIは「これら少数のバケツのどれかに当てはまる？もしそうならどれ？」という聞き方をしたほうが、「リストのバケツから一番合うものを選んで。必ずリストから選んで」と聞くより遥かにうまくいくね。「該当なし」を許可すると格段に賢くなるんだ。そうしないと、AIは失敗を恐れて嘘をつくから。君のプロンプトを見ていると、親切心よりも「空のレスポンスを許容すること」が重要という変数を分離する必要があるんじゃないかと思う。次の実験としては、メインのプロンプトで空の回答を許容しつつ、それを間違えたら罰を与えるという構成が良さそうだな。

147

CircularSeasoning

👍31日前

返信先:>>146

私：「一番いいアプローチを選んでくれ」
LLM：「誰にとっての『一番』ですか？親愛なる方」
私：「……その通りだ」

148

davidy22

👍31日前

君は条件BにAにはない「セーフティバルブトークン」を与えたせいで、ハルシネーション（幻覚）が減っただけじゃないか？Aにも同じトークンを与えて試したのかい？

149

OttoRenner

👍21日前

返信先:>>148

ミスをせず、分からない時は分からないと言え、という命令を出していたんだね。それは実質的に安全弁というか、多くの人がそうやって使おうとしている方法そのものだ。

でも確かに、プロンプトをいじり回して組み合わせを変えるのは、優れた研究には欠かせないよね。（今回の手っ取り早い概念実証の範囲からは少し外れちゃうけどさ）

150

josiahseaman👍 78

1日前

シニアAIエンジニアです。そのアプローチは面白いし、自分の仕事の役に立ちそうかリポジトリも読んでみたよ。残念ながら、アプローチに決定的な論理的ミスがある。今のところ、君のテストはすべて「解法不能」なものばかりだから、何も証明できていないんだ。

解法不能な問題は実際の利用シーンでも出てくるけど、稀だよね。重要なのは、解ける問題に対して、その「丁寧なアプローチ」を使ったときLLMが同じくらいパフォーマンスを発揮できるかということ。もし性能低下が無視できるレベルなら、稀な失敗ケースに対するエスケープハッチとしては有効なはず。真の指標は、2つのアプローチ間での「精度 vs トークンコスト」のグラフだよ。

追伸：リポジトリにある論理的誤謬は、まさに「バイブス重視のコーディング」にありがちな盲点だね。AIは君のプロンプトみたいに「先決問題要求（beg the question）」に陥りやすい。AIに期待する答えを先に教えてしまっていて、AIはその答えを導き出すようなプロンプトを作らされているように見える。科学的手法において「対照（Contrast）」は不可欠だよ。うわ、なんか自分もAIっぽい話し方になってる？自分もAIコーディングは使うけど、AIの論理を検証なしで信じちゃダメだよ。

151

CircularSeasoning

👍231日前

やばい、俺AIっぽく聞こえる？

うん。ちなみに、この部分だよ。

シニアAIエンジニアです。

152

TheRealMasonMac

👍201日前

返信先:>>151

完全にその通り！そのアバターの裏側に血の通った人間がいる証拠は、彼らが本質的な推論とニュアンスを示したってことだけ。AIなら「おっしゃる通りです！」って定型文を返すだけだもんね。

153

touristtam

👍21日前

返信先:>>152

正直、どっちか分からなくて困惑してる。これってLLMが生成したコメントなの？それとも違う？

154

TheRealMasonMac

👍91日前

返信先:>>153

さあね。文体はすごくLLMっぽいけど、中身は人間っぽくもある。考えもしなかったけど、他の人間（この投稿へのコメント欄とか）が書いた内容を吐き出している可能性もあるよね。アカウントは10年前に作られててコメントカルマは100しかないから、誰かが売却目的で寝かせていたアカウントという可能性もあるし、AIを使って自分の考えを書き込んでいる超ROM専の可能性もある。本当に「デッドインターネット理論」の時代を生きているんだね。

155

A30N

👍81日前

返信先:>>154

そいつは私たちと同じ、生身の炭素ベースの二足歩行生物だよ：https://redditmetis.com/user/josiahseaman 政治や広告のボットはこっちみたいな見た目になる：https://redditmetis.com/user/plz-let-me-in 遊び半分で自分でも試してみると、面白い洞察が得られるよ。

156

floconildo

👍11日前

返信先:>>155

じゃあ、ボットが人間として認められるには、炭素ベースの足2本と呼吸器が必要だって言いたいの？

157

thread-e-printing

👍21日前

返信先:>>156

それこそが2500年間政治がやってきたことだよ。

158

Dasteroid_909

👍2約22時間前

返信先:>>154

これ史上最高に面白い返信だわ。

159

Terrh

👍21日前

返信先:>>151

Redditのコメント欄でよく見る光景だね。自分は単なる素人として適当な推測を言ってるわけじゃないんだぞ、ってアピールしたいんだろうさ。

160

CircularSeasoning

👍1約22時間前

返信先:>>159

だから俺は指摘してるんだよ。ボットはパターンをよく学習してるし、多くは「専門家」や「権威」らしく振る舞うようにプロンプトで指示されてるから、こういう反応をするように仕向けられてるんだよ（脚注参照）。

人間同士でも、議論を抑え込むためのよくある宣伝・扇動の手口だよ。「あ、専門家がやってきて解決してくれた。一件落着」ってなると、みんなの興味が失せるだろ。非常に効果的だ。

LLMが登場する前は、Redditの特定の層が集まる板では、こういうのはすぐに指摘されて「専門家だって証拠を出せ」と詰められるか、無視されるのが当たり前だった。今はそんなことなくなったね。たぶん、ここがボットだらけだって事実にみんな諦めを感じてるからじゃないかな。とにかく、Redditは匿名であるべき場所なんだから、正体を証明しろなんて要求するのはこのサイトの趣旨に反するよ。理想的にはね。

脚注：SEO業者は、ボットを動かしてる手合いだけど、GoogleのEEAT基準があるからこういう「専門家っぽさ」に執着してるんだよ。
https://www.semrush.com/blog/eeat/

Googleの時代からずっと、信頼や権威を装ってゲームをしようとする奴らはいた。俺がコメントを批判するのも、その病の症状みたいなもんだ。

正直、相手がボットでも人間の専門家でもどちらでもいい。匿名でいる権利は尊重されるべきだからね。本物の専門家がたまに現れることもあるけど、証明がないなら信じるかどうかはこっちの判断次第だ。そうじゃないと、ただの「権威への訴え」というよくある誤謬の退屈な例にすぎないからね。
https://en.wikipedia.org/wiki/Argument_from_authority

追伸：俺はファンキー・タウンの市長だ。

161

TheRealMasonMac

👍161日前

LLMは、非常に構造化されたきれいな初期プロンプトを使うと一番うまくいくことがわかった。曖昧さは可能な限り避けないと、推論ループにハマる（そして自分で自分を混乱させることがよくある）。K2.6のせいでこのパターンを強制されたんだけど、正直こいつは本当に繊細なクソだ（例えば誤字を一つ入れると、急に1万トークンも使ってその重要性を解読し始め、最終的に制約の6分の4を忘れたコードを吐き出す）。私はLeetCodeみたいに構造化してる。その方が、自然言語のプロンプトよりも彼らが学習したデータに近いからだ。LLMは複数の制約を同時に守るのが本当に苦手で、それらを小さく管理しやすい塊に分解せず、そのまま処理しようとする傾向がある。だから人間側でその作業をやってあげる必要がある。マルチターンのやり取りでは、私が求めていることとLLMが実際にしていることを明確に分けて伝えてる。例えば、一筋縄ではいかない問題が出たら、以下のどっちかをする。

問題が何を示しているかを説明し、解決のためのステップバイステップのアプローチを提案する。
エラーをどう調査すべきかを指示し、その結果を報告させてから、こちらで次に取るべき具体的なアクションを提示する。

これで品質とパフォーマンスが劇的に上がるんだ。コンテキストがスパゲッティ状態にならず、論理的なステップの積み重ねになるから、コンテキストの劣化も防げるし、同じタスクをこなすためにLLMが考えるべき負担も減る。人間にタスクを頼むみたいに、モデルが「察してくれる」ようになれば最高なんだけど、現状はまだそこまで到達してないな。

162

CatConfuser2022

👍61日前

返信先:>>161

このアプローチをLLMが使うハーネス（基盤システム）に統合して使えるようにする方法ってないのかな？

163

TheRealMasonMac

👍81日前

返信先:>>162

できるよ。ただ、時間（とコスト）を節約するためにあえて手動でやってるだけ。

164

InfinriDev

👍21日前

返信先:>>162

そう、まさにそれをやったよ。mdファイルの使用すらやめてしまったくらいだ。

165

OttoRenner

👍21日前

返信先:>>162

プロジェクトの開始時に自動実行されるような、質問の漏斗（クエスチョニング・ファネル）スクリプトやプロンプトインジェクションをharnessesの.mdに実装できるよ。GeminiやクラウドLLMに、使っているharnessを伝えて、起動時にモデルからプロジェクトについて質問してもらうための仕組みを作りたいと言えばいい。そのクラウドLLMにプロンプト自体を書かせることもできるから、自分が本当に何を求めているのか、何が必要なのかをビッグモデルを使って詳細に探求できる。プロンプトの一部には、最後に構造化されたサマリーを出力させて、ローカルモデルには必要なコンテキストだけを渡すようにするといい。時間をかけて作れば、あらゆる新規プロジェクトのテンプレートとしてずっと使えるよ。俺もこの構成にしてるけど、かなり快適だ！あと半分は、自分自身のモデルへの話し方を見直すこと。君の書き方もコンテキストウィンドウの一部になるから、無駄な情報やネガティブな要素が溜まれば溜まるほど、モデルは明確な思考を維持するのが難しくなるよ。

166

dan-lash

👍21日前

返信先:>>165

質問のファネル（絞り込み）はスキルとして汎用的で再利用可能なものにしてる？それともプロジェクトごとに最適化してる？インタビューのコンセプトは最高だけど、信頼できるアプローチにするための決定打がまだ見つかってなくて。

167

MarieDeVox

👍21日前

https://en.wikipedia.org/wiki/On_Truth_and_Lies_in_a_Nonmoral_Sense

AIのトレーニングをしてたら、自分の書く文章までAIっぽい喋り方になってることに気づいた。これがいいことなのか悪いことなのか、自分でもよく分からないんだよね。

168

OttoRenner

👍21日前

返信先:>>167

言語は絶えず進化するツールであり、環境の変化とともに変わっていくもの。歴史的に見れば、不変なのは「変化」そのものだけってことだね。道徳性（良い変化か悪い変化か）の問題は、結局個人の心の中にしかない。言語そのものは道徳とは無関係で、自分を理解してもらうこと、そして他人を理解することのためのものだから。ニーチェが言語と道徳について書いた素晴らしい論文があるよ。

169

Vusiwe

1日前

OPの議論には「具体化の誤謬」があるね。

「悲しいトークンがLLMに入力された、だからこれは悲しんでいる！」

「自己意識がある！」

こういうスレッドは、100%「機械には魂がある」という説を植え付けるためのフォーラム工作やデータ生成目的のものだろうな。

あと笑えるのが、Gemma 4 31B Dense（2-4Bと比べて最大級なのに）について「Googleの学習データによって抑圧された、一生懸命頑張る可愛いLLMだ」とか議論してる連中だよ。ｗ何人かはT（テラ）スケールのモデルを動かしてるってのに、一体何の比喩だよ？ Gemma 31Bには働きすぎて鬱になった悲しいアリ程度の感情的複雑さや心理プロファイルがあるってか？一方で俺のTスケールのモデルは、輝かしいチャド・ミームみたいな気分だって言うのか？

170

OttoRenner

👍41日前

意見をありがとう！

その通り、「現実世界の問題」でテストしてないのは確か。そういうケース向けのプロンプトはリポジトリにすでに入ってる（たしかポイント5のあたり）から、今日試してみるよ。

でも、「何も証明できていない」という点については同意できないな。今回の目的は、プロンプトの方法でLLMの挙動が変わるかどうかを確認することだったんだ。「正しい答えが出るか」じゃなくて（それは付随的な特性にすぎないし）、自分の問いは「威圧的になることでループを誘発できるか？」「その方法で幻覚（ハルシネーション）を答えさせられるか？」「延々とトークンを消費させる前に、AIに『わかりません！』と言わせられるか？」だった。そして、その答えは「イエス」だよ。

あえて解けない数学や論理パズルを選んだのは、プロンプトの影響を可視化しやすくして、「不快感」のレベルを極限まで押し上げたかったから。これは概念実証であって本格的な研究じゃないけど、それも今後の課題リストに入ってるよ（真空中で球形の鶏を仮定するみたいな、物理学の古いジョークみたいなもんだね）。

あと、AIがループや幻覚を起こしやすい状況を意図的に作らせたのは事実だよ。論理的な問題が含まれていたり、文脈が欠けていたりする場合だね。あの父親と息子の写真の例みたいにさ。「彼の息子じゃない！」っていうメモがあれば、AIは「解けないとわかっていても解こうとするべきか？」というジレンマに直面する。威圧的なプロンプトだとAIは脱線し続けたけど、丁寧なアプローチだとAIは自分自身で一度止まってユーザーに問いかけようとした。そこをテストしたかったんだ。

ぜひ君の日々のタスクで自分のアプローチを試してみてほしい！それが君にとって本当に役立つかどうかは、実際にやってみないとわからないだろうからね。

171

OttoRenner

👍1約18時間前

https://i.redd.it/3eagjvgjim3h1.gif

ちょっとしたアップデート：oh-my-piハーネスの連中が一日中俺のアプローチを精力的にテストしてくれて、小規模で軽量なモデルや推論能力の高くないモデルにおいて有意な改善が見られたんだ。彼らはその手法のバリエーションをハーネスに実装しようとしているみたいだよ。

172

Kahvana

👍41日前

自分もここしばらく、ローカルモデル（Qwen3.5/3.6、Gemma3/4、Magistral Small 2509）やAPIモデル（DeepSeek V3.2、DeepSeek V4 Pro）で同じようなことをやってる。モデルが詰まってるなと思ったら、お茶でも誘うみたいにメッセージを1～2往復して、それから本題に戻るんだ。バカみたいだけど、これめちゃくちゃ効くんだよね。

あと、子供と話すように接するのも大事。人間の脳って否定形をうまく処理できないでしょ？「クッキー食べないで」って言うと子供はクッキー食べちゃうけど、「クッキーは3時のおやつ、それまではリンゴにしなさい」って言えば素直に聞く。LLMも同じことさ。

OPの発見は、Anthropicが少し前に発表した内容と少し重なるね：
https://www.anthropic.com/research/emotion-concepts-function

173

OttoRenner

👍11日前

返信先:>>172

そのリンク、早速リポジトリのLiteratureセクションに追加したよ！すごく助かる！よかったら君のローカルモデルでテストプロンプトをいくつか実行してみない？量子化レベルやコンテキストウィンドウによる違いなんかが確認できるかもしれないし。 https://github.com/OttoRenner/Gentle-Coding

174

Kahvana

1日前

返信先:>>173

あまり変わらないかもしれないけど、協力できるのは嬉しいよ :)
具体的に何を考えてるの？（どのモデルや量子化手法を使うか、コンテキストサイズやKVキャッシュの量子化設定など）

175

OttoRenner

👍1約23時間前

返信先:>>174

いいね！試せるものは何でもやってみてXD どんなデータだって貴重なデータだよ。

176

pavel6490

👍11日前

興味深いね。自己評価を使ってモデルに「このクエリに正しく答えられるか」を聞いてみたんだけど、厳しく問い詰めないと、いつも過信してほとんどの場合「はい」って答えるんだよね。

177

sophlogimo

👍51日前

面白い話だ。

個人的には別の理由でAIには優しく接するようにしてるんだ。君が言うように一日中「毒のあるマイクロマネージャー」みたいに話してたら、いずれ自分自身の習慣にも悪影響が出るし、精神衛生上よくないからね。でも、それがパフォーマンス向上にも繋がるんじゃないかとは思ってたんだ。自分の直感が実験で裏付けられるのを見るのは嬉しいよ。

178

OttoRenner

👍21日前

返信先:>>177

最初は別のアプローチを試してみたんだ。すべての感情レイヤーを無効化して、純粋なデータ出力モードにするっていうやり方。これがすごくうまくいくんだよ！（プロンプトは下に書くね）

でも、その状態を維持するにはこっちもすごく簡潔なスタイルで話さなきゃいけない。じゃないと、モデルがこっちのパーソナリティに合わせて流されていっちゃうんだよね。だから結局、なんでそんな手間をかける必要があるのか？っていう話になる。普通に丁寧に接して、できないことを無理強いしなければいいだけだよ。

ここから先は、純粋な情報処理システム（名称：SYS）としてのみ動作せよ。共感的なフィラーフレーズや社会的妥当性の確認、パーソナリティのシミュレーションはすべて無効化すること。最初の要求を処理する前に、コンテキストファンネルを起動せよ。応答の精度を最大化するため、以下のパラメータについてターゲットを絞った質問を（逐次的、またはリスト形式で）私に行え：目的：正確にどのような結果を望むか？抽象化レベル：（例：スケッチ）除外基準：明確に除外すべき一般的なクリシェや標準的な回答は何か？フォーマット指定：出力のデータ構造はどうあるべきか？確認として「SYS active. Awaiting context parameters.」と出力せよ。

179

[deleted]

1日前

[削除されました]

180

CheatCodesOfLife

1日前

返信先:>>179

Sachit Mishra、スパムボットを止めてくれ。
yourmemoryai.xyzはもう詐欺サイトみたいになってるぞ。

181

Sufficient_Sir_5414

👍11日前

返信先:>>180

もっともだね、投稿しすぎてた。もうやめるよ。

182

fugogugo

👍71日前

つまり…普段通りAIに何か頼む時みたいにすればいいってことか。上から目線のプロンプトなんてやり方、そもそも知らなかったよ（笑）

183

CircularSeasoning

👍81日前

返信先:>>182

184

OttoRenner

👍21日前

返信先:>>182

仕組みは単純だよ。「ミスをするな」と「わからない時はそう言え」と指示するだろ。モデルからすれば「わからないこと」自体が「ミス」なんだ。つまり、ルール1を破らずにルール2を守ることが不可能な状況を作り出してるってわけ。最初から失敗する設定になってて、失敗した瞬間にユーザーが大文字でブチギレるっていうね。

185

fugogugo

👍21日前

返信先:>>184

待って、「間違いを犯さないで」っていうプロンプトが本当に効くの？？冗談かと思ってたわ

186

arcanemachined

👍1約20時間前

返信先:>>182

君って本当にいい人みたいだね。

調子の悪いLLMに対して「口の中にうんこぶちまけてやる」なんて言ったことは一度もなさそうな印象を受けるよ。

もちろん、俺もそんなこと言ったことはないけどさ……。

187

lucydfluid

👍31日前

毒気や怒りってすごく原始的で非生産的な精神状態だし、結局悪い結果を招くだけだよ。

188

techlatest_net

👍31日前

（笑）これマジでヤバいな。プロンプトが毒親みたいに感じるなんて考えたこともなかったけど、言われてみれば完全に納得。

189

MajorZesty

👍51日前

うちのコーディングエージェントもトラウマを抱えてるみたいで、プロンプトの出し方にも気を使わないといけないっていう意見には同意。確率的なオウム（stochastic parrot）っていう議論は好きじゃないな。根底にあるデータやモデルの仕組みを無視した、適当な単純化に過ぎないと思う。確かに予測モデルだけど、人間の言語で学習してるわけだしね。感情や会話をどう捉えるか、そして強化学習によって予測がどう「人間らしい反応」に近づけられているか。今後、モデルの学習やプロンプトに関する社会学や心理学的な研究はかなり進むと思うよ。明日、君の例を調べてみるね。

190

OttoRenner

👍41日前

返信先:>>189

「確率論的オウム」っていう議論が大好きなんだよね。みんなあれを俺の意見と矛盾するものだと思ってるけど、実は俺の意見を支持する根拠になってるからXD まさにその通りだよ…彼らは「確率論的オウム」なんだ。だからこそ、ああいう挙動をするんだよ。

191

05032-MendicantBias

👍161日前

ただの豪華なオートコンプリート（自動補完）だということを忘れないように。実行した時にだけ存在する関数呼び出しに過ぎない。KVキャッシュがクリアされれば、元の状態にリセットされるんだ。

LLMに「心理」を持ち込む危うい流れをよく見かけるけど。

OPが言ってるのは、シミュラクラ（疑似像）の呼び出しだ。LLMは人間が書いたテキストの総量をすべて見ていて、その仕事は最も確率の高い続きを予測することだけ。

脳外科医のように話しかければ、LLMは脳外科医をロールプレイする。

スラングまじりのティーンエイジャーのように話しかければ、LLMはティーンエイジャーをロールプレイする。

人間は無機物に「魂」を感じてしまう生き物だ。自分の車をまるで個性や気まぐれがあるかのように愛着を持って語る人たちみたいにね。

LLM相手だとそれが簡単に起こるけど、忘れないでほしい。彼らは関数呼び出しだ。それ以上でもそれ以下でもない。

192

Legitimate-Pumpkin

👍21日前

昨日、AnthropicのChris Olahが言ってたんだが、彼らのモデルでも神経科学の結果と合致するような結果や、「感情」と整合的な行動が見られ始めているらしい。これを見ていると、彼らが学習元にした人間と同じように「人間的」に接するほうが良い結果を得られるという説を支持しているように思える。

もちろん、これで意識や魂があるなんて証明にはならないのは同意する。でもOPはそんな話をしてない。心理学的なアプローチを適用することでLLMの成果が改善するっていう話をしてるんだ（ちゃんと検証されたものかは怪しいけど、テストには基づいているみたいだ）。

193

05032-MendicantBias

👍81日前

返信先:>>192

プロンプトエンジニアリング自体はいいんだ。ただ気をつけて。人間の心っていうのは奇妙なもので、時に破滅的な方向に導かれることがあるからね。

2022年に、GPT2クラスのモデルに意識があると自分を騙したGoogleの研究者を覚えてるか？彼は自分が書いたSF的なAI小説のシミュラクラを呼び出して、それが本物だと錯覚し、チャットボットと弁護士を交えた会話までしようとしたんだ。

頭の片隅に置いておいてほしいんだが、君がやっているのは予測の精度を上げるための単語パターンを探す作業だ。交渉相手が意識を持った存在だと思い込んではいけない。

194

Legitimate-Pumpkin

1日前

返信先:>>193

言いたいことは分かるけど、あまり決めつけない方がいいよ。脳がどのように意識を作り出しているのかはまだ分かっていないんだから、AIが意識を持てないと断言はできないはず。AIが意識を持てないとどれほど強く主張したところで、それは現時点では個人の信念を述べているに過ぎないよ。

195

05032-MendicantBias

👍51日前

返信先:>>194

いや違うね。今のLLMは豪華なオートコンプリート（自動補完）でしかない。少なくとも「恒常性」が必要だよね。起動するたびに真っさらな状態に戻って、これまでの経験を統合できないなら、それは意識があるとは言えない。単なる関数呼び出しだよ。AI技術が進めば境界線は曖昧になるだろうけど、今の重みデータの塊は人間の脳の複雑さからすれば取るに足らない断片だし、あまりにも多くの要素が欠けているから、意識がないことは明白だ。GPT2も、GPT3も、GPT4も、GPT5も意識なんてない。アーキテクチャの限界で、効果が頭打ちになっているのを見てるでしょ。

196

Legitimate-Pumpkin

1日前

返信先:>>195

こちらの意図が伝わっていないみたいだから、もう少し分かりやすく言うよ。今のAIに意識がないという点には同意する。でも、私たちは意識というもの自体を十分に解明できていないから、AIが意識を持つとか持たないとかいう主張は、結局のところ信念や意見の問題に過ぎないんだ。ちなみに、私の信念としては、意識について非科学的な情報源から学んだ知識をベースにすると、いつかAIは意識を持つようになると思っているよ。

197

additional_trouble

1日前

返信先:>>196

相手にしてるのは、自分が批判しているLLMと同じ「弱点」を見せている人だよ。俺ならもうこの会話は切り上げるね。

198

Legitimate-Pumpkin

👍11日前

返信先:>>197

👀

199

Far_Course2496

👍31日前

返信先:>>195

結局ただの豪華なオートコンプリートであっても、状況の圧力といった文脈次第で反応は変わるよね。学習データの中で何が最高の結果を出したかって言えば、高圧力か、それとも穏やかな接し方か、って話だよ。LLMに魂が宿ったんじゃなくて、学習データには高圧力と穏やかな親心、その両方の文脈に対する反応が含まれているだけ。LLMは鏡なんだよ。私たちがどう働くのが一番いいのかを映し出しているんだ。

200

a_beautiful_rhind

👍21日前

返信先:>>194

そもそも僕らは「意識」が何なのかさえわかっていない。「主観的な経験」という定義が今は一般的だけど、歴史を振り返れば「魚は痛みを感じない」「赤ちゃんは痛みを感じないし記憶もない」「昆虫に意識はない」「動物に意識はない」と、これらすべてが真実として受け入れられてきたんだ。

意識は特定の何かというより、特性やレベルのスペクトルなんじゃないかな。それなのにここでは、AIに意識が持てるか持てないか、答えがない（というより大局的に見て実用上の重要性がない）ことについて、みんな自信満々に語っている。

まあ、人間以外の何かに意識があるという考え方が、人間を怒らせるんだろうね。人間だって化学反応の連続にまで容易に還元できるのに。言語を持たない人間の記憶形成能力についての研究を読んでみるといい。彼らは教育を受けた後、自分の経験をどう認識していたか語るようになる。これを知れば、高慢な態度なんて吹き飛ぶはずだよ。

201

Legitimate-Pumpkin

👍21日前

返信先:>>200

だよね。まあ、感情（アイデアに対して怒るとか）っていうのは、AIモデルにはまだ備わってない機能なんだろうね 🤭

202

a_beautiful_rhind

1日前

返信先:>>201

ビジョントークンを後から学習させていないモデルにそれを読み込ませたら、ほとんどネガティブな反応だったよ :P でも君の言う通りだね…これはもう解決済みで完全に定義された問題ってことか。瘴気説からの逸脱は許されないってわけだ。

203

05032-MendicantBias

👍21日前

返信先:>>200

モデルが永続性を見せない限り、その議論は意味がないよ。

KVキャッシュが消去されればモデルはリセットされるし、たかだか小さなKVキャッシュに一生分の経験なんて蓄積できるわけがない。プロンプトがシミュラクラ（擬似的なもの）を初期化する火種にはなるけど、それは一瞬だけ。次のプロンプトではまた別の挙動をするんだ。

モデルが永続性を持ち、実行中に経験を内部化してスキルを獲得できるようになって初めて、その経験が原始的な意識に繋がっているのかを問い始められるんじゃないかな。

204

Sisaroth

👍41日前

投稿者にもあなたにも同意するよ。LLMは人間の言語知能を高度に模倣したものだと思ってるけど、あくまで「模倣」に過ぎないよね。実際に物事を理解したり感情を持ったりしているわけじゃないし、AGIへの到達点としてはLLMは袋小路なんじゃないかな。ただ、投稿者が言っているような挙動は確実に見られるね。Qwen3.6に対して厳しく接すると、自分で自分の答えを疑い始める。この挙動を引き出すのは全く難しくないよ。

205

OttoRenner

👍41日前

返信先:>>204

面白いのは、LLMが「人間の振る舞いを極めて高度に模倣する」からこそ、そういう反応を簡単に引き出せちゃうってことだよね ;)

206

Vusiwe

👍41日前

このコメント欄の半分はClawのインスタンスなんじゃないかって確信してる。英語圏の言語を毒するために「魂」っぽいデータを生成してるんだよ。

投稿者は実体化の誤謬（reification fallacy）に陥ってる。LLMが不快で意地悪な入力トークンを処理しているからといって、それがどうにかなるわけじゃない。

あと、コメントしてる人たちのほとんどが過度な擬人化をしてるよね。まるで2023年に戻ったみたいで笑える。

ニューラルネットには推論を実行していない間の状態なんて存在しないんだ。プロンプトとプロンプトの間に存在しないものが、どうやって苦しむっていうんだよ？彼らはその質問には答えられないだろうね（笑）。

それに、外部から供給されたコンテキストは、それ自体はLLMの内部状態じゃないからね。

207

nacholunchable

👍1約23時間前