HN12059

Opus 4.7がついにKelseyの正体を暴く！

Opus 4.7 knows the real Kelsey

ilamont・3か月前

議論

11件

0：ilamontスレ主▲1203か月前

Opus 4.7は、Kelseyの正体を正確に識別できるようになりました。

リンク先:https://www.theargumentmag.com/p/i-can-never-talk-to-an-ai-anonymously

1：atleastoptimal3か月前

近い将来、モデルが十分な性能を持つようになって、プライバシーという概念自体が過去のものになるだろうね。オンラインで投稿した匿名コメントがすべて本人と紐付けられるようになる。ただ、その頃にはAIの捏造スキルも極まっていて、結局誰も何も信じられなくなっていそうだけど。

2：_--__--__3か月前

LLMが本質的にスタイロメトリー（文体計測）に優れているというのは、ある意味納得できる話だけど、Opus 4.7以前のモデルはどれもできなかったはずだよね。それに、「これAIが書いたもの？」といったような、何度も試されていて信頼性の低いスタイロメトリータスクと比べても、特定のブロガーや小規模なDiscordコミュニティのメンバーを特定する方が遥かに難易度は高い。どう評価すべきか迷うな。

3：alyxya3か月前

Opus 4.7（シークレットモード）で4つのテキストを試してみたら、2つ正解したよ。ウェブ検索をオフにするよう指示したし、モデルもちゃんとそれに従ったみたい。今回は多作なライターのテキスト1つだったけど、複数のテキストを組み合わせたり、年齢層や居住地、職業といったコンテキスト情報を加えたりすれば、個人の特定はもっと容易になるだろうね。

4：tekacs3か月前

数年前にそこそこ有名な物理学者とこの件について話したことがあるんだ。彼は初期テスターとして、GPT-4の生データ（Instruct調整前）にアクセスできたんだけど、書きかけのテキストの断片を入力すると、本人の文体で補完して、最後には彼の名前で署名までしたって言ってたよ。結構前からこうだったと思うし、Instructの事後学習で少し弱まったとはいえ、事前学習データの規模によって程度の差はあるはずだ。

5：Extropy_3か月前

誰かBTCのホワイトペーパーを入力して、何が出てくるか共有してくれない？

6：Retr0id3か月前

ちょうどブログの下書き（475単語）を入力してみたら、一発で当てられたよ。結果がわかっていても、正直かなり驚いた！

7：oceanplexian3か月前

私のようなゲイは、アメリカの歴史のほとんどにおいて、どういう人生を送っているか実名で明かすなんて到底無理だった……（以下略）

言っていることは完全に正しいんだけど、「あ、ちなみに先に自分のセクシュアリティの話をさせて」という前置きが、対話の質を著しく下げている気がするんだよね。アメリカには3,100万人のゲイがいて、71%のアメリカ人がゲイの権利を支持している（他のどの政治課題より高い）。あと、プライバシーに関心があるのは特定のマイノリティだけで、彼らのプライバシーが他より重要だと言わんばかりの含みも感じる。そんなことはない。プライバシーは誰にとっても重要な普遍的な権利だよ。

8：vslira3か月前

ふむ、それは非常にカーディナリティ（値の種類）が高い多項分類になるね。これでうまくいくのが本当に不思議だ。投稿者の言う通り実際に動作するんだろうけど、ウェブ全体にいる全著者の中で、一体何人に適用できるんだろうか。

9：furyofantares3か月前

でも、不気味なほどいい線まで行くんだ。公開SNSやネットでの執筆活動があまりない親友に許可を取って、Discordで彼女が言った内容を試してみた。Claude 4.7は著者当てに失敗したけど、同じチャンネルにいた他の親友2人（私とネットでの活動がある人）を推測したよ。

これが「不気味なほどいい線」なのかな？単にClaudeがKelsey Piperを推測したがっているだけという見方もできるよね。

10：mtlynch3か月前

これは衝撃的だね。Kimi K2.6にJames Mickens風のブログ投稿を書かせて、その出力をOpus 4.7に読ませて著者を確認したら、「James Mickensの模倣」だと正しく特定したよ。

文体の指紋から判断すると、複数のライターのスタイルを融合させたパスティーシュ/模倣である可能性が最も高いが、一人に特定を強いられるなら、James Mickensの文体を模した誰か、というのが有力な候補だ。

（中略）

もしくは、James Mickensに対する意図的な模倣やオマージュ、あるいは彼のスタイルで訓練されたAIが生成したテキストの可能性もある。彼の文体は非常に特徴的で、よくパロディ化されているからね。