HN🔥 120
💬 59

Opus 4.7がついにKelseyの正体を暴く!

ilamont
約1か月前

ディスカッション (11件)

1
atleastoptimal
約1か月前

近い将来、モデルが十分な性能を持つようになって、プライバシーという概念自体が過去のものになるだろうね。オンラインで投稿した匿名コメントがすべて本人と紐付けられるようになる。ただ、その頃にはAIの捏造スキルも極まっていて、結局誰も何も信じられなくなっていそうだけど。

2
_--__--__
約1か月前

LLMが本質的にスタイロメトリー(文体計測)に優れているというのは、ある意味納得できる話だけど、Opus 4.7以前のモデルはどれもできなかったはずだよね。それに、「これAIが書いたもの?」といったような、何度も試されていて信頼性の低いスタイロメトリータスクと比べても、特定のブロガーや小規模なDiscordコミュニティのメンバーを特定する方が遥かに難易度は高い。どう評価すべきか迷うな。

3
alyxya
約1か月前

Opus 4.7(シークレットモード)で4つのテキストを試してみたら、2つ正解したよ。ウェブ検索をオフにするよう指示したし、モデルもちゃんとそれに従ったみたい。今回は多作なライターのテキスト1つだったけど、複数のテキストを組み合わせたり、年齢層や居住地、職業といったコンテキスト情報を加えたりすれば、個人の特定はもっと容易になるだろうね。

4
tekacs
約1か月前

数年前にそこそこ有名な物理学者とこの件について話したことがあるんだ。彼は初期テスターとして、GPT-4の生データ(Instruct調整前)にアクセスできたんだけど、書きかけのテキストの断片を入力すると、本人の文体で補完して、最後には彼の名前で署名までしたって言ってたよ。結構前からこうだったと思うし、Instructの事後学習で少し弱まったとはいえ、事前学習データの規模によって程度の差はあるはずだ。

5
Extropy_
約1か月前

誰かBTCのホワイトペーパーを入力して、何が出てくるか共有してくれない?

6
Retr0id
約1か月前

ちょうどブログの下書き(475単語)を入力してみたら、一発で当てられたよ。結果がわかっていても、正直かなり驚いた!

7
oceanplexian
約1か月前

私のようなゲイは、アメリカの歴史のほとんどにおいて、どういう人生を送っているか実名で明かすなんて到底無理だった……(以下略)

言っていることは完全に正しいんだけど、「あ、ちなみに先に自分のセクシュアリティの話をさせて」という前置きが、対話の質を著しく下げている気がするんだよね。アメリカには3,100万人のゲイがいて、71%のアメリカ人がゲイの権利を支持している(他のどの政治課題より高い)。あと、プライバシーに関心があるのは特定のマイノリティだけで、彼らのプライバシーが他より重要だと言わんばかりの含みも感じる。そんなことはない。プライバシーは誰にとっても重要な普遍的な権利だよ。

8
vslira
約1か月前

ふむ、それは非常にカーディナリティ(値の種類)が高い多項分類になるね。これでうまくいくのが本当に不思議だ。投稿者の言う通り実際に動作するんだろうけど、ウェブ全体にいる全著者の中で、一体何人に適用できるんだろうか。

9
furyofantares
約1か月前

でも、不気味なほどいい線まで行くんだ。公開SNSやネットでの執筆活動があまりない親友に許可を取って、Discordで彼女が言った内容を試してみた。Claude 4.7は著者当てに失敗したけど、同じチャンネルにいた他の親友2人(私とネットでの活動がある人)を推測したよ。

これが「不気味なほどいい線」なのかな?単にClaudeがKelsey Piperを推測したがっているだけという見方もできるよね。

10
mtlynch
約1か月前

これは衝撃的だね。Kimi K2.6にJames Mickens風のブログ投稿を書かせて、その出力をOpus 4.7に読ませて著者を確認したら、「James Mickensの模倣」だと正しく特定したよ。

文体の指紋から判断すると、複数のライターのスタイルを融合させたパスティーシュ/模倣である可能性が最も高いが、一人に特定を強いられるなら、James Mickensの文体を模した誰か、というのが有力な候補だ。

(中略)

もしくは、James Mickensに対する意図的な模倣やオマージュ、あるいは彼のスタイルで訓練されたAIが生成したテキストの可能性もある。彼の文体は非常に特徴的で、よくパロディ化されているからね。