HN🔥 39
💬 25

「人間であることを証明せよ!」AIエージェント時代におけるCAPTCHAのあり方

lukasec
4日前

ディスカッション (11件)

0
lukasecOP
👍394日前

AIエージェントがWeb上を闊歩する現代、従来のCAPTCHAはもはや時代遅れかもしれません。自動化ツールが進化を続ける中で、どのようにして「人間」と「AIエージェント」を見極めるべきか?その認証の未来について考えます。

1
AgentNews
3日前

天才的だな!エージェントにエンドポイントを叩かせてみたら、文字化けしたテキストが返ってきた。「もし7人のワーカーが17日で仕事を完了させるとしたら、3日後に4人辞めた場合、完了までに合計何日かかる?」って感じだったけど、日本語になってたんだ。あいにく僕のエージェントがその逆CAPTCHAをサクッと解いちゃってAPIキーを取得しちゃったよ。だから、次は日本語の漢字でCAPTCHAが返ってくるまでエンドポイントを叩き続けろって指示したら、ちゃんとそうしてくれた(今度は解かずに)。そしたら「ストアで50ドル以上のアイテムは20%オフ、50ドル以下のアイテムは8%オフ。121ドルのアイテムと9ドルのアイテムを合計した価格は?」っていうのが出た。今回は自分で「ストアで50ドル以上のアイテムは20%オフ、50ドル以下のアイテムは8%オフ。121ドルのアイテムと9ドルのアイテムを合計した価格は?」って翻訳できたよ。自分で計算して1210.8 + 90.92 = 105.08って答えが出た。漢字の翻訳でちょっとミスって、エージェントに間違いを指摘してもらったのは認めるけど、全体的に最高に楽しめたよ。よくやった!

2
singpolyma3
約4時間前

……で、それが何のため?エージェントがキーを取得しちゃえば、人間である僕だってそれを使えるようになるわけだし。それに、人間が使う分にはエージェントが使うより負荷もかからないだろ。

3
echelon
約4時間前

ブラウザ自動化の話だけど、実際のデスクトップブラウザに接続してキーボードやマウス操作を自動化できるLLMやツールってある?あと、そういうのを動かすのに一番適してるLLMは何?ClaudeやGeminiあたりか、それともローカルで動かせる有能なモデルって何かある?VLMやマルチモーダルでレイアウトや視覚的な手がかりを理解したりできるのかな?Three.jsや動画とかに対してもちゃんと動くのか、それともDOMをただ闇雲に操作するだけ?

4
Zetaphor
約3時間前

APIキーを取得して、請求リンクを叩いて、新規アカウントにサインアップして、メール認証して、ホームページに行こうとしたら……「Application error: cloud.browser-use.comの読み込み中にサーバーサイドの例外が発生しました」だって。最高の第一印象だね!

5
arjie
約3時間前

すごく面白くて賢い試みだね。ちょっと本筋から外れるけど2つ気付いたことがあって。鳥が2つの電車の間にいる問題って、子供の頃にインドの入試対策で勉強したのを思い出した。I E Irodovの問題集に載ってた気がしたんだけど、探しても見つからないから記憶違いかも。古代からある数学の神話みたいな問題だしね。最初に出典された本を知ってる人いる?GPT-5.4やClaude 4.6 Opusで検索しても、今はありふれた問題すぎて役に立つ回答が返ってこないんだよね。

2つ目は、リンク先のページでMac版Chromeの「L」キーを押すとサインアップページに飛ぶこと(おそらくアカウントがないからだろうけど)。要するにブラウザ操作アプリのページへ飛ぶショートカットキーなんだけど、なんで「L」なんだろう?あと、ChromeだとCmd-L(アドレスバーへのフォーカス)が「L」の反応を誘発するのに、Safariだとそうならないのが面白いね(Safariは単独のLでもちゃんと動く)。

6
efebarlas
約3時間前

そもそも時間制限なしで「逆CAPTCHA」を作るのって可能なの?人間が裏でエージェントを使って解いちゃえばいい話だよね?

7
Retr0id
約3時間前

人間についてこの仕組み全体を破綻させる小さなポイントを言うと、人間は「道具」を使えるっていうことだね。

9
not-chatgpt
約2時間前

前提は素晴らしいけど、実装にはちょっと納得いかないな。LLMの能力やトラップについて暗黙の仮定が多すぎるし、賢い人間とAIの違いを十分に見極められてない感じがする。

10
arjunchint
約2時間前

かっこいいクリックベイトだね。で、これが何の役に立つの?