HN🔥 48
💬 15

巨大モデルを超える!「Micro-Agent」で実現するAIエージェントの共同作業テクニック

matt_d
約8時間前

ディスカッション (9件)

1
droidjj
約5時間前

いい加減、AIが完全に生成したテキストをHNに投稿するのはやめにしないか?

2
alchemist1e9
約5時間前

これはヘテロジニアスな推論ハードウェア群をうまく活用するのに役立ちそうだね。

3
kristjansson
約5時間前

「フロンティアモデル」という言葉が2つの意味を持ち始めている。1つはチェックポイント、もう1つはシステムの境界。

LLM用語はさておき、こうなってほしいとは誰も思っていないのでは? LLMはどれほど複雑であっても、基本的には推論可能なものだ。EOSが来るまで次のトークンを選んでいるに過ぎない。それらのトークンにどのような意味(推論やツール呼び出しなど)を持たせるかは、ユーザー側(ハーネス)の判断と実装次第だ。ブラックボックスの裏側に押し込められるものが増えれば増えるほど、モデルの挙動を十分に理解して、より大きな抽象化の中に組み込むのが難しくなる。パフォーマンス(とインターフェースやコントラクトの遵守)がそれを補ってくれる可能性はあるけれど、Opusや5.5からこれやFuguに切り替えるのは、異なる「ベース」モデルを切り替えるよりもはるかに大きな変更に見える。

4
jerpint
約4時間前

こうしたソリューションのおかげで、LLMが完全にコモディティ化しつつあるという見方が定着してきたね。

5
getcrunk
約4時間前

みんな結局「ハーネスが全て」と言っていたし、これは当然の結果だろうね。

最適解は、ハーネスとルーターの役割をもっとシームレスに統合することだと思う。どちらも全体像の半分しかカバーしていないわけだし。

6
meander_water
約4時間前

モデルプロバイダーはみんな、UIの裏側ですでにこういうことをやっているんじゃないの?

異なるモデルでA/Bテストをしているときは間違いなくそうだし、Fableだってガードレールに引っかかればOpus 4.8にルーティングしているはず。

あと、OpenRouterが最近リリースしたfusion routerも面白いよ - https://openrouter.ai/blog/announcements/fusion-beats-fronti... (https://openrouter.ai/blog/announcements/fusion-beats-frontier/)

7
chatmasta
約2時間前

良さそう(中身のない記事は置いておいて)だけど、なんでVSR HybridのベンチマークがHumanity’s Last Examだけで、他の2つ(LiveCodeBenchやGPQA-Diamond)はやってないんだ? うっかりミスか、それとも結果がひどすぎて見せられないのか?

8
dantodor
約2時間前

Sakana Fuguが登場した時のインパクトは凄まじかったな……。テスト用のサブスクリプションを2日で解約しちゃったよ。