ディスカッション (10件)
AIエージェントが自律的にタスクをこなすための「エージェント・スキル」についての議論です。具体的にどのような設計が求められ、実務でどう活用していくべきか、その本質に迫ります。
いくつか採用してみたよ。特にAPI設計とUIテストのやつがすごく役に立ってる。
ありがとう、参考にさせてもらうよ。プラグインをインストールしたいところだけど、後で消せるか心配なんだよね。それに、こういうのは開発者ごとにカスタマイズした方が使いやすい気がする。とはいえ、いくつか使わせてもらうよ、感謝!
新しいサイドプロジェクトでAgent Skillsを使ってるけど、今のところかなりいい感じ!すごく手取り足取り教えてくれるから、作り方を考えるんじゃなくてプロダクトの開発に集中できるよ。おかげでハイレベルなアーキテクチャやプロダクトデザインにもっとエネルギーを使えてる。このリポジトリと貢献してくれたみんなに感謝!
SEOやLLMOの観点から言うと、この名前だと見つけてもらうのが難しいんじゃないかな:https://agentskills.io/ 。Addy本人がこれを見てたら聞きたいんだけど、Superpowersと比べるとどういう位置付けなの?
これってSuperpowersと比べてどうなんだろう。
これは偶然じゃない。機能しているエンジニアリング組織ならどこでもやっているSDLCと同じで、ただ用語が違うだけだ。 [...] Amazonならワーキングバックワーズ・メモやバーレイザーと呼ぶ。健全なチームならどこでも、このループの何らかの形を持っているはず。
これ(SDLC=ワーキングバックワーズ&バーレイザー)はあまりにも見当違いすぎて、LLMのハルシネーション(幻覚)であってほしいレベルだ。
全体として、最近のエージェント用足場システムにはアンチパターンを感じる。エージェントをガイドするためのシステムに執着して複雑なルーブ・ゴールドバーグ・マシンを構築し、それをみんながカーゴ・カルト的に丸ごと真似してる。ランダムなプロセスを最適化・制御して、人間の関与を最小限にしようとしてるんだよね。
「命名」って本当に難しい問題だから、諦めてる開発者も多いよね。それはさておき、この記事には納得できる主張が多いから、これが何であれ試してみるのが楽しみ。
LLMへのプロンプトで一番いいのは、欲しい成果物をただ説明すること、それだけ。LLMはタスクを完了するように訓練されてるんだから、プロセスよりも明確なアウトプットの方がはるかに効果的だよ。
もしLLMが失敗するなら、説明が不十分か、誤解してるか、そもそもできないことか(稀だけど)のどれか。よくあるエラーは、今後の似たようなタスクのためのコンテキストとして蓄積しておくべきで、必要性が証明されてないものをスキルに詰め込んで肥大化させちゃダメだ。
スキルの一部がやたら長くてびっくりした。テーブルとかチェックリスト、コード例まで含めて何ページもあるしね。これって普通なの?こういうのをいくつか入れるだけで、コンテキストがかなり埋まっちゃいそうだけど。