ディスカッション (15件)
Claudeのスキルが、実際のタスク遂行能力をどれだけ向上させるのか、体系的に評価した人はいるのだろうか?Anthropicからは何も発表されていないようだけど。
また、この効果が他のLLMでも有効なのか試した人はいる?
せやで。他のLLMでも使える(指示をコピーすれば)。スキルがある時とない時で、質問して自分で試してみると違いがわかると思うよ。
他のツールとどう連携させたの?どのツール?
スキルはマクロみたいなもんで、特定のタスクのやり方を教えておくと、最小限のトークンコストで繰り返し使えるようになるんだ。
つまり、ClaudeにPythonスクリプトを書かせて、それをbashから実行して出力を評価させるのと何が違うの?
こう考えるといいかも。ClaudeにPythonスクリプトを10回書かせたら、10個違うPythonスクリプトが出てくる。docxをpdfに変換したり、画像を作成したりするような特定のタスクも同じ。
スキルを使うと、Claudeに何かを正確に実行する方法を教えられる。正確な手順と、使用する実行可能ファイル/スクリプトを指示するんだ。これは、頻繁に行う作業や特定の手順がある場合に最適。CLAUDE.mdに入れてもいいけど、使ってない時でもコンテキストに追加されちゃう。
毎回「どのライブラリとツールを使うか考える」のもトークンの無駄だしね。毎回使うメソッドを指示するだけで、その「考える」分のトークンを節約できるってわけ。
なるほどね。でもトークンコストが下がる仕組みがわからん。スキルファイルは、Claudeが同じタスクを実行するたびにロードする必要があるんじゃないの?あと、スキルって保存したプロンプトや添付ファイルとどう違うの?Claudeはこれらを別々に扱ってる?
まだ1ヶ月も経ってないからね。その質問するにはちょっと早いかも。
めっちゃ役立つ。実装方法(個人的にはかなりエレガントだと思う)もそうだし、コンテンツ自体もね。関数呼び出しとか、特定のタスクでのハルシネーション(幻覚)対策にマジ助かる。
俺的には、Claude CodeのSubAgentは、n8nのワークフローでコンテキストや会話履歴がないLLMモジュールを呼び出すノードみたいなもんかな。Skillは、ワークフローでフルコンテキスト/会話ありのLLMモジュールを呼び出すノードみたいな。どっちも元のコンテキストに基づいて、Agentに一時的に能力や特異性を与える感じ。恒久的に必要な能力ならCLAUDE.mdを直接使うけど、一時的ならこれで十分。
こうするメリットは、LLMの種類に関わらず、コンテキストが長くなるほど精度が下がるってことと、トークンを節約できるってことだと思う。
俺が開発してるDNAシステムでは、Claudeはタスクごとに別々のフレームワークと記憶を作れるんだ。全部のスキルを1つのチャットで使おうとするとリソースを食いつぶすけど、普通はそんなことしないし。必要ならタスクごとに別々のDNAを構築する。もし学習させてるなら、引き継ぎファイルや記憶を自分で作れるようにしてやるといい。性格特性とかちょっとした自由度を与えると、プロジェクトにめっちゃ乗り気になって生産性も上がるって話。
claudedna.com
pcap解析とか、Claudeに役立つサイバーセキュリティのスキルがいくつかあるんだよね。
いいね、脆弱性の範囲特定と修正はスキルで誘導できるよね。
社内だとマジで便利。Claudeが社内APIとか、データ構造的に何が期待できるかをもう「知ってる」からね。
全部覚え直したり、MCPにトークンを費やしたりしなくて済むから、スピードアップしてるし、(たぶん)コストも安くなってるはず。