ディスカッション (9件)
Fableアーキテクチャのアップデート情報です。AIが自らオーケストレーションとレビューを行い、Codexがビルドを実行する仕組みによって、トークン消費量を劇的に80%削減することに成功しました。
昨夜、Fableで今週分のトークンを使い切ってしまったから、少しの間Codexに戻してみたんだけど、いやはや最悪の体験だった。単純な問題でループし続けるし(結局自分で解決する羽目になった、まるで素人のように)、何度も「絶対にやるな」と指示を出しているのに平気で「terraform apply」を実行してくる。パフォーマンスの差は歴然だよ。
Fableを使わないだけで、Fableのトークン消費を80%削減できるぞ!
これが本格的なエージェント作業が収束していく形だと確信している。
「これ」っていうのは「高価なモデルで計画を立てて、安価なモデルで実装する」ことだろう。
HNの読者なら誰もが納得するはず。このアーキテクチャなんて月に二回は再発明されてるからな。
https://www.facebook.com/groups/vibecodinglife/posts/1946207565967771/
https://github.com/openai/codex/discussions/10628
https://build5nines.com/stop-burning-premium-requests-how-to-choose-the-right-github-copilot-model-for-the-job/
美しいからという理由ではない。他のどんな形であれ、最終的には同じ退屈な失敗、つまりコンテキストの劣化、自己評価、目標のズレ、マージの混乱にぶち当たるからだ。
実際の失敗は退屈なんてものじゃない。自分の天才っぷりを自画自賛するだけで、自己批判も真の反省も一つも語れない生成AIによるソフトウェアプロジェクトと格闘させられるのはね……せめてペンキが乾くのを見ていたほうが、塗料の臭いでハイになれる分マシってもんだ。
プロジェクト自体の批判をするつもりもない。どうせまたモデルに突っ込んで同じことを言われるだけだろうしな。
Fableなら、OpusやSonnetのサブエージェントを生成して簡単な作業をさせることで、それ自体で解決できるよ。
Fableを使わないことで、さらにFableのトークン消費を抑えられるってか。賢いやり方だね、OP!すげーよ。
DESIGN.mdにこうあるね:
以下の各ルールは、雰囲気任せではなく、スキルによって機械的に強制される。
R1. リポジトリのドキュメントがすべて。HANDOFF.mdにないものは「存在しない」ものとする
SKILL.mdにも:
docs/HANDOFF.mdにないものは「存在しない」。会話やビルダーのチャット出力にしか存在しない結果なんて評価するつもりはない。
「機械的な強制」って、最近では「LLMへのプロンプトを少し多めにする」程度の意味になったのか?たった2行のスクリプトで解決できるはずのことになぜこれほどまでの労力とトークンを費やすのか、驚かされるよ……。
そうそう、俺はFableで調査と計画立案、アーキテクチャのドキュメント生成をやって、実装にはGeminiを使って、最後にまたFableでレビューしてバグを見つけるっていうやり方をしてる。これだけでかなり節約できてるよ。
騙されて、騙されて、33回騙されて、今またラッキーナンバーの34回目に挑んでるところだ。
トークン使用量の削減って、今年流行りの「魔法の裏技」みたいだな。表面上は理にかなっているようには思えない。
もし何百万ドル(何十億ドル?)もかけたAIコンピューティングや世界最高の統計学者が、徹底的な調査やトレーニングでも見つけられなかったような画期的な何かを発見したとしてもだよ……そんなの、次のモデルアップデートで全部取り込まれて、今の苦労が水の泡になると思わないか?
並外れた主張には並外れた証拠が必要だし、AIにおける技術を根底から覆すようなイノベーションがMarkdownから生まれるなんて話、聞いたことがないよ。