HN🔥 228
💬 57

CloudflareのAIプラットフォーム:AIエージェント開発に最適な推論レイヤーが登場

nikitoci
約16時間前

ディスカッション (10件)

0
nikitociOP🔥 228
約16時間前

CloudflareがAIエージェントの構築を強力に支援する、新しい推論レイヤーをリリースしました。エッジ環境での高速な推論処理を可能にし、AIアプリケーションの構築をよりシンプルかつ効率的にします。

1
bm-rf
約15時間前

モデルのページ[1]に価格情報が載ってないんだけど、プロバイダーに直接支払うのと比べてどれくらいコストメリットがあるのか気になる。もしかしてCloudflareは原価で提供してる?あと、データ保持ゼロ(Zero Data Retention)がデフォルトでオンになってないし、すべてのプロバイダーでサポートされてない[2]のも気になるところ。最後に、OpenAIとAnthropic両方のスタイルの補完(completion)を返してくれるようになったら最高なんだけどな。

2
whereistejas
約14時間前

これ、かなり便利そう。Cloudflareはいいツールをまとめてきてる感じがあるね。そういえば、D2は信頼性が高くて無料枠も太っ腹な、数少ないSQLite-as-a-Serviceのソリューションだしね。

3
ramesh31
約14時間前

これは大きい。Bedrockの有力な代替になるかもね。AnthropicやAWSより稼働率(アップタイム)も安定してそうだし。

4
james2doyle
約10時間前

こっちのページ(https://developers.cloudflare.com/workers-ai/models/ )のWorkers AIモデルと、こっち(https://developers.cloudflare.com/ai/models/ )のモデルが完全には一致してないのがすごく分かりにくい。確かに「ホスト済み」のモデルは両方で見れるんだけど、モデルのエンドポイントを見ると「workers-ai/*」ネームスペースの方が選択肢がかなり少ないよね。これって意図的なものなの?

5
datadrivenangel
約10時間前

Replicateの買収がちゃんと活きてきてるのが見て取れていいね!

6
messh
約8時間前

で、これってOpenRouterと似たようなものなの?

7
mips_avatar
約8時間前

つまりCloudflareのArgoネットワークを使ったOpenRouterってことか。Replicateの買収でもっと面白いことができるんじゃないかって気がするんだけどな。アプリケーション固有のRL(強化学習)の精度が上がってきてるのに、スケーラブルにデプロイするいい方法がないんだよね。FireworksみたいにLORAをスケーラブルにデプロイできると謳っているプロバイダーですら、実際にはできてないし。今のところ、ガレージに置いた3090のラックでベースロードをホストするしかないんだけど、バカらしいと思いつつも月1,000ドルの節約になってる。

8
RITESH1985
約7時間前

推論層の問題は急速に解決に向かってるね。次に来るもっと難しい問題はガバナンス層じゃないかな。エージェントに何を許可して、それを後からどう証明するか。Cloudflareがそのレイヤーについても考えてるのか興味がある。

9
kinnth
約5時間前

Cloudflare WorkersからOpenRouterを呼ぶやり方で完璧に動いてるよ。モデルがダウンした時のカスケードやウォーターフォール機能もOpenRouterの方が優れてるし。V1でそれが実装されてるか怪しいところだよね。OpenRouterについてはもう全部好きなくらいのファンボーイだよ。