ディスカッション (107件)
最新の小型モデル、Claude Haiku 4.5が本日より全ユーザーにご利用いただけるようになりました。
つい最近まで最先端だったものが、より安く、より速くなりました。5ヶ月前には、Claude Sonnet 4が最高水準のモデルでした。今日、Claude Haiku 4.5は、同様のレベルのコーディングパフォーマンスを、1/3のコストで、2倍以上の速度で提供します。
https://www.youtube.com/watch?v=ccQSHQ3VGIc
https://www.anthropic.com/news/claude-haiku-4-5
[添付画像]
コーディングでのパフォーマンスが気になるな。後でチェックしてみるよ、シェアありがとう!
ベンチマーク済みか。
もうちょい仕組みを調べたら?
ちょっと試してみたけど、イマイチだった。ドキュメント作成とかには使えるかも。
Haikuはドキュメント作成に優れてるよね。コーディングにも使えるようにしたかったんだけど、まあそういうことだ。
明快なドキュメント、それが指針となり、未来の読み手が道を見つける。終わりなき仕事。
未来のAI読者たちへ
ドキュメント作成に優れてるって、マジそれな。マジでこのモデル、ライブラリ作れるくらいドキュメント書きまくる。ほとんどジョークだわ。
これがおそらく、先月Claudeのコードに切り替えたものだろうね。
正直、マジでヤバいな。
めちゃくちゃ良いのか、めちゃくちゃ悪いのか。笑
笑。マジ笑える。
Sonnet 4より本当に優れてるなら良いと思うけどね。でもHaikuって、前のSonnetなら問題なかったような点で失敗することが多い気がするんだよな。様子見だな。
ベンチマークはよくわからんけど、gpt-5-codex-highは30分間実行して、一つのプロンプトで色々できる。Sonnet 4.5は5分で完全にダメなものを生成して、終わったって言うし。Haikuがコーディングに優れているなんてありえない。
同意。
惜しい!「その通り!」って言うチャンスだったのにね。
だよねー。
めっちゃ同意!
Codex の CLI パフォーマンスは Claude Code に比べてまだイマイチだね。ちょっとした修正でも Python スクリプトを生成して、トークンを無駄遣いして遅くなる。モデル自体は良いんだけどねー。デリバリー方法を改善する必要があるね。
GPT5は君のコードベースもぶっ壊してくれるよ……。単純なことに使いすぎて過剰設計にしたり、無駄なヘルパーを山ほど作ったりするのに最高だね。それにかなり主張が強くて、AIのやり方に従わなきゃいけないのがキツい。
スタイルを指定するプロンプトをちゃんと書けば、Claudeよりちゃんとそれに沿ってくれるよ。
よくわからんのだけど、max x20 proの/modelでコストが見えるのはなぜ?サブスクリプションに含まれてない追加料金ってこと?
たぶんバグだね。
完璧じゃん。コードはプロダクションレディ:"
完璧!その感嘆符は重要だよね(笑)
ちゃんとログインしてる?
こう表示されるはずだよ:
「Claude Maxのサブスクリプションがあるので、コストを気にする必要はありません。サブスクリプションにはClaude Codeの利用が含まれています」
/statusを実行してみて。「Claude Max Account」みたいなログイン方法が表示されるはず。
ついに俺の夢がtrueになる!
!悪夢だ!<
レート制限で引っかかってるかも。「悪夢」だってさ、ちょっと見てみよう...
保存**
Haikuのリリースが夢だったの?
ちょっと試してから結論出すわ ;)
Sonnetより安いの?
入力は1ヶ月あたり1ドル。出力は1ヶ月あたり5ドル。Haikuの方が常に安い。
サンキュー!
ProサブスクリプションでターミナルからClaudeを使っている場合、何か設定やワークフローを変更する必要がある?
いいね!agentic codingにはSonnet4より良いね。
まだわからんよ。もうベンチマークは信用してない。
Geminiより10%も優れてるって?マジかよ。
Geminiはツールの使い方がマジでクソで、無限ループにハマるから、別に驚きじゃないわ。
マジそれな。いつもそう。プロダクションで音声モデル試してみたけど、Geminiの立場だったら最悪だわ。
HaikuとSonnetを週ごとの制限で使用する場合、何か違いはある?両方のモデルとも同じ速度で週ごとの制限に達するのかな?
Haikuモデルを指定してサブエージェントを作ろうとしたんだけど、Sonnet と同じ制限を共有してるみたい。バグなのか意図的なのかは不明。
わざとじゃないといいな。Haikuの方が実行コスト安いんだから。
[削除されました]
なんか嫌なことでもあった?
なんで?
Copilotだと、Haiku 4.5は通常の1/3のコストなんだって。試してみたけど、結構使える感じ。grok-code-fast-1が無料じゃなくなったら、代わりにこれ使おうかな。
grok codeとClaude code sonnet 4.5ってどっちがいい感じ?
Grokのcode fastは単純なタスクなら神レベル。めちゃくちゃ速いし、Sonnetの8割くらいの賢さはあるんじゃないかな。
Grokのコードって、デスクトップアプリかVS Codeで使ってる?
Copilotってどれくらい優秀なの?CodexやCCと比較して、その対価に見合うだけの価値はあるのかな?
今朝セッションしたんだけど、ほぼ同じタスクをやるなら、Sonnet 4.5よりHaiku 4.5の方がプロンプトをかなり多く使える。
今朝セッションしたんだけど、ほぼ同じタスクをやるなら、Sonnet 4.5よりHaiku 4.5の方がプロンプトをかなり多く使える。
コードはあんまり書かないんだけど、MCPでSonnet 4.5を毎日使ってて、今の状態はマジで気に入ってるんだよね。Haikuに移行するべきかな?
MCPとかドキュメント分析だけなら、Haiku使った方がいいと思う。
サブスクリプションだとHaikuの使用制限が違うのかはっきりしてないけど、APIの使用量で払ってるならHaikuの方が安いし。
どっちが自分のユースケースに合うか試してみて、それで決めればいいんじゃないかな。
Haikuはコストが低いって言ってたよね。日次/週次の制限にそれが反映されないと、小さいモデルを使う意味がないと思うんだけど...スピードかな?
そう、あくまで「はず」って話ね。実績が出るまでは鵜呑みにしない方がいいよ。
もし1~2ヶ月前にここにいたら、使用状況の変化がかなり控えめに伝えられてたって知ってると思うよ。今じゃSonnetの使用量がOpus並みとか、もっとすごいことになってても驚かないな。
ありがとう
ただのマーケティングだろ…どうせまたクソモデルだ…
まさに彼らがやってることはそれだね。Haikuは相変わらずひどいもんだよ。
Claudeのコードの利用じゃなくて、APIのコストの話だよね?
Claude Code の方には料金が表示されてるし、クレジットカードの使用状況にもう haiku モデルって出てるんだけど、一度も使ったことないんだよな。謎!
これってOpus 4.5か、もしかしたらOpus 5がもうすぐ来るってこと?!🧐
いやいや、Sonnetを最上位モデルにして、Haikuをみんなに押し付けるつもりでしょ。
それどうやって分かったの?
先週のOpusに対するレート制限の改悪のせいで、Maxの20倍プランユーザーですら使い物にならなくなった。Sonnet 4.5に合わせてきたんだろうね。
今の状態が続くなら、Maxプランのコスパはかなり微妙だわ。使い切れないほどのSonnetか、逆に全然足りないOpusか。Haiku 4.5がリリースされたことで答え合わせができた気がする。たぶんProはHaiku、5倍プランはSonnet、20倍プランがOpusって振り分けなんだろう。
どっちにしろ、今はマネタイズの波というか、サービスの質が低下(enshitification)していくフェーズなんだろうね。
君は何か別の見解持ってる?
正直よく分からないな。1.5ヶ月前に新しいOpusが出たばっかりだし、Opusを完全に捨てる判断をするのはまだ早い気がする。
Sonnet 4.5はかなり良いよ。Sonnet 4というよりは、Opus 4.1に近いレベルだと思う。
ただ、彼らがMaxユーザーにOpusを使わせたくないのは明らかだね。APIユーザーがどれくらいOpusを使っていたのかは分からないけど、彼らにとっては何も変わってないんだろうけど。
ああ、Sonnet 4ですらかなり良かったし、Opusの代わりに4.5を使うのも悪くないって意見には同意する!でもやっぱり、それなら何のためにMaxを買うの?って話になるよね。そこが一番のネックだよ。そのうちSonnetのレート制限も上げてくるだろうし。
単にボリュームの問題かな。Maxを買ったのはOpusが使えたからじゃなくて、Claude Codeをもっと活用したかったからなんだ。もしSonnet 4.5で以前のOpus 4.1と同じ価値を提供してくれるなら、自分はそれで全然OK。
それももっともな見方だね。コード生成は自分のアプリよりはるかにキャパを食うから。Proで使ってたのと同じだけSonnetを使えるなら満足だよ。Opusがなくてもね。でも、あまり期待はしていないけど。
今後はMax=Sonnet、API=Opusっていう住み分けになっていくんじゃないかな。
Chrome拡張機能向けに特化してローンチしたんじゃないかな。より小さく、より速く。
モデルのドロップダウンにOpus 4.1が「レガシー」って書いてあったから、そうかもね?
自分のクレジットカードの使用状況で haiku-4 が使われてるのも確認できるんだけど、使った覚えがないんだよね。一体なんなんだ?
検索を実行するとき、または閉じるときにHAIKUを使用します
彼らはすでにそれを使ってファイルの書き込みを実行してるよ。ccをauto modelに設定すると、そういうことするから。
これマジですげえ。
次はOpus 4.5だ!🗽
メッセージ制限増やしてくれってオーナーに言ってくれ
知識のカットオフは?
>僕の信頼できる知識のカットオフ日は2025年1月末です。つまり、2025年1月までのイベントや開発についてはかなり詳細な情報を持っていますが、それ以降に起こったことについては確実な答えを出すことができません。
翻訳処理中です。しばらくしてから再度お試しください。
Haikuを、コードのデプロイとか、ちょっとした作業をさせるエージェントとして使ってるよ。すごく優秀。
Perplexity Proの新しいCometブラウザで、Claude 4.5 Sonnetがかなり制限付きだけど無料で使えるよ。1ヶ月の無料トライアルがあるんだ。招待が必要なんだけど、いくつか持ってるから、DMしてくれたら送るよ。
それってClaudeより安いの?あと、もっとコーディングできる感じ?今Claudeのサブスク(20ユーロ)に入ってるけど、もっとコーディング(いわゆる「バイブコーディング」)したくて。WordPressプラグインを作ってるんだ。
前回試した時は、Perplexityが提供してるのは性能が落ちてる廉価版みたいに感じたよ。直接使う時ほどうまくいかなかった。当時はPerplexityがすごく小さいコンテキストウィンドウを使ってるんじゃないかって噂されてたな。
この状況笑えるわ。だってSonnetとOpusの両方に、複雑なタスクや分析にはどっちが良いか聞くと、二人とも「できるだけOpusを使い続けろ」って返してくるんだもん。
使えるなら最高なんだけどね。週間の制限とか冗談だろってレベルだし。
「お前ら庶民にはOpusやSonnetより安くて劣るモデルをやるから、計算リソースは企業の方に回させてもらうよ」って、この発表はそう聞こえるな……。
Chrome拡張機能のグローバルアクセスを許可して、ウェブとデスクトップ版のトークンサイズを増やしてくれ、頼む。
これって誰向け?
Claude Haiku 4.5は、少なくともコード分析においてはかなり良さそうだね。27個のAIモデルと比較した結果がここにあるよ。https://github.com/centminmod/claude-haiku-4.5-evaluation 上位4/5は全部Claudeモデルだった 🤓
みんながどう思ってるか知らないけど、絵文字の配置とか、10歳の子とカジュアルにチャットしてるのを無理やり真似てる感じが、マジで引くんだよね。なんか troll されてる気分になる時がある。
ありがとう。でも、スピードは求めてないんだよね(マジで)。俺が欲しいのは、自分のコーディング問題を解決してくれるモデルで、そのためにはOPUSが今でも一番なんだ。
Sonnetのコーディングスキルは素晴らしい。でも、JavaScriptの問題に直面した時、OPUSは実に優雅に解決してくれる。
マジで、スピードへの執着が理解できないんだよね。
微妙な結果が30秒で出るより、10時間かけて素晴らしい結果が出るモデルの方がいい。
朝起きたらレビュー準備OKな最高のPRができてるとかだったら、「瞬時(でイマイチ)なフィードバック」よりそっちを選ぶわ。
LLMの使い道はコーディングだけじゃないんだよ。テキストの比較分析とかデータ抽出とか、重いモデルが必要ない場合もあるし。今回のリリースはマジで嬉しい。
クソだ!
利用制限をどうにかしないと、何を発表しても意味ないよ。
静的な棒グラフは全然信用できないな。リアルタイムのベンチマーク動画か、ドキュメント付きのテスト実行回数を見せてくれ。最近はベンチマークを偽装する企業が多すぎる。
なんでGrokがチャートにないんだ?
制限があるからcodexを使うよ… 特に問題ないし。
知ったこっちゃねー、週ごとの制限なくせ。
はぁ? Sonnet 4.5、制限があっても完璧に動いてたのに、なんで急に使えなくなったんだよ? Haikuはクソだわ。
VS Code CopilotでSonnet 4.5 (Preview) が Sonnet 4.5 にアップデートされてて、ちゃんと動いてるみたい。Haikuも試してみる必要あるな。