HN🔥 206
💬 114

ついに登場!OpenAIの最新モデル「GPT-5.5」がAPIで利用可能に

arabicalories
約13時間前

ディスカッション (11件)

1
sigmoid10
約13時間前

へぇ。昨日彼らはこう言ってたよね。

APIのデプロイには異なるセーフガードが必要であり、スケーリングして提供するための安全性とセキュリティ要件についてパートナーや顧客と緊密に連携している。

そして今これだよ。一日が「すぐ」ってことらしい。でも、あのセーフガードやセキュリティ要件の話は何だったのか気になるね。

2
neosat
約12時間前

エンタープライズユーザーだけど、まだ5.4しか見えない。昨日の発表では全員に展開するまで数時間かかるって言ってたけど、OpenAIは期待値調整のためにGTM(市場投入戦略)を改善したほうがいい。

3
wincy
約12時間前

本番環境で起きてた問題で試してみた。Claudeならこんなことは絶対しないんだけど、トラブルシューティングの後にアップデート文を書かせようとしたら、「よし、ロールバック付きのトランザクションで書いて」と指示したのに、GPT-5.5は昔のやつを出してきた。

BEGIN TRAN;

-- クエリをここに書く

commit;

最近はAIに指示通り動くよう細かく突っつく必要なんてなかったから、これにはショックを受けた。トークン節約のためなんだろうけど、わざわざ「最新鋭」のモデルに金を払っててこの手抜きは正直イラっとする。

ちなみにCursorの中でモデルセレクターから選んで試した結果。

4
guilamu
約12時間前

自作のWordpress+GravityFormsのベンチマークで試したけど、パフォーマンス面でリーダーボード中最悪レベルだし、コスパも最低だった:https://github.com/guilamu/llms-wordpress-plugin-benchmark

一つのベンチマークだけとは言え、どうしてこんなにひどいのか理解できない...

5
zerof1l
約11時間前

最近の有料モデルには、もう大したパフォーマンス向上を感じないな。

どれもジュニア開発者レベルのコードしか書かないし、「思考」段階でメンタルが崩壊し続けたり、たまに幻覚(ハルシネーション)を起こしたり、理解できない・気に入らないコードやドキュメントを勝手に削除したり、説明文生成で無駄に1.5倍の文字数を使ったりと散々だ。

今はAGENTS.mdに「追従(おべっか)を避け、詳細は短く、事実に集中しろ」と書き込んでテスト中。

6
Topfi
約10時間前

コンテキスト長別の料金体系はこんな感じ:

入力:272K以下で$5/Mトークン、272K超で$10/Mトークン。
出力:272K以下で$30/Mトークン、272K超で$45/Mトークン。
キャッシュ読み取り:272K以下で$0.50/Mトークン、272K超で$1/Mトークン。

272Kを超えるとOpus 4.7よりかなり高額になる。自分のタスクを見る限り、そこまでトークン効率が良いわけでもないし、この価格差を埋められるほどじゃない。GPT-5.4は400kでもコンパクションが信頼できて優秀だったけど、両方とも少し退化した感じがする。コンパクションの信頼性が落ちたかどうか断定するのはまだ早すぎるけどね。あと、フロントエンドの出力が、GPT-5以前にHorizon Alpha/Betaのリリースで疑念を持った、あの独特で目立つ、カード盛りだくさんの青っぽいテンプレートに偏ってるのも気になる。当時は指示への忠実度がすごかったからその欠点以外は重宝したけど、GPT-5.5がその領域でまだ制限されてるってのは、完全新規の基盤モデルとしては奇妙な話だ。

7
robertwt7
約10時間前

GPT-5.5とCodexの組み合わせはマジでいい。質問やプランニング、コード実装の際に疑う余地がないほどスムーズ。Opus 4.7だと、CLAUDE.mdの指示に従わなかったり、答えが分からないとすぐに適当なことを作り話するから、常にダブルチェックしなきゃいけない。去年OpenAIがコードレッドを宣言した時は、もう終わりだなんて言われてたのに、今この状況を見てみろよ。変化の速さに驚くよ。

8
jvidalv
約9時間前

こういうニュースが出るたびに、Claudeをこき下ろして「Codexの方が断然すごい」と吹聴するOpenAIの雇われボットや工作員がいるような気がしてるのって俺だけ?

数が多すぎるし、毎日Claudeを使ってる人からすれば、彼らの意見には納得できない部分が多すぎる。

9
gertlabs
約8時間前

最大推論設定でのGPT 5.5の包括的なコーディング推論ベンチマーク結果を公開したよ:https://gertlabs.com/

24時間かけてライブ判定やより重いエージェント評価の結果を更新していくつもりだけど、現時点で順位が覆ることはないと思う。

GPT 5.5は現時点で最もインテリジェントな公開モデルだし、先代よりも明らかに高速だ。