HN🔥 593
💬 521

【速報】OpenAIがGPT-5.4をリリース!進化した「思考」モデルの正体とは?

mudkipdev
3か月前

ディスカッション (11件)

0
mudkipdevOP🔥 593
3か月前

OpenAIから最新の推論モデル『GPT-5.4』が突如発表されました!公開された「Thinking System Card」によると、これまでのモデル以上に複雑な思考プロセスと推論能力が強化されているとのこと。詳細は以下のリンクからチェック可能です。 ・公式サイト(System Card): https://openai.com/index/gpt-5-4-thinking-system-card/ ・公式X(旧Twitter)の告知: https://x.com/OpenAI/status/2029620619743219811 ついに「思考するAI」が次の次元へ。エンジニアとして、推論能力の向上や実務への影響が非常に気になるところですね。

1
mattas
3か月前

「GPT-5.4がブラウザインターフェースのスクリーンショットを解釈し、座標ベースのクリックでUI要素を操作してメールを送信したり、カレンダーに予定を入れたりする」

Gmailでメールを送るために、5.4が画面上をクリックしまくるデモを見せているけど、これってインターネットとやり取りする方法としては間違ってないか?Gmail APIを使えばいいじゃない。スクリーンショットの解釈や座標クリックなんてやる必要ないだろ。

2
minimaxir
3か月前

目玉機能は明らかに1Mのコンテキストウィンドウだね。他のモデルが対応している約200kと比べてもすごい。料金ページによると、200kトークンを超えても追加料金はかからないみたいだし:https://openai.com/api/pricing/ (https://openai.com/api/pricing/)

価格表を見ても、GPT-5.4(入力1Mあたり$2.50、出力1Mあたり$15)はOpus 4.6(入力1Mあたり$5、出力1Mあたり$25)よりずっと安い。しかもOpusはベータ版の200k超えコンテキストウィンドウにペナルティがあるし。

ただ、現状のCodexやOpusもコンテキストウィンドウが埋まってくると弱点を見せているから、1Mにしたところで劇的な改善があるかは懐疑的かな。まあ見てみよう。

更新されたドキュメント(https://developers.openai.com/api/docs/guides/latest-model (https://developers.openai.com/api/docs/guides/latest-model) )によると、GPT-5.3-Codexを置き換える形になるらしい。面白い動きだね。

3
Chance-Device
3か月前

軍隊やセキュリティ機関が喜んで使いそうだな。

4
gavinray
3か月前

ブログ記事にある「RPGゲーム」の例は、今まで見た自律型エンジニアリングのデモの中でもかなり印象的。

「Battle Brothers」にすごく似てる。RPGゲームにはアート素材や敵のAI、それに他にもたくさんの論理システムが必要だってことを考えると、なおさら驚かされるよ。

5
creamyhorror
3か月前

5.4はまだプロンプト1回(編集:今は3回)しか試してないけど(推論:高で設定したらかなり時間がかかった)、コードベースの分析とトピックの評価文を書かせてみた。そしたら文章と分析が思慮深くて正確で、驚くほど分かりやすかった。5.3-Codexとは大違いだ。非常に明晰で、人間らしい言い回しを使っている。

自分のAGENTS.mdでより明確でシンプルな言語を要求しているせいかもしれないけど、少なくとも5.4はガイドラインに従うのがうまい。5.3-Codexはシンプルで分かりやすい文章を書くのは苦手だったから。

6
kgeist
3か月前

今日、GPT-5.3 Instantをリリースします
今日、ChatGPTでGPT-5.4(GPT-5.4 Thinkingとして)をリリースします
GPT-5.3 Thinkingというモデルは存在しませんので注意してください

8ヶ月間も、わけのわからないナンバリングにせずに我慢できたんだな :)

7
__jl__
3か月前

モデルがぐちゃぐちゃすぎる!

OpenAIは今、GPT 5.1、5.2、そして5.4と3つの価格帯を持っている。Codexが5.3で、今インスタントと呼んでいるものも5.3。モデルラインをまたいでバージョン番号が飛び交ってるよ。

Anthropicだけは、ちゃんと整理できてるよね。モデルは3つだけで、価格も3段階。新しいモデルが出れば即座にどこでも使えるし。

Googleなんて実質プレビューモデルしかないようなもの!最後のGA(一般提供版)は2.5だよ。開発者としては、古いモデルを使い続けるか、数週間で廃止されるかもしれないというリスクを抱えるかの二択だ。

8
Philip-J-Fry
3か月前

ブログ記事の最後にでかい「Ask ChatGPT」ボックスがあるのが面白いよね。内容について質問できるのかと思って「このブログ記事を要約して」と入力するじゃない?すると、ブログ記事へのリンクと一緒に「このブログ記事を要約して」と書かれた新しいチャット画面が開くんだよ。なのに返ってくる答えが「外部URLには直接アクセスできませんが、関連するテキストを貼り付けるか、興味のある内容を説明していただければ要約のお手伝いをします。ぜひ共有してください!」だからね。

笑っちゃうよ。OpenAIはこれがうまく動いてないって気づいてないのかな?

9
Alifatisk
3か月前

整理すると、OpenAIは以前、あまりにも多くのモデルとバージョンがあって混乱を招いていた。それを解決するために、GPT-5というルーター的なものを導入して、裏側でモデルを切り替えるようにしたことで、ユーザーはGPT-5にプロンプトを送るだけでよくなった。これはうまくいっていたと思うし、UIも分かりやすかった。それなのに今、またモデルを増やし始めてるのか?

今あるのは:

  • GPT-5.1
  • GPT-5.2 Thinking
  • GPT-5.3 (Codex)
  • GPT-5.3 Instant
  • GPT-5.4 Thinking
  • GPT-5.4 Pro

この馬鹿げた進め方をした責任者は誰なんだ?自分はChatユーザーじゃなくて本当によかった。不必要な認知負荷が増えるだけだし。

唯一の救いは1Mコンテキストウィンドウのサポートだね。ようやくGeminiに追いついた。

10
petetnt
3か月前

うわあ、GPT-5.3 Instantは期待外れだったけど、GPT-5.4は間違いなく未来を感じるね!