ディスカッション (11件)
Appleが発表した新しいAIアーキテクチャは、なんとGoogleのGeminiモデルを中核に据えたものになるようです。独自開発にこだわってきたAppleがGoogleとタッグを組むことで、今後のiPhoneや各種デバイスのAI体験がどう進化するのか、期待が高まりますね。
Apple Intelligenceが実際に何で動いているのか、もっと詳しく知りたいな。自分たちのプロンプトの裏でGeminiのフラッグシップモデルを使っているのか?ファインチューニングなのか?それともGeminiをベースに自分たちで事前学習させているのか?
GeminiベースのモデルとApple Foundation Modelsとの間に明確な違いはあるのかな?その違いはデバイス内モデルとホスト型モデルで変わるの?モデルの一部はAppleのPrivate Cloud Computeで動いていて、それ以外はGoogleのサーバーで動いていたりするのかな?
追記:"keynote tech-talk"0でかなり詳しく説明されていたよ。
Appleによると、モデルは5つあるらしい。
デバイス内モデル
- AFM Core: 高密度アーキテクチャ。次世代の標準的なデバイス内モデル。
- AFM Core Advanced: スパース(希薄)アーキテクチャで、ネイティブマルチモーダル対応。画像理解や表現力豊かな音声といった機能を実現する。
Private Cloud Compute
- AFM Cloud: レイテンシとコストを最適化した、サーバー側の主力モデル。
- AFM Cloud Image: 画像生成と編集用。
- AFM Cloud Pro: 最も高性能なモデル。Geminiのフロンティア級の品質で、複雑な推論やエージェント的なタスクをこなす。AppleのPCCプライバシー保証の下、Googleクラウド上のNVIDIA GPUで動作する。
Cloud Pro以外のすべては、Google Geminiを使って「洗練(refined)」させたApple Siliconで動くカスタムモデルとのこと。Cloud Proについては「Geminiのフロンティアモデルと同等の品質を持つ、我々の中で最も能力の高いモデル」と説明している。つまり行間を読むと、Geminiをラップしたものだと言えそうかな。
EUでリリースされないっていうのは、なんか怪しい気がする。とはいえ、Apple Intelligenceをまた無効化する前に試してみるくらいには面白そうだけど。
AnthropicとかOpenAIじゃなくて、あえてGoogleをプロバイダーに選んで自分たちの立場を不利にするなんて、Appleらしくなくて変だな。これだとAndroidスマホのアシスタントと差別化するのに苦労しないかな?ひねくれた見方をすれば、Googleがやろうと思えばAppleにGeminiの劣化したバージョンを渡して、自社の優位性を保つなんてこともできるんじゃないの?
消費者としては、どのスマホプラットフォームを選んでも中身が同じっていうのは最悪だよね。避ける手段もないし(アシスタントを一切使わないっていう手はあるけど、自分も含め多くの人がそうしてると思う)。
AIの追いつき戦略としては非常にAppleらしいアプローチだね。外部ツールをプライバシーアーキテクチャで包み込んで、OSに組み込んで、オーケストレーション層を製品化するっていう。
Private Cloud Computeとデバイス内のルーティングを組み合わせることで、モデル提供者にユーザーのコンテキストを漏らさずに、サードパーティのモデル機能をファーストパーティのような使い心地にできるのか、興味深いところだ。
もしAppleがGoogleとAppleの境界線をうまく扱えるなら、かなりエレガントな一手になるはず。そうでなければ、Geminiの表面をプライバシー重視っぽく磨いただけのApple Intelligenceになっちゃうだろうね。
この動き、初期のiPhoneとGoogleマップの関係を思い出すな。Googleと競合しているのに、Googleのインフラを使っているっていう。なんでOpenAIとかAnthropicみたいな他のプロバイダーにしなかったんだろう?
勘違いかもしれないけど、これだとAppleが主張しているプライバシーへのこだわりがかなり薄まってしまう気がするんだよね。
Appleは、Apple Intelligenceはデバイス内処理とPrivate Cloud Computeに依存しており、ユーザーデータは即時のリクエストを実行するためにのみ使用され、Appleや第三者がアクセスすることはないと改めて強調した。また、外部の専門家が「いつでも」これらのプライバシー保証を検証できると付け加えた。
「これを実現するためにAppleはデータを見る必要があるけど、我々が見ようとしても見る方法はない」ってやつだよね。iOSをオープンソースにして、ユーザーにデバイスの制御権を委ねて、推論を自分でホストできるようにして、ネットワークトラフィックがないことを確認できるようにしない限り、そんなのは不可能だよ。もし本当に彼らの言う通りなら、何も不都合なくユーザーにホストさせられるはずでしょ。
AppleにネイティブなAI能力がないっていうのは、変だし不安になるね。
世界で最も資金が潤沢な企業の一つなのに、これほどまでに極めて重要な技術開発において何のポジションも築けなかったなんて。
ティム・クックの下でAppleが運営・実行においては最高の会社になった一方で、イノベーションのリーダーシップは失ったという明確なサインだよ。
みんな見落としてるけど、GoogleはエッジAIの分野では何光年も先を行ってるよ。GPTブームの前からずっと取り組んでたし。Pixelスマホはずっと前からライブ字幕(オンデバイスの文字起こし)に対応してるからね。
数年前からClaudeの有料会員だけど、最近はAndroidのPixel 9で無料のGeminiアプリを使うことが多いな。答えの一部として検索してくれるのがすごく便利で。モデルが新鮮で最新な感じがするんだよね。Appleがその検索機能をどう組み込めるかは未知数だけど。