2023年11月7日、OpenAIの開発者向けカンファレンスDevDayで、ChatGPTに関連したアップデートが発表されました。詳細については、こちらがわかりやすいのではないかと思います。また、今年の9月、OpenAIのCEOであるアルトマンは、元Appleの伝説的デザイナーであるジョナサン・アイブに対して、AIデバイスの開発プロジェクトへの参加を求めたという噂が流れました。
この一連の動きを見ていると「歴史は繰り返す」という言葉を思い起こさずにはいられません。
1990年代の初めにインターネットが登場し、世界が隅々までネットワークでつながる社会が到来しました。そんなネットワークを行き交うデータを広範かつ大規模に取得することが、社会における覇権を握る決め手となる時代を迎えたのです。そのことをいち早く悟ったのがMicrosoftでした。
Microsoftは、1981年にMS-DOSをリリースし、その後、PC OSで大きなシェアを握りました。まだこの時代は、PCをネットワークに接続することは特別であり、限られたユーザーが、電話回線で音響カプラを使い2,400bpsや9,600bps程度で接続して情報をやり取りするパソコン通信をしていました。
1990年代に入りインターネットの時代が到来します。1993年、WebブラウザーのNCSA Mosaicリリースされ、インターネット利用者が急速に拡大、その後の普及の基礎を築きました。1995年、Microsoftは、最新のPC OSであるWindows95をリリースするにあたりインターネット接続のための通信機能を提供するソフトウエアとWebブラウザーのInternet Explorer(IE)を、有償オプションでとして提供しました。その後、標準機能となり、PC OSの圧倒的なシェアを活かしてインターネットの窓口、すなわちユーザーがデータをやり取りするゲートウェイを掌握したのです。
その後、1998年、Googleがブラウザーで使う検索エンジンの提供を始め、インターネットの玄関/ポータルをMicrosoftにただ乗りするカタチで手に入れました。
Googleは、2005年、Webブラウザー上でアプリケーションを実行できるAjax技術を使ってGoogle Mapをリリース、その後、様々なAjaxアプリケーションがリリースされるようになり、OSに依存せずにWebブラウザー上でアプリケーションが利用できる可能性が示しました。
当時、Microsoftは、PCにインストールするOSであるWindowsとOfficeが大きな収益源でした。OSにも依存せず、インストールの必要もないアプリの普及は、自社のソフトウエア販売を脅かす脅威だったわけです。そのため、アプリケーション実行環境としての自社Webブラウザー IEの性能向上には、不熱心でした。
そんな状況に業を煮やしたGoogleは、2008年に独自のブラウザーであるChromeをリリース、その軽快さやアプリケーション実行環境としての性能の高さにより、IEのシェアを脅かす事態となったのです。また、2010年、Chromeを動かすことに特化したChrome OSをリリース、Gmailを含むGoogle Appsと呼ばれるオフィス・アプリケーション(いまのGoogle Suite)の充実にも取り組みました。結果として、Webブラウザー、検索エンジン、オフィス・アプリケーション、エンドユーザーデバイスといったユーザーとインターネットをつなぐ玄関口に於いて、Googleは大きなシェアを持つようになったのです。これにより、ユーザーの行動データを掌握できる地位を築きました。
2007年、AppleがiPhoneをリリースしました。電話機として、あるいは、音楽プレーヤーとしても使える「携帯できるインターネット常時接続パソコン」、すなわち「スマートフォン」を世に出しました。これは、ユーザーが、iPhoneを操作して、意識して送り出すデータだけではなく、これを持ち歩く人の位置情報や行動データといった意識するしないにかかわらないデータも取得して送り出すデバイスとなりました。
2008年、Googleは自社が買収した企業の開発したスマートフォンOSのAndoroidをオープンソースとして提供、自社のWebブラウザー、検索エンジンと抱き合わせて、この玄関を押さえる施策に出ました。Googleは2013年に自社開発のスマートフォン Pixleをリリースし、この戦略をさらに加速させています。
その後スマートフォンは、アプリケーション・マーケットであるApp StoreやGoogle Playを介して、無料や安価でアプリを導入できる仕組みを提供し、多様なカタチでユーザーの行動データを取得できる手段を手に入れたわけです。
2014年、Amazonが、音声という身近なユーザー・インターフェイスでネットのサービスを利用できるソフトウェアAlexaをリリース、これを搭載したデバイスの販売を始めました。これは、今ひとつ普及はしなかったのですが、これもネットの玄関口を抑える戦略の1つです。また、2015年、Appleは、Apple Watchを発表し、常時身体に装着するデバイスとして、ユーザーの行動データや身体データを常時取得する手段となりました。
冒頭でも述べたように、「ネットワークを行き交うデータを広範かつ大規模に取得することが、社会における覇権を握る決め手となる時代」を迎え、「データ取得のフロントエンド」を手に入れることは、大きな戦略的な価値を持ちます。OpenAIの今回のChatGPTに関わる発表は、まさにこの歴史のトレンドを踏襲しています。
つまり、ChatGPTは、ユーザーのデジタル経済圏の玄関であるインターネットのフロントエンドを抑え、ユーザーに関わる様々なデータを手に入れ、社会における覇権を握ろうというわけです。ただの賢いチャットボット・アプリではないのです。
ChatGPTの魅力は、とても流暢に対話できる「ユーザー・インターフェイス(UI)」を備えていることです。情報の収集や整理、専門家的アドバイスの提供、ドキュメンテーションの支援、画像や図表の生成、プログラム・コードの生成などを、普段、日常で使っている自然な言葉を使って、対話的に、あるいは、指示命令的に使えることです。これに音声認識・テキスト変換の機能も加わり、優秀な専任秘書に話しかけて指示すれば、作業をこなしてくれるようになりました。
この圧倒的な「日常的普通感覚」で利用できるUIだからこそ、ユーザーの支持を得て短期間のうちに普及したわけです。PCやスマホのGUIは、その操作手順をある程度知らなければ、うまく使えません。AmazonのAlexaも、予め用意された会話パターンに対応した指示ができればうまくいくのですが、「日常的普通感覚」で、対話的に利用することはできません。一方、ChatGPTは、まるで本当の人間のコンシェルジュがデバイスの向こうにいて応対してくれるような、これまでのUIを凌駕する圧倒的な、「日常的普通感覚」で、サービスを利用できるところが、利用者の拡大を促しています。
ChatGPTのもうひとつの魅力は、「オペレーティング・エージェント」であるということです。
ご存知のように、コンピューターは、「OS」すなわち「オペレーティング・システム」が搭載されています。OSの起源をたどれば、「DOS」すなわち「Disk Operating System」と呼ばれるものです。ユーザーがハードディスクへの読み書きをする際に、物理的な位置に順序などを詳細に指定しなくても、人間にとって分かりやすいファイル名やディレクトリー名を指定するだけで、操作できるようにしてくれました。人間がハードディスクの物理構造を知らなくても、代行してやってくれることで、コンピューターを操作する利便性が高まりました。その後、データの入出力操作や通信機能などの物理的な機器との接続やプログラムの実行などでも、ユーザーが細かい指定や指示をしなくても、人間にわかりやすい操作、例えば、コマンドやアイコンの操作などを行えば、コンピューターを動かす上で必要とする詳細な指定や命令に最適化して実行してくれるOSへと進化したわけです。もはや人間は、OSの介在なしにコンピューターを操作することはありません。
「オペレーティング・エージェント」は、このOSの上位に介在し、人間にとって分かりやすい自然言語によって指示や命令を出せば、その意図をくみ取り、あるいは対話的に意図を確認し、最適な指示や命令に変換して、コンピューターやアプリーション、ネットサービスを操作してくれる役割を果たしてくれるのです。これにより、それらの操作に熟知していなくても、使いこなすことが容易になるわけです。ChatGPTが、現時点で「オペレーティング・エイジェント=操作代行者」になっているわけではありませんが、そのポジョンを狙っていると言えるでしょう。
OpenAIの今回のアップデートや将来のAIデバイスの開発は、「日常的普通感覚でデジタル・サービスを利用できるUI」、そして、その先の「オペレーティング・エージェント」を目指していることを示しています。この利便性によりユーザーを拡大し、「膨大なデータを常時収集できるプラットフォーム」として、このデータ使って様々な用途に汎用的に利用できる「基盤モデル」を充実させ、「AIアプリケーション・プラットフォーム」として、今後様々な用途に使われていくことになるはずです。
そこに、Microsoftが莫大な資金援助を行い、自社製品への組み込みを積極的に進めている一連の動きは、「データ取得のフロントエンド」、「基盤モデル(Foundation Model)」、「AIアプリケーション・プラットフォーム」としての地位を手に入れる戦略的な意図があると考えられます。
いまでこそ、ChatGPTを使いこなすには、個人的なスキルが必要です。しかし、Github CopilotやOffice365 Copilotのように特定業務に特化した組み込みAIにより、用途を限定することで、その範囲の中で使いやすさを向上させてくるはずです。さらには、「オペレーティング・エージェント」としての役割を進化させ、ユーザーの曖昧さをもうまく解釈し、処理してくれるようになリ、その利便性は一層高まるはずです。
また、一連のAI機能が業務アプリケーションの深いレベルで組み込まれ、ユーザーがこれを使っていることを意識することなく、個人のスキルにも依存しない、利用形態が拡がっていくはずです。さらに自動車や家電製品、設備などにも組み込まれ、私たちはごく自然な対話で機械を操作できるようになるでしょう。既にこのシナリオに沿った製品開発を進めている企業もあるようです。つまり、モノにも「オペレーティング・エージェント」を組み込み、人間に代わって複雑な操作を代行しさせようというものです。いまのモノは、ソフトウエアが機能を実現し、OSも搭載されていますから、これもまた自然の成り行きです。
さらに、今回発表されたMy GPTsを使えば、コーディングなしで自分オリジナルのChatGPTアプリケーションを作成できます。こうして作られたオリジナル・アプリをアプリ・マーケットで販売できるようになります。これにより、OpenAIとしては、新しい収益モデルを構築できるだけではなく、このエコシステムにより、様々なGPTアプリケーションが創発的に生みだされて利用シーンが拡大し、広く流通するようになれば、より広範なユーザーから多様なデータが手に入るようになり、「データ取得のフロントエンド」、「基盤モデル」、「AIアプリケーション・プラットフォーム」の戦略基盤は、確固たるものになるはずです。
もちろん、現状は過渡期であり、技術の発展が指数関数的なスピードで繰り広げられる中、OpenAI×Microsoftのシナリオ通りに行くという保証はありません。GoogleやAmazon、Metaといったプラットフォーマーが、同様の地位を手に入れようと動き出しています。
残念ながら、日本のIT企業に同様の動きは見られません。もはや周回(何周かの)遅れです。ただ、日本は、こういうものをうまく使いこなすことに長けてはいますので、その応用の範囲で魅力的なサービスを提供することや、日本語に特化したLLM(大規模言語モデル/言語データに特化した基盤モデル)を開発し、プラットフォーマーの提供するサービスと組み合わせて利用するケースはあるでしょう。しかし、「根っ子を牛耳る」ことは、難しいかも知れません。
これは、良い悪いの話しではなく、「戦略」あるいは「生き方」の問題です。日本は、これまで、このやり方で成功してきたわけですから、これもまたしたたかなやり方ではないでしょうか。
いずれにしろ、今回のOpenAIの発表は、「歴史は繰り返す」を地で行く様相を呈しています。また、OSの時代から「オペレーティング・エージェント」の時代への潮目デモあると言えるでしょう。このようなトレンドを理解した上で、自分たちはどう関わっていけばいいかを考えることは、自社の事業戦略、あるいは、自分のキャリア形成という観点で、大変重要な視点であろうかと思います。
神社の杜のワーキング・プレイス 8MATO
書籍案内 【図解】コレ一枚でわかる最新ITトレンド 改装新訂4版
ITのいまの常識がこの1冊で手に入る,ロングセラーの最新版
「クラウドとかAIとかだって説明できないのに,メタバースだとかWeb3.0だとか,もう意味がわからない」
「ITの常識力が必要だ! と言われても,どうやって身につければいいの?」
「DXに取り組めと言われても,これまでだってデジタル化やIT化に取り組んできたのに,何が違うのかわからない」
こんな自分を憂い,何とかしなければと,焦っている方も多いはず。
そんなあなたの不安を解消するために,ITの「時流」と「本質」を1冊にまとめました! 「そもそもデジタル化,DXってどういう意味?」といった基礎の基礎からはじめ,「クラウド」「5G」などもはや知らないでは済まされないトピック,さらには「NFT」「Web3.0」といった最先端の話題までをしっかり解説。また改訂4版では,サイバー攻撃の猛威やリモートワークの拡大に伴い関心が高まる「セキュリティ」について,新たな章を設けわかりやすく解説しています。技術の背景や価値,そのつながりまで,コレ1冊で総づかみ!
【特典1】掲載の図版はすべてPowerPointデータでダウンロード,ロイヤリティフリーで利用できます。社内の企画書やお客様への提案書,研修教材などにご活用ください!
【特典2】本書で扱うには少々専門的な,ITインフラやシステム開発に関わるキーワードについての解説も,PDFでダウンロードできます!
2022年10月3日紙版発売
2022年9月30日電子版発売
斎藤昌義 著
A5判/384ページ
定価2,200円(本体2,000円+税10%)
ISBN 978-4-297-13054-1
目次
- 第1章 コロナ禍が加速した社会の変化とITトレンド
- 第2章 最新のITトレンドを理解するためのデジタルとITの基本
- 第3章 ビジネスに変革を迫るデジタル・トランスフォーメーション
- 第4章 DXを支えるITインフラストラクチャー
- 第5章 コンピューターの使い方の新しい常識となったクラウド・コンピューティング
- 第6章 デジタル前提の社会に適応するためのサイバー・セキュリティ
- 第7章 あらゆるものごとやできごとをデータでつなぐIoTと5G
- 第8章 複雑化する社会を理解し適応するためのAIとデータ・サイエンス
- 第9章 圧倒的なスピードが求められる開発と運用
- 第10章 いま注目しておきたいテクノロジー