Computer useのアイキャッチ画像

MicrosoftがCopilot Studioに新機能「Computer use」を追加!AIがパソコンを直接操作してくれるってホント?

生成AIが普及するなかで、Microsoftがさらなるツールを発表しました。

Microsoftが発表したのは「Copilot Studio」内で使える「Computer use」という機能です。

なんとAIが自動でパソコンを操作してくれる機能とのことですが、どういった機能なのでしょうか?

Computer useに関してわかっていることについてお知らせします!

MicrosoftがComputer useを発表

「Computer use」は、2025年4月15日(米国時間)にMicrosoftが発表したCopilot Studioの新機能です。

Copilot Studioとは、Microsoftが提供する生成AIプラットフォームの一部です。このツールを利用すると、AIを使ったコンテンツ生成やプロセスのカスタマイズを行うことが可能です。

具体的には、以下のような機能があります。

  • コンテンツ生成:文章や画像の作成、翻訳、編集が可能。
  • ビジネスツールの統合:既存のアプリケーションやサービスと連携し、業務プロセスを最適化。
  • カスタマイズ性:自分のニーズに合わせた設定やワークフローの調整。

そういった機能を備えるCopilot Studioに、Computer useが新機能として搭載されることになったのです。

AIエージェントが直接操作してくれる機能

Computer useの特徴はAIエージェントがWebサイトやデスクトップアプリケーションのGUI(グラフィカルユーザーインターフェース)を直接操作してくれる点です。

すこし怖い気もしますが、まさに未来的な機能!

Computer useの具体的な機能

Computer useの具体的な機能は下記のようなものが公開されていました。

  • GUIの直接操作: 自然言語で指示するだけで、AIエージェントがボタンのクリック、メニューの選択、テキスト入力など、画面上のあらゆる操作を自動で行う。
  • API不要の自動化: API連携が難しい従来のシステムや、Webブラウザ上の操作も自動化。
  • 複雑なUIへの対応: 動的なインターフェースや頻繁に変更されるWebサイトやアプリにも自動的に適応。
  • 推論による柔軟な対応: 画面上の情報を認識し、リアルタイムで状況に合わせて適切な判断を行う。
  • 透明性の確保: 実行された操作の履歴(スクリーンショットや推論ステップを含む)を確認できる。
  • セキュリティ: 処理されるデータはMicrosoftのクラウド環境内に保持され、基盤となる大規模言語モデル(LLM)のトレーニングには使用されない。

GUIの直接操作がメイン機能ですが、画面上の情報を認識して、リアルタイムで状況に応じて判断してくれるとなると、本当に未来の世界に来たような話に感じます。

Computer useの活用例

では、Computer useはどういった場面で活躍するのでしょうか?

その活用例について解説します。

  • 大量のデータ入力の自動化。
  • 市場データの収集と分析。
  • カスタマーサポートの支援

上記のような場面で活躍することが想定できます。

大量のデータ入力の自動化

例えば、会計チームが請求書からデータを手作業で会計システムに入力する作業を効率化したい場合、Computer useが活躍します。

請求書PDFを読み取って必要な情報を抽出してくれたり、データを会計ソフトウェアの入力フォームに自動で転記するという使い方です。

大量のデータ入力の自動化を実現できると、ヒューマンエラーが減り、作業時間を大幅に短縮できるでしょう。

市場データの収集と分析

マーケティング部門や経営企画チームが市場分析を行う際に、作業を効率化できます。

Webサイトから価格情報や競合の動向を収集したり、必要なデータをExcelにまとめて、視覚的な分析を自動生成してくれることも可能でしょう。

これにより、迅速な意思決定が可能になります。

カスタマーサポートの支援

Computer useを使えば、カスタマーサポートの支援にも役立てられそうです。

顧客からの問い合わせに対して、チケットシステムを操作して顧客情報を検索してもらえば、対応がスムーズになります。

また、顧客の問題に応じたFAQや解決策を自動で提案することも可能でしょう。

これにより、カスタマーサポートのスタッフが迅速に問題を解決できるようになります。

Computer useの設定にコーディングは不要

複雑なツールを使う際、コーディングが必要になることがあります。

コーディングとは、コンピュータに指示を出すためのプログラム(コード)を作成するプロセスのことです。特定の目的を達成するために、プログラミング言語を使って命令を書き、コンピュータに実行させます。例えば、ウェブサイト、アプリ、ゲーム、または自動化されたタスクの作成などが含まれます。言わば、コンピュータに「何を」「どのように」やるかを教える作業です。

Computer useに関してはコーディングが不要となっており、自然言語で指示を出せばOKのようです。

また、AIがキャプチャしたスクリーンショットや推論ステップも確認できるため、どのようなデータを元に行動を決定したのかも確認できることがわかっています。

Computer useはいつから使える?

Computer useは2025年4月15日(米国時間)に公開されたツールですが、いつから使えるようになるのでしょうか?

Computer useをいつから使えるようになるかを調査しました。

2025年4月時点はリサーチプレビュー版で使える

2025年4月20日時点で、Computer useはアーリーアクセスのリサーチプレビュー版として提供されています。

アーリーアクセスのリサーチプレビュー版ということで、一部の選ばれた人だけが使える状態のようです。

プレビュー版に参加したい場合、以下のような手順で参加できることがあるようですが、確定した情報は確認できませんでした。

  • 公式ウェブサイトの確認: MicrosoftのCopilot Studioに関するページで、リサーチプレビュー版の詳細を探す。
  • 登録フォームの提出: プレビュー版に参加するための申し込みフォームが提供されている場合、それを記入して提出する。
  • 資格要件の確認: プログラムに参加するための条件(例えば、Microsoft 365のライセンス保持者であることなど)を満たしているか確認する。
  • 通知を待つ: Microsoftからの承認や次のステップに関する通知を待つ。

2025年5月のイベントに注目

Computer useに関する詳しい情報に関しては、2025年5月に開催される「Microsoft Build 2025」で公開される予定です。

この中でより詳しい情報が公開され、一般ユーザーがComputer useを使用できる日時についても明かされるかもしれません。

Microsoftの公式サイトの情報はこちらから確認してください。

実は他のツールでComputer useは実装済み?

MicrosoftのCopilot StudioにおいてComputer useが使えるという情報を紹介しましたが、実は他のツールですでにComputer useの機能が実現しているようです。

そのツールについて紹介します。

ClaudeならComputer useが実装済

Claudeという対話型AIツールがあるのですが、実はそのツールにはすでに「Computer use」が実装されていて利用可能なのです。

Claudeは、Anthropic社が開発し、自然言語処理を活用してさまざまなタスクを支援する生成AIで、テキスト生成や要約、データ解析やコード作成などができます。

Claudeの詳しい機能については、下記の記事で紹介しています。

そのClaudeにはComputer Useが搭載されており、画面上の情報を認識し、マウスポインタを動かしたり、ボタンをクリックしたり、テキストを入力したりといった操作が可能です。

主な特徴は下記のようになっています。

  • 画面認識: スクリーンショットを通じて画面上の要素(ボタン、アイコンなど)を特定し、操作を実行。
  • マウス操作: 指定された座標にカーソルを移動し、クリック操作を行う。
  • キーボード入力: テキストボックスへの文字入力やショートカットキーの送信が可能。
  • アプリケーション操作: アプリを起動し、その中でさらにボタン操作やスクロールなどを実行。

この情報を確認すると、MicrosoftのCopilot StudioのComputer Useに近い印象を受けますよね。

データ入力の自動化や複雑な作業の連続実行ができるため、大幅な業務効率化が望めそうです。

ただし、こちらも実装済とはいえ試験的な公開ベータ版の機能となっております。

実際の操作の雰囲気は、こちらの公式サイトの動画をチェックしてみてください。

まとめ

「computer use」機能は、これまで自動化が難しかったGUIベースの操作をAIによって実現する画期的な機能と言えるでしょう。

2025年4月時点では早期プレビュー版として利用可能な機能となっており、一般ユーザーは実際に操作できない状態です。

しかし、2025年5月のMicrosoftのイベントで新しい情報が公開されることが決定しています。

そのイベントでどういった情報が公開されるか楽しみに待ちましょう!

この記事は私が書いたよ!

kumasan

さまざまな生成AIを楽しんでいます! 趣味はエレキギターということもあり、音楽系の生成AIにかなり注目しています。また、日常やビジネスで使える便利な生成AIツールや、新しく登場する生成AIにどんどんチャレンジ中! みなさんに生成AIの情報をお届けして、その便利さを伝えたいです!

TOP