2026年4月5日 AIニュースまとめ

Anthropicが史上最大10兆パラメータの「Claude Mythos 5」を発表し、OpenAIのGPT-5.4はコンピュータを自律操作する能力を獲得。GoogleのGemini 3.1は推論ベンチマークで業界トップ性能を記録しました。一方、日本ではデジタル庁が全府省庁18万人を対象に国産AI「源内」の大規模実証を開始。Microsoftは自律実行するCopilot Coworkを稼働させ、AppleはGoogle Gemini搭載の次世代Siriを発表。AIが「答える」から「実行する」存在へと進化した1か月の全貌をお伝えします。

1. Anthropic、史上最大10兆パラメータの「Claude Mythos 5」を発表
1. 3つの特化領域で人間を超える性能
2. アクセシビリティを高める「Capabara」も同時リリース
2. OpenAI GPT-5.4、AIが「答える」から「操作する」時代へ
3. Google Gemini 3.1、業界トップの推論性能とリアルタイム処理を実現
4. デジタル庁、全府省庁18万人対象にガバメントAI「源内」大規模実証開始
5. Microsoft Copilot Cowork本格稼働、AIが自律的に業務を実行
6. Apple、Google Gemini搭載の次世代Siri発表 — 2026年後半に提供開始
今回の記事まとめ
1. 出典一覧

1. Anthropic、史上最大10兆パラメータの「Claude Mythos 5」を発表

2026年4月初旬、Anthropicは史上最大規模となる10兆パラメータのフロンティアAIモデル「Claude Mythos 5」を発表しました。これは従来のフロンティアモデルと比較して数倍から10倍以上の規模で、公開されているAIモデルの中で最大です。

3つの特化領域で人間を超える性能

Claude Mythos 5は、以下の3分野に特化して設計されています。

サイバーセキュリティ：脆弱性分析、脅威検出、セキュリティコード監査において、複雑なシステムの潜在的な脆弱性を特定し、攻撃パターンを予測する能力が従来のセキュリティツールを大きく上回ります。
高度なコーディング：大規模コードベースの理解、リファクタリング、バグ修正、新機能実装を自律的に実行。複数ファイル間の依存関係を正確に把握し、エンタープライズグレードのコード品質を維持します。
学術研究：科学論文の深い理解、仮説生成、実験設計、データ分析において研究者レベルの洞察を提供し、複雑な学術文献を横断的に分析します。

アクセシビリティを高める「Capabara」も同時リリース

Anthropicは同時に、より小規模でコスト効率の高い「Capabara」モデルもリリースしました。日常的なビジネスタスク、カスタマーサポート、コンテンツ生成などの用途において、十分な性能と手頃なコストのバランスを提供し、AIの民主化を加速させています。

出典: https://blog.mean.ceo/new-ai-model-releases-news-april-2026/

2. OpenAI GPT-5.4、AIが「答える」から「操作する」時代へ

OpenAIは2026年3月5日、次世代AIモデル「GPT-5.4」シリーズ（Thinking、Pro、Standard）を正式リリースしました。最大の特徴は、ネイティブな「コンピュータ操作機能」の搭載です。

OSレベルでの自律操作が可能に

GPT-5.4は、実際のデスクトップ環境を理解し、以下のような操作を自律的に実行できます：

ファイルの作成、編集、移動、削除
Webブラウザの起動とページ遷移
複数アプリケーション間でのデータのコピー&ペースト
スプレッドシートへのデータ入力と計算
プレゼンテーション資料の作成
ターミナルでのコマンド実行

人間を超えるベンチマークスコア

GPT-5.4は、OSWorld-Verifiedベンチマーク（実際のOS環境でのタスク実行能力を測定）において75.0%のスコアを記録し、初めて人間の平均的なパフォーマンスを上回りました。さらに、GDPVal（経済的価値を生むタスクでのAI性能を測定）では83.0%を記録。財務モデリング、法律文書作成、ソフトウェアエンジニアリングなど44職種の専門業務において、人間の専門家と同等以上の性能を示しました。

3つのバリエーションで多様なニーズに対応

GPT-5.4 Thinking：「テスト時コンピュート」技術を活用し、複雑な問題に対して深い分析を実行
GPT-5.4 Pro：最大のコンテキストウィンドウ（100万トークン）と最高精度を提供
GPT-5.4 Standard：速度とコストのバランスを最適化した一般ユーザー向けモデル

OpenAIは、ChatGPT、Codex、ブラウジング、エージェント機能を統合した「AIスーパーアプリ」構想を進めており、2026年中に提供予定です。

出典: https://openai.com/index/introducing-gpt-5-4/

3. Google Gemini 3.1、業界トップの推論性能とリアルタイム処理を実現

Google DeepMindは2026年2月19日、次世代マルチモーダルAIモデル「Gemini 3.1 Pro」を正式発表しました。GPQA Diamondベンチマークで94.3%を記録し、推論タスクにおいて業界トップの性能を達成しました。

専門家を大きく上回る推論能力

GPQA Diamondは大学院レベルの物理学、化学、生物学などの専門分野における深い理解と推論能力を測定するベンチマークで、人間の専門家でも平均70%程度のスコアしか出せません。Gemini 3.1 Proの94.3%という結果は、AIが専門的な科学知識において人間を大きく上回ったことを意味します。

また、ARC-AGI-2（抽象的な推論能力を測定）では77.1%のスコアを記録。これはGemini 3 Proの約2倍で、AIの「一般知能」における大きな飛躍を示しています。

リアルタイム音声・画像処理で産業革新

Gemini 3.1は、テキスト、画像、音声、動画、コードを「ネイティブに」理解・処理できる統合型のマルチモーダルアーキテクチャを採用。以下のような実用的な応用が可能です：

医療・ヘルスケア：医師がX線やMRI画像を見せながら音声で質問すると即座に診断支援情報を提供
カスタマーサービス：ビデオ通話で顧客の製品を見ながらトラブルシューティング、表情や声のトーンから感情を読み取り適切な対応を調整
自律システム：ロボットがカメラ映像と音声指示を同時に処理し複雑な作業を実行

超高速・超低価格のFlash-Lite

効率性に特化した「Flash-Lite」バージョンは、2.5倍高速な応答時間、45%速い出力生成、入力トークンあたり0.25ドル/100万トークンという破格の価格設定を実現。スタートアップや中小企業でもフロンティア級のAI性能にアクセスできるようになりました。

さらに、「Deep Research」機能により、数時間から数日かかっていた市場調査や競合分析が、わずか5分程度で完了するようになります。

出典: https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/

4. デジタル庁、全府省庁18万人対象にガバメントAI「源内」大規模実証開始

デジタル庁は2026年3月6日、全府省庁の約18万人の政府職員を対象とした国産生成AI利用環境「源内（げんない）」の大規模実証を開始すると発表しました。江戸時代の発明家・平賀源内の名を冠したこのプロジェクトは、日本政府によるAI導入としては史上最大規模です。

国産AI「7人の侍」で技術主権を確保

デジタル庁は、「源内」に搭載するAIモデルとして日本国内で開発された「7人の侍」と呼ばれる国産AIを選定しました。日本語処理能力、セキュリティ、カスタマイズ性、継続的な改善といった基準で選定され、外国製AIへの依存リスクを回避し、技術主権を確保しています。

なぜ今、ガバメントAIが必要なのか

日本政府がガバメントAIの導入を急ぐ背景には、以下の深刻な構造的課題があります：

少子高齢化による担い手不足：公務員の採用が年々困難になり、ベテラン職員の退職により知識やノウハウが失われるリスク
業務量の増加と複雑化：行政サービスの多様化、国際情勢の変化、災害対応の増加
デジタル化の遅れ：COVID-19パンデミックで顕在化した行政デジタル化の遅れ
技術主権の確保：行政の中枢で外国製AIに依存することのセキュリティリスクと技術的自律性の問題

「源内」で実現する業務効率化

政府職員は「源内」を使って、会議議事録の自動作成、報告書の要約、定型文書のドラフト作成、過去の行政文書からの関連情報検索、法令解釈支援、統計データの傾向分析、政策効果の予測シミュレーション、外国語文書の翻訳など、幅広い業務を効率化できます。

2026年5月から本格実証開始

2025年5月からデジタル庁内で先行利用が開始され、2026年5月から約18万人の政府職員を対象とした大規模実証が始まります。2027年度には本格運用へ移行予定です。成功すれば、日本の行政効率化と国産AI産業の育成の両面で大きな成果となるでしょう。

出典: https://www.digital.go.jp/news/2d69c287-2897-46d8-a28f-ea5a1fc9bce9

5. Microsoft Copilot Cowork本格稼働、AIが自律的に業務を実行

Microsoftは2026年3月30日、次世代AI協働システム「Copilot Cowork」を正式稼働させました。ユーザーが達成したい目的を伝えるだけで、AIが自動的に計画を立案し、複数のツールやファイル間でタスクを自律的に実行します。

「アシスタント」から「実行主体」へ

従来のCopilotがユーザーの指示に応答する「アシスタント」だったのに対し、Coworkは目的達成のために自律的に行動する「実行主体・協働パートナー」です。単一タスクではなく、複数ステップにわたる長期タスクを、Word、Excel、PowerPoint、Outlook、Teamsなどを横断して実行し、リアルタイムで進捗を可視化します。

Wave 3：各アプリに埋め込まれたエージェント

Wave 3のMicrosoft 365 Copilotは、各アプリケーションに深く統合された「埋め込みエージェント」を特徴としています：

Word：文脈理解、スタイル学習、参照管理、多言語対応
Excel：数式提案、自動クリーニング、可視化推奨、予測分析
PowerPoint：デザイン最適化、ストーリーテリング、画像検索、スピーカーノート生成
Outlook：優先順位付け、返信ドラフト、会議準備、フォローアップ

企業での導入成果

早期アクセスプログラムに参加した企業からは、月次レポート作成時間70%削減、データ入力エラー85%減少、クライアントレポート作成の自動化率92%達成、提案書作成時間60%削減といった成果が報告されています。

出典: https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/30/copilot-cowork-now-available-in-frontier/

6. Apple、Google Gemini搭載の次世代Siri発表 — 2026年後半に提供開始

Appleは2026年4月初旬、完全刷新されたAI搭載の次世代Siriを発表しました。Google Geminiモデルを活用し、Apple独自のPrivate Cloud Computeインフラ上で動作するこの新Siriは、画面の内容を認識する「画面認識機能」、複数アプリを横断した統合動作、深い文脈理解能力を備えた真のコンテキストアウェアアシスタントです。

AppleとGoogleの歴史的パートナーシップ

Appleは、Googleの最先端マルチモーダルAI「Gemini」を活用することで、より早く、より高性能なAIアシスタントを実現する戦略を選択しました。一方、プライバシー保護は妥協せず、「Apple Private Cloud Compute」により、Googleにユーザーデータやクエリログは一切送信されず、処理後即座にデータを削除する仕組みを構築しています。

革新的な「画面認識機能」

新Siriの最も画期的な機能が「画面認識」です。Siriはユーザーが現在見ている画面の内容を理解し、文脈に沿った支援を提供できます。

例えば、友人から「明日のランチ、何時にする?」というメッセージを受信すると、Siriは画面上のメッセージ内容を理解し、カレンダーを確認して「明日は12:00〜13:00と14:00以降が空いています。12:30はいかがですか?」と提案。ユーザーの確認後、返信とカレンダー登録を実行します。

アプリ横断統合とパーソナライゼーション

新Siriは、複数のアプリをまたいでタスクを実行できます。「来月のハワイ旅行の準備をして」という指示で、フライト予約確認メール検索、旅行期間のカレンダーブロック、タスク作成（パスポート確認、荷物準備）、周辺レストラン・観光スポットのリサーチ、旅行計画メモ作成、天気予報チェックと服装アドバイスなどを自動実行します。

さらに、ユーザーの習慣、好み、行動パターンを学習（デバイスローカルで処理、プライバシー保護）し、「通勤時間が近づいています。いつものルートは渋滞しているので、代替ルートを提案します」といったパーソナライズされた提案を行います。

2026年9月、iOS 20と共に正式リリース

対応デバイスは、iPhone 15 Pro以降（A17 Proチップ以降）、iPad Pro/Air（M2チップ以降）、Apple Silicon搭載Mac（M2チップ以降）です。2026年6月の開発者プレビュー版、7〜8月のパブリックベータ版を経て、9月にiOS 20、iPadOS 20、macOS 16と共に正式リリースされます。

サードパーティアプリ開発者向けには、大幅に強化された「SiriKit 2.0」も提供され、Apple純正アプリと同レベルのSiri統合が可能になります。