news

AI日報:Claude Sonnet 4.6が強力にアップグレード、Google Lyria 3音楽生成が登場、OpenAIはブロックチェーンの安全性に注力

February 19, 2026
Updated Feb 19
1 min read

今日のAI技術界は、生産性向上ツールからエンターテインメント・アプリケーションまで、重要なアップデートで溢れています。Anthropicは、既存モデルの限界に挑戦する、より強力なClaude Sonnet 4.6を発表しました。GoogleはGeminiに高度な音楽作成機能を搭載し、NotebookLMのプレゼンテーション機能も強化しました。さらに、OpenAIはブロックチェーンの安全性に目を向け、オープンソースコミュニティには驚くべき軽量音声モデルが登場しました。この記事では、これらの重要な技術的進歩について紹介します。


AnthropicがClaude Sonnet 4.6を発表:より賢く、コンピュータ操作に長けたAIアシスタント

Anthropicは再び基準を引き上げ、Claude Sonnet 4.6を正式にリリースしました。このモデルは、これまでで最も強力なSonnetバージョンと公式に謳われており、コーディング、コンピュータ操作(Computer Use)、長文推論、エージェント計画(Agent Planning)などの主要分野で全面的にアップグレードされています。

開発者やヘビーユーザーにとって最もエキサイティングなニュースは、Sonnet 4.6がベータ版で最大100万トークンのコンテキストウィンドウをサポートすることです。つまり、小説一冊分、膨大なコードベース、あるいは複雑な法的文書を、前の内容を「忘れる」ことなく一度に処理できるようになったのです。現在、このモデルはclaude.aiとClaude Coworkのデフォルトモデルとなっており、無料ユーザーもProユーザーもすぐに体験することができます。

基礎能力の向上に加え、Sonnet 4.6は「コンピュータ操作」スキルにおいても長足の進歩を遂げました。Anthropicは2024年10月に、AIが人間のようにコンピュータを操作するという概念を導入しました。そして今、16ヶ月の改良を経て、Sonnet 4.6はOSWorldベンチマークでのパフォーマンスを大幅に向上させました。ウェブ閲覧、複数ステップのフォーム入力、さらには複数のブラウザタブ間の切り替えといったタスクを、よりスムーズに処理できるようになりました。操作速度や精度はまだ人間の専門家レベルには完全には達していませんが、これはAIが単なる「対話者」から、実際に面倒な作業を代行してくれる「実行者」へと変化したことを意味します。


Google GeminiがLyria 3を統合:テキストと画像で音楽を作曲

AIとのチャットが少し単調に感じられるなら、Googleの新機能が目を引くかもしれません。Googleは、DeepMindの最先端音楽生成モデルLyria 3をGeminiアプリに統合すると発表しました。この機能は現在テスト段階ですが、テキストで説明したり、画像をアップロードしたりするだけで、誰でも30秒の高品質な音楽を生成することができます。

この技術の面白いところは、そのマルチモーダルな特性にあります。音楽理論を知らなくても、Geminiに「片方見つからない靴下についてのスローなR&Bソングを作って」と伝えるだけで、数秒後にはボーカル、メロディー、伴奏を含んだ曲が誕生します。さらに、森の中にいる愛犬の写真をアップロードして、その雰囲気に合ったBGMをAIに作ってもらうことも可能です。

もちろん、生成音楽の普及に伴い、著作権や安全性も重要な関心事となっています。Googleは、Lyria 3によって生成されたすべてのオーディオトラックにSynthID透かしが埋め込まれることを強調しています。これは人間の聴覚では感知できませんが、機械には識別可能なマーカーであり、その音声がAIによって生成されたことを証明するために使用されます。これはクリエイターを保護するだけでなく、AIコンテンツの識別をより透明性の高いものにします。現在、この機能は複数の国で展開されており、多言語に対応しているため、メッセージを送るのと同じくらい簡単に音楽制作ができます。


OpenAIがEVMbenchを発表:AIでブロックチェーンのスマートコントラクトを守る

フィンテック分野では、スマートコントラクト(Smart Contracts)が数千億ドルの資産を管理しており、その安全性は極めて重要です。OpenAIはParadigmと提携し、ブロックチェーン環境における脆弱性の検出、修正、悪用を行うAIエージェントの能力を評価するための新しいベンチマークツール、EVMbenchを発表しました。

EVMbenchのリリースは、OpenAIがサイバーセキュリティ防御へのAI活用を真剣に捉えていることを示しています。このツールには、主に実際のコード監査コンテストから集められた、120の厳選された重大な脆弱性が含まれています。その動作モードは3つに分かれています:コントラクト内の脆弱性をAIが見つけられるかを確認する検出(Detect)、元の機能を損なうことなくAIが脆弱性を修正できるかをテストする修正(Patch)、そして、AIがハッカーの攻撃をシミュレートして脆弱性の真偽を検証できるかを見る、実質的な「レッドチーム演習」である**悪用(Exploit)**です。

現在のテスト結果によると、GPT-5.3-Codexのようなモデルは「悪用」モードでは優れたパフォーマンスを示していますが、微妙な脆弱性の「検出」や「修正」にはまだ改善の余地があります。この研究の核心的な目的は、開発者がAIを活用して防御的な監査を行い、ハッキング被害に遭ってから対処するのではなく、コントラクトのデプロイ前に潜在的なリスクを特定できるようにすることです。


NotebookLMの大型アップデート:一言でプレゼンテーションを修正

Googleのメモ・リサーチアシスタントNotebookLMも本日、ユーザー待望の機能アップデートを迎えました。ユーザーは自然言語プロンプトを使って、生成されたスライドの内容を直接修正できるようになりました。

これまでは、AIが生成したスライドのスタイルが合わなかったり、焦点がずれていたりした場合、ユーザーはページごとに手動で調整する必要がありました。これからは、「すべてのタイトルをもっと活気のある口調に変えて」や「3ページ目のテキストを要約して」と入力するだけで、システムが自動的に修正を行ってくれます。さらに、NotebookLMはついにPPTX形式へのエクスポートに対応しました。PowerPointを使ってプレゼンテーションを行うビジネスパーソンにとって、これは間違いなく朗報です(Googleスライドへの対応も間もなく予定されています)。これにより、資料整理から最終的な発表までのフローがよりスムーズになります。


Kitten MLが超軽量オープンソースTTSモデルを公開:あらゆるデバイスで動作する小ささ

以前のKittenTTSを覚えていますか?ローカル環境でのAIアプリケーション開発を好む開発者にとって、Kitten MLの新しいリリースは間違いなく注目に値します。彼らは3つの極めて軽量な音声合成(TTS)モデル、Kitten TTSをオープンソース化しました。

これらのモデル(Mini 80M、Micro 40M、Nano 14M)の特徴は、とにかく「小さい」ことです。最小のNanoバージョンはわずか1400万パラメータで、ファイルサイズは25MB未満です。つまり、高価なGPUは必要なく、Raspberry Piや古いスマートフォンなどのエッジデバイスでも、CPUだけで高品質な音声生成をスムーズに実行できるのです。

このモデルセットは、表現力豊かな8種類の音声(男性4、女性4)を提供し、Apache 2.0ライセンスの下で完全に商用利用無料です。これは、高品質なTTSがクラウドAPIに依存しがちだったこれまでの制限を打ち破り、ローカル音声アシスタントやオフラインアプリケーションの新たな可能性を切り開きます。


Google AIインパクトサミット:インフラと人材に150億ドルを投資

最後に、インドに視点を移しましょう。Google AIインパクトサミットにおいて、Googleはデジタルデバイド(情報格差)の解消を目的とした一連の重要計画を発表しました。これには、インドでのAIインフラ構築への150億ドルの投資や、新しい海底ケーブルを通じてグローバル・サウスのネットワーク強靭性を高める「米印コネクト・イニシアティブ(America-India Connect initiative)」の立ち上げが含まれます。

ハードウェア建設に加え、Googleは人材育成へのリソース投入も約束しており、インド政府と協力して数百万人の公務員にAIツールのトレーニングを実施することや、気候変動や医療ヘルスケアなどの複雑な問題解決にAIを活用する世界中の研究者に資金を提供することなどが含まれます。これらの動きは、テクノロジー大手が製品イノベーションを推進する一方で、AIの恩恵が世界各地により公平に行き渡るよう努めていることを示しています。


よくある質問 (FAQ)

Q:Claude Sonnet 4.6は無料ですか? A:はい、Claude Sonnet 4.6は現在、claude.aiの無料ユーザーおよびProユーザーのデフォルトモデルとなっています。ただし、無料ユーザーは使用回数やレート制限が厳しくなる可能性があります。

Q:GoogleのLyria 3を使って音楽を作るにはどうすればいいですか? A:Lyria 3は現在Geminiアプリに統合されています。お住まいの地域で機能がサポートされていれば、アプリ内でテキストプロンプトを入力するか画像をアップロードするだけで、音楽制作を開始できます。

Q:NotebookLMからエクスポートしたPPTXファイルはKeynoteやLibreOfficeで開けますか? A:通常、PPTXは汎用的なプレゼンテーション形式であるため、KeynoteやLibreOffice Impressなどのソフトでも開くことができますが、レイアウトに若干のズレが生じる可能性があります。最適な結果を得るにはPowerPointの使用をお勧めします。

Q:Kitten TTSのモデルは日本語に対応していますか? A:現在のリリース情報によると、Kitten TTS V0.8バージョンは主に英語をサポートしていますが、公式によると将来のバージョンで多言語サポートが追加される予定です。オープンソースであるため、コミュニティから他の言語のファインチューニングバージョンがすぐにリリースされる可能性もあります。

シェアする:
Featured Partners

© 2026 Communeify. All rights reserved.