AI アプリケーションツールボックス: LLM、画像、音声、生産性向上オープンソースツールをワンストップで探求

298 items found

Sort by:

news

AI日報：Qwen3-TTSが音声合成の新たな基準を確立、Googleは4D世界を理解し検索はより親切に

AI技術の進化は日進月歩です。Qwenチームは強力なQwen3-TTS音声モデルを新たにオープンソース化し、驚異的な音声クローンと多言語生成をサポートしました。Google DeepMindはD4RTモデルを発表し、AIが時間と空間の4D次元を理解できるようにしました。同時に、Google検索はPersonal In......

daily

View Details

tool

Qwen3-TTSファミリーが登場：音声クローンと生成の新たな基準

QwenチームはQwen3-TTSシリーズモデルを正式にオープンソース化しました。「ファミリー」と呼ばれるこのソリューションは、音声クローン、創造から高忠実度の音声制御までの完全な機能を提供します。この記事では、そのデュアルトラックモデリング技術、異なるパラメータモデルの応用シナリオ、およびGitHubとHuggin......

voice

View Details

news

AI日報：Claudeの新憲法、Microsoft VibeVoiceの長尺音声への挑戦、GeminiのSAT対策ツール

本日のAI日報では、3つの重要な進展に注目します。Anthropicが「新憲法」を通じてClaudeの核心的価値観をどのように再形成しているか、MicrosoftのVibeVoiceモデルが1時間に及ぶ音声文字起こしの課題をどのように解決したか、そしてGoogle GeminiがPrinceton Reviewと提携......

daily

View Details

tool

途切れる録音にサヨナラ！Microsoft VibeVoice ASRが挑む60分連続の高精度文字起こし

途切れる録音にサヨナラ！Microsoft VibeVoice ASRが挑む60分連続の高精度文字起こし AIを使って長時間の議事録やポッドキャストの文字起こしをしようとしたことがあるなら、こんな状況に覚えがあるかもしれません。最初の10分は正確なのに、会話が長くなるにつれて意味が支離滅裂になり、誰が何を言ったのかさえ......

asr

View Details

news

AI 日報：OpenAI が年齢予測機能を開始、サム・アルトマンとマスクが安全性を巡り激論

OpenAI は、青少年にとってより安全なデジタル環境を提供するため、ChatGPT の消費者版に年齢予測モデルを正式に導入しました。しかし、この動きはイーロン・マスクによる ChatGPT の安全性に対する厳しい非難と重なり、サム・アルトマンがテスラのオートパイロット事故を引き合いに出して鋭く反論する事態に発展しま......

daily

View Details

news

AI日報：AIの二重進化：安定した「人格」からビジネス価値の弾み車へ

AI技術が進化し続ける中、私たちは全く異なる二つの、しかし密接に関連した発展の方向性を目の当たりにしています。一方では、研究者たちがAIの「性格」をより安定させ、会話中の暴走を防ごうと努力しています。他方では、ビジネスモデルの弾み車が高速で回転し、計算能力を驚異的な経済価値へと変えています。これは単なる技術の積み重ね......

daily

View Details

news

AIデイリー：2026年の新局面：ChatGPT Goのグローバル展開と広告テスト開始、Claude Coworkもアップデート

2026 AI新局面：ChatGPT Goのグローバル展開と広告テスト開始、Claude Coworkもアップデート OpenAIは月額8ドルのChatGPT Goサブスクリプションプランを正式にグローバル展開し、普及を支えるために米国での広告テストを間もなく開始すると発表しました。一方、競合のAnthropicはPr......

daily

View Details

news

AI日報：GoogleがTranslateGemmaでオープンソース翻訳を再定義、FLUX.2 [klein]が画像生成をミリ秒速へ

今日もテック業界にとって忙しい一日となりました。2つの主要なモデルファミリーが同時に重要なアップデートを発表しました。Googleは言語の壁を取り払うために設計されたTranslateGemmaをリリースし、Black Forest LabsはFLUX.2 [klein]で高品質な画像生成が驚くほど高速になることを証......

daily

View Details

tool

FLUX.2 [klein] 登場：即時画像生成の極速体験と新たな基準

Black Forest Labsの最新モデルFLUX.2 [klein]ファミリーは、その驚異的な生成速度と低いハードウェア要件により、AI画像制作の敷居を再定義します。この記事では、家庭用GPUでスムーズに動作し、0.5秒以内に画像を生成できるこの強力なツールを深く掘り下げ、開発者やクリエイターへの実際の影響を探......

image

View Details

tool

GoogleがTranslateGemmaを発表：Gemma 3ベースの高性能オープンソース翻訳モデル詳解

Googleは2026年1月にTranslateGemmaを正式にリリースしました。これはGemma 3アーキテクチャに基づいて構築された全く新しいオープンソース翻訳モデルシリーズです。この記事では、4B、12B、27Bの3つのパラメータサイズを通じて、軽量化を維持しながら前世代を超える高品質な翻訳をどのように実現し......

translate

View Details

tool

StepFun Step-Audio-R1.1登場：GPT-4oとGeminiを超える音声推論の新たな覇者

音声AIの競争の場において、誰もがOpenAIやGoogleの最新の動きを注視し、彼らが次の世界を震撼させる製品を出すことを期待しています。しかし最近、あるオープンウェイトモデルが静かにランキングのトップに上り詰め、多くのテック巨人を赤面させました。StepFunによって開発された Step-Audio-R1.1 と......

llm

View Details

news

AI日報：Geminiが生活圏と連携、ManusがクラウドVMを構築

ここのところAI界隈は大盛り上がりで、まるでバーチャルアシスタントたちが突然「開眼」したかのようです。GoogleはついにGeminiでメールや写真へのアクセスを可能にし、検索を単なる冷たいデータベースではなく、より個人的なものにしました。一方、Manusも負けじと完全なクラウドサンドボックスシステムを発表し、AIが......

daily

View Details

Scroll down to load more...