0.9B パラメータで SOTA に挑戦!智譜 GLM-OCR オープンソース化: ドキュメント解析を 10 倍高速化
智譜 AI (Zhipu AI) が GLM-OCR モデルをオープンソース化。わずか 0.9B のパラメータで、複雑な表や数式の認識において SOTA レベルに到達。GPT-5.2 …
Read MorePage 1 of 2 (11 items)
智譜 AI (Zhipu AI) が GLM-OCR モデルをオープンソース化。わずか 0.9B のパラメータで、複雑な表や数式の認識において SOTA レベルに到達。GPT-5.2 …
Read MoreDeepSeekチームは最近、オープンソースコミュニティに再び衝撃を与えました。今回彼らがもたらした DeepSeek-OCR 2 は、単にOCR(光学文字認識)の精度を数パーセント向上させただけでは …
Read MoreTencentが新たに発表したHunyuanOCRは、わずか10億(1B)パラメータの軽量設計で、OmniDocBenchなどの複数の権威あるテストにおいてGPT-4oやGeminiを打ち負かしまし …
Read More多くの漫画読者や開発者にとって、漫画内の文字を正確に認識することは常に課題でした。最近、日本の漫画に特化して微調整されたAI文字認識(OCR)モデルは、認識精度を27%から70%に向上させ、漫画翻訳 …
Read MorePDFレポート、スキャン文書、図表だらけの論文の処理にうんざりし、手動でのコピー&ペーストに多くの時間を費やしていませんか?今、PaddleOCR-VLという新しいツールが、これらすべてを完全に変え …
Read More
従来のOCRの不正確さや制限にうんざりしていませんか?Chandraをご紹介します。このオープンソースOCRモデルは、画像やPDFを正確に変換するだけでなく、手書き、表、複雑な文書をサポートし、元の …
Read More人工知能スタートアップのDeepSeekは最近、DeepSeek-OCRというオープンソースモデルをリリースし、「文脈的光学圧縮」という革新的な概念を提案しました。単語を一つ一つ読むのではなく、大量 …
Read MoreNanonetsの最新オープンソースOCR2モデルスイートを探る。LaTeX数式の自動変換やグラフのインテリジェントな記述から、手書き文書や複雑な表の正確な処理まで、Nanonets-OCR2は文書 …
Read More複雑な文書認識とデータ抽出にまだ頭を悩ませていますか?新登場の dots.ocr は、わずか1.7Bの軽量モデルで、多言語文書解析の分野で驚異的なSOTA性能を発揮し、レイアウト検出とコンテンツ認識 …
Read MoreGoogleの最新オープンソースPythonライブラリLangExtractは、Geminiなどの大規模言語モデルの強力な能力を利用して、雑然としたテキストデータを構造化情報に変換します。この記事で …
Read More
DMflow.chat: Your intelligent AI partner for exceptional customer engagement.
Learn More© 2026 Communeify. All rights reserved.
By continuing to use this website, you agree to the use of cookies according to our privacy policy.