Question 1

DeepSeek-OCRはどの言語をサポートしていますか？

Accepted Answer

DeepSeek-OCRは、ラテン文字（英語、スペイン語、フランス語、ドイツ語）、アジア言語（中国語、日本語、韓国語）、アラビア文字、キリル文字（ロシア語、ウクライナ語）、およびインド諸語（ヒンディー語、ベンガル語、タミル語など）を含む100以上の言語をサポートしています。モデルは、複数の言語が混在するドキュメント内の言語を自動的に検出します。

Question 2

DeepSeek-OCRは従来のOCRと何が違うのですか？

Accepted Answer

DeepSeek-OCRは、DeepEncoderと3BパラメータのMoEデコーダーを組み合わせた新しいアーキテクチャを備えた高度なコンテキスト光学圧縮技術を使用しています。テキスト抽出にとどまらず、チャート解析、複雑な数式認識、幾何学的図形の理解、および詳細なドキュメント構造分析を含むOCR 2.0機能を提供します。

Question 3

DeepSeek-OCRは手書き文字を処理できますか？

Accepted Answer

はい、DeepSeek-OCRは筆記体と印刷体の両方で92%以上の精度を達成しています。最良の結果を得るには、十分な照明、良好なコントラスト、および手書きドキュメントのまっすぐな配置を確保してください。

Question 4

DeepSeek-OCRの処理速度はどのくらいですか？

Accepted Answer

DeepSeek-OCRは、単一のA100-40G GPUで1日あたり20万ページ以上を処理でき、vLLMバッチ処理を使用すると最大2,500トークン/秒の速度を実現します。パフォーマンスは、ドキュメントの複雑さとデプロイ方法によって異なります。

Question 5

テーブルや複雑なレイアウトを持つドキュメントを処理できますか？

Accepted Answer

もちろんです。DeepSeek-OCRは、テーブル、フォーム、複数列のドキュメントなどの複雑なレイアウトの理解に優れており、Markdownへの変換時にフォーマットを保持します。また、チャートを解析し、数学および化学式を認識することもできます。

Question 6

DeepSeek-OCRを使用する際、私のデータは安全ですか？

Accepted Answer

はい、DeepSeek-OCRは暗号化された処理を使用し、オンラインツールを使用する場合は24時間以内にデータを自動的に削除します。最大限のプライバシーと制御のために、セルフホスト型のデプロイオプションを使用して、独自のインフラストラクチャにモデルをデプロイできます。

Question 7

どのようなデプロイオプションがありますか？

Accepted Answer

DeepSeek-OCRは、4つのデプロイオプションを提供しています。（1）インスタント処理のためのオンラインツール、（2）スクリプト作成とプロトタイピングのためのPython API、（3）本番環境のワークロードのためのvLLMバッチ処理、および（4）Docker、Kubernetes、またはクラウドプラットフォームのサポートによる独自のインフラストラクチャへのセルフホスト型のデプロイ。

Question 8

DeepSeek-OCRはチャートやグラフからデータを抽出できますか？

Accepted Answer

はい、DeepSeek-OCRには、グラフ、棒グラフ、円グラフ、およびその他の視覚化からデータを正確に抽出できる高度なチャート解析機能が含まれており、レポートや分析ドキュメントの処理に最適です。

DeepSeek-OCR

主な機能

多言語サポート

高速処理

高度なOCR 2.0機能

複雑なレイアウトの理解

手書き文字認識

プライバシー優先の処理

DeepSeek-OCRの使用方法

デプロイ方法の選択

ドキュメントのアップロード

処理オプションの設定

処理とレビュー

結果のエクスポートまたは統合

ベストプラクティス

ユースケース

ドキュメントのデジタル化

ビジネスの自動化

学術研究

多言語コンテンツ管理

ビジュアルからのデータ抽出

手書き文字のデジタル化

よくある質問