Question 1

Bahasa apa saja yang didukung DeepSeek-OCR?

Accepted Answer

DeepSeek-OCR mendukung lebih dari 100 bahasa termasuk skrip Latin (Inggris, Spanyol, Prancis, Jerman), bahasa Asia (Mandarin, Jepang, Korea), skrip Arab, skrip Sirilik (Rusia, Ukraina), dan bahasa India (Hindi, Bengali, Tamil, dll.). Model secara otomatis mendeteksi bahasa dalam dokumen dengan campuran bahasa.

Question 2

Apa yang membuat DeepSeek-OCR berbeda dari OCR tradisional?

Accepted Answer

DeepSeek-OCR menggunakan teknologi Kompresi Optik Kontekstual canggih dengan arsitektur baru yang menggabungkan DeepEncoder dan dekoder MoE parameter 3B. Ini melampaui ekstraksi teks untuk menyediakan kemampuan OCR 2.0 termasuk penguraian bagan, pengenalan rumus kompleks, pemahaman figur geometris, dan analisis struktur dokumen yang mendalam.

Question 3

Bisakah DeepSeek-OCR menangani teks tulisan tangan?

Accepted Answer

Ya, DeepSeek-OCR mencapai akurasi lebih dari 92% pada tulisan tangan kursif dan cetak. Untuk hasil terbaik, pastikan pencahayaan yang memadai, kontras yang baik, dan penjajaran lurus dokumen tulisan tangan.

Question 4

Berapa kecepatan pemrosesan DeepSeek-OCR?

Accepted Answer

DeepSeek-OCR dapat memproses lebih dari 200.000 halaman per hari pada satu GPU A100-40G, dengan kecepatan hingga 2.500 token per detik saat menggunakan pemrosesan batch vLLM. Kinerja bervariasi berdasarkan kompleksitas dokumen dan metode penerapan.

Question 5

Bisakah saya memproses dokumen dengan tabel dan tata letak yang kompleks?

Accepted Answer

Tentu saja. DeepSeek-OCR unggul dalam memahami tata letak yang kompleks termasuk tabel, formulir, dokumen multi-kolom, dan mempertahankan pemformatan saat mengonversi ke Markdown. Ia juga dapat mengurai bagan dan mengenali rumus matematika dan kimia.

Question 6

Apakah data saya aman saat menggunakan DeepSeek-OCR?

Accepted Answer

Ya, DeepSeek-OCR menggunakan pemrosesan terenkripsi dan secara otomatis menghapus data dalam 24 jam saat menggunakan alat online. Untuk privasi dan kontrol maksimum, Anda dapat menerapkan model di infrastruktur Anda sendiri menggunakan opsi penerapan yang dihosting sendiri.

Question 7

Opsi penerapan apa yang tersedia?

Accepted Answer

DeepSeek-OCR menawarkan empat opsi penerapan: (1) Alat online untuk pemrosesan instan, (2) Python API untuk pembuatan skrip dan prototipe, (3) pemrosesan batch vLLM untuk beban kerja produksi, dan (4) Penerapan yang dihosting sendiri di infrastruktur Anda dengan dukungan Docker, Kubernetes, atau platform cloud.

Question 8

Bisakah DeepSeek-OCR mengekstrak data dari bagan dan grafik?

Accepted Answer

Ya, DeepSeek-OCR menyertakan kemampuan penguraian bagan tingkat lanjut yang dapat secara akurat mengekstrak data dari grafik, bagan batang, bagan lingkaran, dan visualisasi lainnya, menjadikannya ideal untuk memproses laporan dan dokumen analitis.

DeepSeek-OCR

Fitur Utama

Dukungan Multi-Bahasa

Pemrosesan Berkecepatan Tinggi

Kemampuan OCR 2.0 Tingkat Lanjut

Pemahaman Tata Letak Kompleks

Pengenalan Tulisan Tangan

Pemrosesan Mengutamakan Privasi

Cara Menggunakan DeepSeek-OCR

Pilih Metode Penerapan Anda

Unggah Dokumen Anda

Konfigurasikan Opsi Pemrosesan

Proses dan Tinjau

Ekspor atau Integrasikan Hasil

Praktik Terbaik

Kasus Penggunaan

Digitalisasi Dokumen

Otomatisasi Bisnis

Riset Akademis

Manajemen Konten Multibahasa

Ekstraksi Data dari Visual

Digitalisasi Tulisan Tangan

Pertanyaan yang Sering Diajukan