ServiceAI Translated Content

Typhoon-OCR-7b Sekarang Tersedia!!

Tim Float16
2 min read
Typhoon-OCR-7b Sekarang Tersedia!!

Typhoon-OCR-7b sekarang tersedia melalui AI as a Service Float16 hari ini!

Detail Typhoon-OCR-7b

Typhoon-OCR-7b adalah Model dari tim Typhoon (SCB10X), dibangun di atas Model Qwen-2.5-vl-7b.

Typhoon-OCR-7b memiliki performa OCR yang lebih baik dari GPT-4o dan Gemini 2.5.

Dapat digunakan untuk berbagai aplikasi seperti:

  • Klasifikasi dokumen
  • Membaca berbagai kartu
  • Membaca faktur atau kuitansi


Cara Menggunakan

Prerequisites:

  1. API key
  2. Library typhoon-ocr

API Key

API key dapat diperoleh dengan mendaftar di Float16-App

Kemudian buka AI as a Service -> API Key

Typhoon-ocr

Typhoon-ocr dapat diinstal via pip menggunakan perintah pip install typhoon-ocr

from typhoon_ocr import ocr_document

# Process PDF document
markdown = ocr_document(
    pdf_or_image_path="document.pdf",  # Works with PDFs or images
    task_type="default",               # Choose between "default" or "structure"
    page_num=2,                        # Process page 2 of a PDF (default is 1, always 1 for images)
    #Config Base URL and API Key
    base_url="https://api.float16.cloud/v1",
    api_key="float16-sk-xxxxxxx"
)

Cara menggunakan Typhoon-OCR melalui Float16-API

Ubah base_url dan api_key ke Float16 untuk mulai menggunakan.

Detail lebih lanjut tentang Typhoon-OCR

Performa

Penggunaan Durasi
Sequential Parallel
67 detik 20 detik

Durasi untuk memproses dokumen 6 halaman

Penggunaan sequential berarti menunggu pemrosesan sebelumnya selesai sebelum memproses berikutnya.

Penggunaan parallel berarti mengirim semua job untuk diproses secara bersamaan.

from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
    return ocr_document(
        pdf_or_image_path="document.pdf",
        task_type="default",
        page_num=page_num,
        base_url="https://api.float16.cloud/v1",
        api_key="float16-sk-xxxxxxx"
    )
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
    futures = [executor.submit(process_page, i) for i in range(6)]
    results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)

Rate-Limit

  • 10 Requests/sec
  • First-Come, First-Serve

Kecepatan per Halaman

Typhoon-OCR-7b memberikan kecepatan bervariasi per halaman tergantung pada jumlah teks dalam dokumen. Lebih banyak teks berarti waktu pemrosesan lebih lama.

Waktu rata-rata untuk pemrosesan adalah 40 - 60 kata per detik per Request.

Harga

$0.03 per halaman atau sekitar 1 baht per halaman

Trial

Anda dapat menerima Credit gratis sebesar $5.00 setiap hari (reset setiap hari pukul 07:00), yang memungkinkan sekitar 150 halaman OCR gratis per hari.

Pembayaran

Pembayaran dapat dilakukan melalui Stripe dengan jenis kartu kredit apapun, atau hubungi Float16 langsung untuk pembayaran melalui semua saluran komunikasi.

Kontak