PerkhidmatanAI Translated Content

Typhoon-OCR-7b Kini Tersedia!!

Pasukan Float16
2 min read
Typhoon-OCR-7b Kini Tersedia!!

Typhoon-OCR-7b kini tersedia melalui AI as a Service Float16 hari ini!

Butiran Typhoon-OCR-7b

Typhoon-OCR-7b adalah Model daripada pasukan Typhoon (SCB10X), dibina di atas Model Qwen-2.5-vl-7b.

Typhoon-OCR-7b mempunyai prestasi OCR yang lebih baik daripada GPT-4o dan Gemini 2.5.

Ia boleh digunakan untuk pelbagai aplikasi seperti:

  • Klasifikasi dokumen
  • Membaca pelbagai kad
  • Membaca invois atau resit


Cara Menggunakan

Prerequisites:

  1. API key
  2. Library typhoon-ocr

API Key

API key boleh diperoleh dengan mendaftar di Float16-App

Kemudian buka AI as a Service -> API Key

Typhoon-ocr

Typhoon-ocr boleh dipasang melalui pip menggunakan arahan pip install typhoon-ocr

from typhoon_ocr import ocr_document

# Process PDF document
markdown = ocr_document(
    pdf_or_image_path="document.pdf",  # Works with PDFs or images
    task_type="default",               # Choose between "default" or "structure"
    page_num=2,                        # Process page 2 of a PDF (default is 1, always 1 for images)
    #Config Base URL and API Key
    base_url="https://api.float16.cloud/v1",
    api_key="float16-sk-xxxxxxx"
)

Cara menggunakan Typhoon-OCR melalui Float16-API

Tukar base_url dan api_key ke Float16 untuk mula menggunakan.

Butiran lebih lanjut tentang Typhoon-OCR

Prestasi

Penggunaan Tempoh
Sequential Parallel
67 saat 20 saat

Tempoh untuk memproses dokumen 6 halaman

Penggunaan sequential bermakna menunggu pemprosesan sebelumnya selesai sebelum memproses seterusnya.

Penggunaan parallel bermakna menghantar semua job untuk diproses serentak.

from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
    return ocr_document(
        pdf_or_image_path="document.pdf",
        task_type="default",
        page_num=page_num,
        base_url="https://api.float16.cloud/v1",
        api_key="float16-sk-xxxxxxx"
    )
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
    futures = [executor.submit(process_page, i) for i in range(6)]
    results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)

Rate-Limit

  • 10 Requests/sec
  • First-Come, First-Serve

Kelajuan per Halaman

Typhoon-OCR-7b memberikan kelajuan berbeza per halaman bergantung pada jumlah teks dalam dokumen. Lebih banyak teks bermakna masa pemprosesan lebih lama.

Masa purata untuk pemprosesan adalah 40 - 60 perkataan sesaat per Request.

Harga

$0.03 per halaman atau kira-kira 1 baht per halaman

Trial

Anda boleh menerima Credit percuma sebanyak $5.00 setiap hari (reset setiap hari pukul 07:00), yang membolehkan kira-kira 150 halaman OCR percuma setiap hari.

Pembayaran

Pembayaran boleh dilakukan melalui Stripe dengan mana-mana jenis kad kredit, atau hubungi Float16 terus untuk pembayaran melalui semua saluran komunikasi.

Hubungi