Typhoon-OCR-7b Kini Tersedia!!

Typhoon-OCR-7b kini tersedia melalui AI as a Service Float16 hari ini!
Butiran Typhoon-OCR-7b
Typhoon-OCR-7b adalah Model daripada pasukan Typhoon (SCB10X), dibina di atas Model Qwen-2.5-vl-7b.
Typhoon-OCR-7b mempunyai prestasi OCR yang lebih baik daripada GPT-4o dan Gemini 2.5.
Ia boleh digunakan untuk pelbagai aplikasi seperti:
- Klasifikasi dokumen
 - Membaca pelbagai kad
 - Membaca invois atau resit
 

Cara Menggunakan
Prerequisites:
- API key
 - Library typhoon-ocr
 
API Key
API key boleh diperoleh dengan mendaftar di Float16-App
Kemudian buka AI as a Service -> API Key

Typhoon-ocr
Typhoon-ocr boleh dipasang melalui pip menggunakan arahan pip install typhoon-ocr
from typhoon_ocr import ocr_document
# Process PDF document
markdown = ocr_document(
    pdf_or_image_path="document.pdf",  # Works with PDFs or images
    task_type="default",               # Choose between "default" or "structure"
    page_num=2,                        # Process page 2 of a PDF (default is 1, always 1 for images)
    #Config Base URL and API Key
    base_url="https://api.float16.cloud/v1",
    api_key="float16-sk-xxxxxxx"
)
Cara menggunakan Typhoon-OCR melalui Float16-API
Tukar base_url dan api_key ke Float16 untuk mula menggunakan.
Butiran lebih lanjut tentang Typhoon-OCR
Prestasi
| Penggunaan | Tempoh | 
|---|---|
| Sequential | Parallel | 
| 67 saat | 20 saat | 
Tempoh untuk memproses dokumen 6 halaman
Penggunaan sequential bermakna menunggu pemprosesan sebelumnya selesai sebelum memproses seterusnya.
Penggunaan parallel bermakna menghantar semua job untuk diproses serentak.
from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
    return ocr_document(
        pdf_or_image_path="document.pdf",
        task_type="default",
        page_num=page_num,
        base_url="https://api.float16.cloud/v1",
        api_key="float16-sk-xxxxxxx"
    )
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
    futures = [executor.submit(process_page, i) for i in range(6)]
    results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)
Rate-Limit
- 10 Requests/sec
 - First-Come, First-Serve
 
Kelajuan per Halaman
Typhoon-OCR-7b memberikan kelajuan berbeza per halaman bergantung pada jumlah teks dalam dokumen. Lebih banyak teks bermakna masa pemprosesan lebih lama.
Masa purata untuk pemprosesan adalah 40 - 60 perkataan sesaat per Request.
Harga
$0.03 per halaman atau kira-kira 1 baht per halaman
Trial

Anda boleh menerima Credit percuma sebanyak $5.00 setiap hari (reset setiap hari pukul 07:00), yang membolehkan kira-kira 150 halaman OCR percuma setiap hari.
Pembayaran
Pembayaran boleh dilakukan melalui Stripe dengan mana-mana jenis kad kredit, atau hubungi Float16 terus untuk pembayaran melalui semua saluran komunikasi.

Hubungi
- Medium : Float16.cloud
 - Facebook : Float16.cloud
 - X : Float16.cloud
 - Discord : Float16.cloud
 - Youtube : Float16.cloud
 - Emel : business[at]float16.cloud