Typhoon-OCR-7b Hiện Đã Có Sẵn!!

Typhoon-OCR-7b hiện đã có sẵn thông qua AI as a Service của Float16 ngày hôm nay!
Chi Tiết Typhoon-OCR-7b
Typhoon-OCR-7b là Mô hình từ đội Typhoon (SCB10X), được xây dựng trên Mô hình Qwen-2.5-vl-7b.
Typhoon-OCR-7b có hiệu suất OCR tốt hơn GPT-4o và Gemini 2.5.
Nó có thể được sử dụng cho các ứng dụng khác nhau như:
- Phân loại tài liệu
 - Đọc các loại thẻ khác nhau
 - Đọc hóa đơn hoặc biên lai
 

Cách Sử Dụng
Điều kiện tiên quyết:
- API key
 - Thư viện typhoon-ocr
 
API Key
API key có thể được lấy bằng cách đăng ký tại Float16-App
Sau đó đi đến AI as a Service -> API Key

Typhoon-ocr
Typhoon-ocr có thể được cài đặt qua pip bằng lệnh pip install typhoon-ocr
from typhoon_ocr import ocr_document
# Xử lý tài liệu PDF
markdown = ocr_document(
    pdf_or_image_path="document.pdf",  # Hoạt động với PDF hoặc hình ảnh
    task_type="default",               # Chọn giữa "default" hoặc "structure"
    page_num=2,                        # Xử lý trang 2 của PDF (mặc định là 1, luôn là 1 cho hình ảnh)
    #Config Base URL và API Key
    base_url="https://api.float16.cloud/v1",
    api_key="float16-sk-xxxxxxx"
)
Cách sử dụng Typhoon-OCR thông qua Float16-API
Thay đổi base_url và api_key thành của Float16 để bắt đầu sử dụng.
Chi tiết hơn về Typhoon-OCR
Hiệu Năng
| Cách sử dụng | Thời lượng | 
|---|---|
| Tuần tự | Song song | 
| 67 giây | 20 giây | 
Thời lượng xử lý tài liệu 6 trang
Sử dụng tuần tự có nghĩa là chờ quá trình xử lý trước hoàn thành trước khi xử lý tiếp theo.
Sử dụng song song có nghĩa là gửi tất cả các công việc để xử lý đồng thời.
from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
    return ocr_document(
        pdf_or_image_path="document.pdf",
        task_type="default",
        page_num=page_num,
        base_url="https://api.float16.cloud/v1",
        api_key="float16-sk-xxxxxxx"
    )
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
    futures = [executor.submit(process_page, i) for i in range(6)]
    results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)
Rate-Limit
- 10 Requests/giây
 - Người đến trước được phục vụ trước
 
Tốc Độ Mỗi Trang
Typhoon-OCR-7b cung cấp tốc độ thay đổi mỗi trang tùy thuộc vào lượng văn bản trong tài liệu. Nhiều văn bản hơn có nghĩa là thời gian xử lý dài hơn.
Thời gian trung bình để xử lý là 40 - 60 từ mỗi giây mỗi Request.
Giá
$0.03 mỗi trang hoặc khoảng 1 baht mỗi trang
Dùng Thử

Bạn có thể nhận Credit miễn phí $5.00 hàng ngày (đặt lại hàng ngày lúc 07:00), cho phép khoảng 150 trang OCR miễn phí mỗi ngày.
Thanh Toán
Thanh toán có thể được thực hiện thông qua Stripe với bất kỳ loại thẻ tín dụng nào, hoặc liên hệ trực tiếp với Float16 để thanh toán thông qua tất cả các kênh liên lạc.

Liên hệ
- Medium : Float16.cloud
 - Facebook : Float16.cloud
 - X : Float16.cloud
 - Discord : Float16.cloud
 - Youtube : Float16.cloud
 - Email : business[at]float16.cloud