Dịch vụAI Translated Content

Typhoon-OCR-7b Hiện Đã Có Sẵn!!

Đội ngũ Float16
3 min read
Typhoon-OCR-7b Hiện Đã Có Sẵn!!

Typhoon-OCR-7b hiện đã có sẵn thông qua AI as a Service của Float16 ngày hôm nay!

Chi Tiết Typhoon-OCR-7b

Typhoon-OCR-7b là Mô hình từ đội Typhoon (SCB10X), được xây dựng trên Mô hình Qwen-2.5-vl-7b.

Typhoon-OCR-7b có hiệu suất OCR tốt hơn GPT-4o và Gemini 2.5.

Nó có thể được sử dụng cho các ứng dụng khác nhau như:

  • Phân loại tài liệu
  • Đọc các loại thẻ khác nhau
  • Đọc hóa đơn hoặc biên lai


Cách Sử Dụng

Điều kiện tiên quyết:

  1. API key
  2. Thư viện typhoon-ocr

API Key

API key có thể được lấy bằng cách đăng ký tại Float16-App

Sau đó đi đến AI as a Service -> API Key

Typhoon-ocr

Typhoon-ocr có thể được cài đặt qua pip bằng lệnh pip install typhoon-ocr

from typhoon_ocr import ocr_document

# Xử lý tài liệu PDF
markdown = ocr_document(
    pdf_or_image_path="document.pdf",  # Hoạt động với PDF hoặc hình ảnh
    task_type="default",               # Chọn giữa "default" hoặc "structure"
    page_num=2,                        # Xử lý trang 2 của PDF (mặc định là 1, luôn là 1 cho hình ảnh)
    #Config Base URL và API Key
    base_url="https://api.float16.cloud/v1",
    api_key="float16-sk-xxxxxxx"
)

Cách sử dụng Typhoon-OCR thông qua Float16-API

Thay đổi base_url và api_key thành của Float16 để bắt đầu sử dụng.

Chi tiết hơn về Typhoon-OCR

Hiệu Năng

Cách sử dụng Thời lượng
Tuần tự Song song
67 giây 20 giây

Thời lượng xử lý tài liệu 6 trang

Sử dụng tuần tự có nghĩa là chờ quá trình xử lý trước hoàn thành trước khi xử lý tiếp theo.

Sử dụng song song có nghĩa là gửi tất cả các công việc để xử lý đồng thời.

from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
    return ocr_document(
        pdf_or_image_path="document.pdf",
        task_type="default",
        page_num=page_num,
        base_url="https://api.float16.cloud/v1",
        api_key="float16-sk-xxxxxxx"
    )
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
    futures = [executor.submit(process_page, i) for i in range(6)]
    results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)

Rate-Limit

  • 10 Requests/giây
  • Người đến trước được phục vụ trước

Tốc Độ Mỗi Trang

Typhoon-OCR-7b cung cấp tốc độ thay đổi mỗi trang tùy thuộc vào lượng văn bản trong tài liệu. Nhiều văn bản hơn có nghĩa là thời gian xử lý dài hơn.

Thời gian trung bình để xử lý là 40 - 60 từ mỗi giây mỗi Request.

Giá

$0.03 mỗi trang hoặc khoảng 1 baht mỗi trang

Dùng Thử

Bạn có thể nhận Credit miễn phí $5.00 hàng ngày (đặt lại hàng ngày lúc 07:00), cho phép khoảng 150 trang OCR miễn phí mỗi ngày.

Thanh Toán

Thanh toán có thể được thực hiện thông qua Stripe với bất kỳ loại thẻ tín dụng nào, hoặc liên hệ trực tiếp với Float16 để thanh toán thông qua tất cả các kênh liên lạc.

Liên hệ