服务AI Translated Content

Typhoon-OCR-7b 现已可用!!

Float16 团队
3 min read
Typhoon-OCR-7b 现已可用!!

Typhoon-OCR-7b 现已通过 Float16 的 AI 即服务提供!

Typhoon-OCR-7b 详情

Typhoon-OCR-7b 是来自 Typhoon 团队(SCB10X)的模型,构建在 Qwen-2.5-vl-7b 模型之上。

Typhoon-OCR-7b 的 OCR 性能优于 GPT-4o 和 Gemini 2.5。

它可用于各种应用,例如:

  • 文档分类
  • 读取各种卡片
  • 读取发票或收据


如何使用

先决条件:

  1. API 密钥
  2. typhoon-ocr 库

API 密钥

可以通过在 Float16-App 注册来获取 API 密钥

然后转到 AI as a Service -> API Key

Typhoon-ocr

可以通过 pip 使用命令 pip install typhoon-ocr 安装 Typhoon-ocr

from typhoon_ocr import ocr_document

# 处理 PDF 文档
markdown = ocr_document(
    pdf_or_image_path="document.pdf",  # 适用于 PDF 或图像
    task_type="default",               # 在 "default" 或 "structure" 之间选择
    page_num=2,                        # 处理 PDF 的第 2 页(默认为 1,对于图像始终为 1)
    #配置基础 URL 和 API 密钥
    base_url="https://api.float16.cloud/v1",
    api_key="float16-sk-xxxxxxx"
)

如何通过 Float16-API 使用 Typhoon-OCR

将 base_url 和 api_key 更改为 Float16 的即可开始使用。

有关 Typhoon-OCR 的更多详细信息

性能

使用 持续时间
顺序 并行
67 秒 20 秒

处理 6 页文档的持续时间

顺序使用意味着等待上一个处理完成后再处理下一个。

并行使用意味着同时发送所有作业进行处理。

from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
    return ocr_document(
        pdf_or_image_path="document.pdf",
        task_type="default",
        page_num=page_num,
        base_url="https://api.float16.cloud/v1",
        api_key="float16-sk-xxxxxxx"
    )
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
    futures = [executor.submit(process_page, i) for i in range(6)]
    results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)

速率限制

  • 10 请求/秒
  • 先到先得

每页速度

Typhoon-OCR-7b 根据文档中的文本量提供每页不同的速度。文本越多意味着处理时间越长。

处理的平均时间为每个请求每秒 40 - 60 个单词。

定价

每页 $0.03 或大约每页 1 泰铢

试用

您可以每天免费获得 $5.00 的积分(每天 07:00 重置),这可以进行大约 150 页的免费 OCR。

付款

可以通过 Stripe 使用任何类型的信用卡进行付款,或通过所有通信渠道直接联系 Float16 进行付款。

联系方式