服务AI Translated Content
Typhoon-OCR-7b 现已可用!!
Float16 团队
3 min read

Typhoon-OCR-7b 现已通过 Float16 的 AI 即服务提供!
Typhoon-OCR-7b 详情
Typhoon-OCR-7b 是来自 Typhoon 团队(SCB10X)的模型,构建在 Qwen-2.5-vl-7b 模型之上。
Typhoon-OCR-7b 的 OCR 性能优于 GPT-4o 和 Gemini 2.5。
它可用于各种应用,例如:
- 文档分类
 - 读取各种卡片
 - 读取发票或收据
 

如何使用
先决条件:
- API 密钥
 - typhoon-ocr 库
 
API 密钥
可以通过在 Float16-App 注册来获取 API 密钥
然后转到 AI as a Service -> API Key

Typhoon-ocr
可以通过 pip 使用命令 pip install typhoon-ocr 安装 Typhoon-ocr
from typhoon_ocr import ocr_document
# 处理 PDF 文档
markdown = ocr_document(
    pdf_or_image_path="document.pdf",  # 适用于 PDF 或图像
    task_type="default",               # 在 "default" 或 "structure" 之间选择
    page_num=2,                        # 处理 PDF 的第 2 页(默认为 1,对于图像始终为 1)
    #配置基础 URL 和 API 密钥
    base_url="https://api.float16.cloud/v1",
    api_key="float16-sk-xxxxxxx"
)
如何通过 Float16-API 使用 Typhoon-OCR
将 base_url 和 api_key 更改为 Float16 的即可开始使用。
有关 Typhoon-OCR 的更多详细信息
性能
| 使用 | 持续时间 | 
|---|---|
| 顺序 | 并行 | 
| 67 秒 | 20 秒 | 
处理 6 页文档的持续时间
顺序使用意味着等待上一个处理完成后再处理下一个。
并行使用意味着同时发送所有作业进行处理。
from concurrent.futures import ThreadPoolExecutor
def process_page(page_num):
    return ocr_document(
        pdf_or_image_path="document.pdf",
        task_type="default",
        page_num=page_num,
        base_url="https://api.float16.cloud/v1",
        api_key="float16-sk-xxxxxxx"
    )
start_time = time.time()
with ThreadPoolExecutor(max_workers=6) as executor:
    futures = [executor.submit(process_page, i) for i in range(6)]
    results = [future.result() for future in futures]
print("Time taken for parallel processing of 6 pages:", time.time() - start_time)
速率限制
- 10 请求/秒
 - 先到先得
 
每页速度
Typhoon-OCR-7b 根据文档中的文本量提供每页不同的速度。文本越多意味着处理时间越长。
处理的平均时间为每个请求每秒 40 - 60 个单词。
定价
每页 $0.03 或大约每页 1 泰铢
试用

您可以每天免费获得 $5.00 的积分(每天 07:00 重置),这可以进行大约 150 页的免费 OCR。
付款
可以通过 Stripe 使用任何类型的信用卡进行付款,或通过所有通信渠道直接联系 Float16 进行付款。

联系方式
- Medium : Float16.cloud
 - Facebook : Float16.cloud
 - X : Float16.cloud
 - Discord : Float16.cloud
 - Youtube : Float16.cloud
 - Email : business[at]float16.cloud