开发工具包
Rust
Firecrawl Rust SDK 是一个库,可帮助您轻松抓取和爬取网站,并将数据以适合语言模型(LLMs)使用的格式输出。
注意:此文档使用的是 v0 版本的 Firecrawl API,该版本已被弃用。我们建议切换到 v1。
安装
要安装 Firecrawl Rust SDK,请在您的 Cargo.toml
文件中添加以下内容:
使用
- 从 firecrawl.dev 获取 API 密钥。
- 将 API 密钥设置为环境变量
FIRECRAWL_API_KEY
或将其作为参数传递给FirecrawlApp
结构体。
以下是如何在 Rust 中使用 SDK 的示例:
抓取 URL
使用 scrape_url
方法抓取单个 URL,并处理错误。它接受 URL 作为参数,并返回抓取的数据作为 serde_json::Value
。
爬取网站
使用 crawl_url
方法爬取网站。它接受起始 URL 和可选参数作为参数。params
参数允许您指定爬取任务的其他选项,例如要爬取的最大页面数、允许的域和输出格式。
检查爬取状态
使用 check_crawl_status
方法检查爬取任务的状态。它接受任务 ID 作为参数,并返回当前爬取任务的状态。
取消爬取任务
使用 cancel_crawl_job
方法取消爬取任务。它接受任务 ID 作为参数,并返回爬取任务的取消状态。
从 URL 提取结构化数据
通过 LLM 提取,您可以从任何 URL 中轻松提取结构化数据。以下是如何使用它的方法:
搜索查询
要搜索网页,获取最相关的结果,抓取每个页面并返回 Markdown 格式的内容,可以使用 search
方法。该方法接受查询作为参数,并返回搜索结果。
错误处理
SDK 会处理 Firecrawl API 返回的错误,并在请求过程中发生错误时抛出适当的异常。如果请求过程中出现错误,将抛出带有描述性错误消息的异常。