开发工具包
Rust
Firecrawl Rust SDK 是一个库,可以帮助您轻松抓取和爬取网站,并将数据以适用于语言模型(LLMs)的格式输出。
安装
要安装 Firecrawl Rust SDK,请在您的 Cargo.toml
中添加以下内容:
Rust
使用
首先,您需要从 firecrawl.dev 获取一个 API 密钥。然后,您需要初始化 FirecrawlApp
。从这里,您可以访问像 FirecrawlApp::scrape_url
这样的函数,让您使用我们的 API。
以下是如何在 Rust 中使用 SDK 的示例:
Rust
抓取 URL
要抓取单个 URL,请使用 scrape_url
方法。它接受 URL 作为参数并返回抓取的数据作为 Document
。
Rust
带提取的抓取
使用 Extract,您可以轻松地从任何 URL 中提取结构化数据。您需要使用 JSON Schema 格式指定您的模式,使用 serde_json::json!
宏。
Rust
抓取网站
要抓取网站,请使用 crawl_url
方法。这将等待抓取完成,这可能需要很长时间,具体取决于您的起始 URL 和您的选项。
Rust
异步抓取
要抓取而不等待结果,请使用 crawl_url_async
方法。它接受相同的参数,但它返回一个 CrawlAsyncRespone
结构体,包含抓取的 ID。您可以使用该 ID 与 check_crawl_status
方法随时检查状态。请注意,完成的抓取将在 24 小时后删除。
Rust
映射 URL
映射从一个起始 URL 关联的所有链接。
Rust
错误处理
SDK 处理由 Firecrawl API 和我们的依赖项返回的错误,并将它们组合到 FirecrawlError
枚举中,实现 Error
、Debug
和 Display
。我们的所有方法都返回一个 Result<T, FirecrawlError>
。