Firecrawl 中文文档

GET

crawl

status

{jobId}

curl --request GET \
  --url https://api.firecrawl.dev/v0/crawl/status/{jobId} \
  --header 'Authorization: Bearer <token>'

{
  "status": "<string>",
  "current": 123,
  "total": 123,
  "data": [
    {
      "markdown": "<string>",
      "content": "<string>",
      "html": "<string>",
      "rawHtml": "<string>",
      "index": 123,
      "metadata": {
        "title": "<string>",
        "description": "<string>",
        "language": "<string>",
        "sourceURL": "<string>",
        "<any other metadata> ": "<string>",
        "pageStatusCode": 123,
        "pageError": "<string>"
      }
    }
  ],
  "partial_data": [
    {
      "markdown": "<string>",
      "content": "<string>",
      "html": "<string>",
      "rawHtml": "<string>",
      "index": 123,
      "metadata": {
        "title": "<string>",
        "description": "<string>",
        "language": "<string>",
        "sourceURL": "<string>",
        "<any other metadata> ": "<string>",
        "pageStatusCode": 123,
        "pageError": "<string>"
      }
    }
  ]
}

此端点检索爬取作业的状态。如果作业未完成，响应中将包含在 partial_data 内的内容。一旦作业完成，内容将在 data 下可用。

我们建议自行跟踪爬取作业，因为爬取状态结果在24小时后可能会过期。

Authorizations

Authorization

string

header

required

Bearer authentication header of the form Bearer <token>, where <token> is your auth token.

Path Parameters

jobId

string

required

ID of the crawl job

Response

200

application/json

Successful response

The response is of type object.

爬取取消抓取任务

curl --request GET \
  --url https://api.firecrawl.dev/v0/crawl/status/{jobId} \
  --header 'Authorization: Bearer <token>'

{
  "status": "<string>",
  "current": 123,
  "total": 123,
  "data": [
    {
      "markdown": "<string>",
      "content": "<string>",
      "html": "<string>",
      "rawHtml": "<string>",
      "index": 123,
      "metadata": {
        "title": "<string>",
        "description": "<string>",
        "language": "<string>",
        "sourceURL": "<string>",
        "<any other metadata> ": "<string>",
        "pageStatusCode": 123,
        "pageError": "<string>"
      }
    }
  ],
  "partial_data": [
    {
      "markdown": "<string>",
      "content": "<string>",
      "html": "<string>",
      "rawHtml": "<string>",
      "index": 123,
      "metadata": {
        "title": "<string>",
        "description": "<string>",
        "language": "<string>",
        "sourceURL": "<string>",
        "<any other metadata> ": "<string>",
        "pageStatusCode": 123,
        "pageError": "<string>"
      }
    }
  ]
}

使用 API

接口

获取爬取状态

Authorizations

Path Parameters

Response