介绍 /map
从单一URL到整个网站的地图的最简单方法。这在以下情况下非常有用:
- 当您需要提示最终用户选择要抓取的链接时
- 需要快速了解网站上的链接时
- 需要抓取与特定主题相关的网站页面时(使用
search
参数)
- 只需要抓取网站的特定页面时
Alpha考虑事项
这个端点优先考虑速度,因此可能无法捕获所有网站链接。我们正在改进中。非常欢迎反馈和建议。
/map端点
用于映射URL并获取网站的URL。这将返回网站上存在的大多数链接。
from firecrawl import FirecrawlApp
app = FirecrawlApp(api_key="fc-YOUR_API_KEY")
# 映射一个网站:
map_result = app.map_url('https://firecrawl.dev')
print(map_result)
SDK将直接返回数据对象。cURL将返回如下所示的有效载荷。
{
"status": "success",
"links": [
"https://firecrawl.dev",
"https://www.firecrawl.dev/pricing",
"https://www.firecrawl.dev/blog",
"https://www.firecrawl.dev/playground",
"https://www.firecrawl.dev/smart-crawl",
...
]
}
带搜索的映射
带 search
参数的映射允许您在网站内搜索特定URL。
curl -X POST https://api.firecrawl.dev/v1/map \
-H 'Content-Type: application/json' \
-H 'Authorization: Bearer YOUR_API_KEY' \
-d '{
"url": "https://firecrawl.dev",
"search": "docs"
}'
响应将是一个按相关性排序的有序列表,从最相关到最不相关。
{
"status": "success",
"links": [
"https://docs.firecrawl.dev",
"https://docs.firecrawl.dev/sdks/python",
"https://docs.firecrawl.dev/learn/rag-llama3",
]
}