Hugging Face Scraper

Extract ML model cards, dataset info, leaderboard data, and paper metadata from Hugging Face. Built on spider-browser .

Get started Docs

target
huggingface.co: success rate
99.9%: latency
~4ms

Quick start

Extract data in minutes.

huggingface-scraper.ts

import { SpiderBrowser } from "spider-browser";

const spider = new SpiderBrowser({
  apiKey: process.env.SPIDER_API_KEY!,
});

await spider.connect();
const page = spider.page!;
await page.goto("https://huggingface.co/models?sort=trending");
await page.content(10000);

const data = await page.evaluate(`(() => {
  const models = [];
  document.querySelectorAll("article.overview-card-wrapper").forEach(el => {
    const name = el.querySelector("h4")?.textContent?.trim();
    const downloads = el.querySelector("[title*='downloads']")?.textContent?.trim();
    const likes = el.querySelector("[title*='likes']")?.textContent?.trim();
    const updated = el.querySelector("time")?.getAttribute("datetime");
    if (name) models.push({ name, downloads, likes, updated });
  });
  return JSON.stringify({ total: models.length, models: models.slice(0, 15) });
})()`);

console.log(JSON.parse(data));
await spider.close();