+-
基于 Python 异步编程的多平台社交媒体爬虫框架,支持小红书、知乎、闲鱼平台的公开信息抓取。

LittleCrawler

基于 Python 异步编程的多平台社交媒体爬虫框架,支持小红书(xhs)、知乎(zh)、闲鱼(xy)平台的公开信息抓取。

Github地址

https://github.com/pbeenigg/LittleCrawler

基于 Python 异步编程的多平台社交媒体爬虫框架,支持小红书、知乎、闲鱼平台的公开信息抓取。

支持平台

平台

代号

功能

小红书

xhs

笔记、详情、作者

小黄鱼

xhy

商品、笔记、作者

知乎

zhihu

文章、详情、作者

快速开始

📦 环境要求

  • Python >= 3.11

  • uv (推荐) 或 pip

📥 安装

#克隆项目
git clone https://github.com/pbeenig/LittleCrawler.git
cd LittleCrawler

#安装依赖
uv sync
#或
pip install -r requirements.txt

#安装浏览器
playwright install chromium

▶️ 运行

#默认运行(使用 config/base_config.py 配置)
python main.py

#指定平台和爬虫类型
python main.py --platform xhs --type search

#初始化数据库
python main.py --init-db sqlite

🖥️ Web 后台

## Step 1: 编译前端页面 到 `api/ui` 目录下
cd ./web && npm run build

## Step 2: 启动 完整服务(API + 前端页面)
uv run uvicorn api.main:app --port 8080 --reload

## Step 3: 访问 `http://127.0.0.1:8080`



## Step 1: 启动仅 API 服务(不含前端页面)
API_ONLY=1 uv run uvicorn api.main:app --port 8080 --reload


## Step 2: 开发模式启动 Web 后台
cd ./web && npm run dev

## Step 3: 访问 `http://127.0.0.1:8080`