基于 Python 异步编程的多平台社交媒体爬虫框架，支持小红书、知乎、闲鱼平台的公开信息抓取。

GitHub项目推荐 5月前 117

+-

基于 Python 异步编程的多平台社交媒体爬虫框架，支持小红书、知乎、闲鱼平台的公开信息抓取。

LittleCrawler

“

基于 Python 异步编程的多平台社交媒体爬虫框架，支持小红书（xhs）、知乎（zh）、闲鱼（xy）平台的公开信息抓取。

Github地址

https://github.com/pbeenigg/LittleCrawler

基于 Python 异步编程的多平台社交媒体爬虫框架，支持小红书、知乎、闲鱼平台的公开信息抓取。

支持平台

平台	代号	功能
小红书	`xhs`	笔记、详情、作者
小黄鱼	`xhy`	商品、笔记、作者
知乎	`zhihu`	文章、详情、作者

快速开始

📦 环境要求

Python >= 3.11
uv (推荐) 或 pip

📥 安装

#克隆项目
git clone https://github.com/pbeenig/LittleCrawler.git
cd LittleCrawler

#安装依赖
uv sync
#或
pip install -r requirements.txt

#安装浏览器
playwright install chromium

▶️ 运行

#默认运行（使用 config/base_config.py 配置）
python main.py

#指定平台和爬虫类型
python main.py --platform xhs --type search

#初始化数据库
python main.py --init-db sqlite

🖥️ Web 后台

## Step 1: 编译前端页面 到 `api/ui` 目录下
cd ./web && npm run build

## Step 2: 启动 完整服务（API + 前端页面）
uv run uvicorn api.main:app --port 8080 --reload

## Step 3： 访问 `http://127.0.0.1:8080`



## Step 1: 启动仅 API 服务（不含前端页面）
API_ONLY=1 uv run uvicorn api.main:app --port 8080 --reload


## Step 2: 开发模式启动 Web 后台
cd ./web && npm run dev

## Step 3： 访问 `http://127.0.0.1:8080`

JAVA c c++go swift javascript Nginx UI/UE 小程序 Python C#php asp GitHub项目推荐

2024年可用、好用、值得推荐的磁力搜索引擎汇总（长期更新）

2024年可用、好用、值得推荐的磁力搜索引擎汇总（长期更新）

每日神器 5年前 208861

如何在Python函数中将参数绑定到给定值？

如何在Python函数中将参数绑定到给定值？

Python 6年前 35

docker pull lookup index.docker.io：没有这样的主机

docker pull lookup index.docker.io：没有这样的主机

Docker 6年前 32

c – 为什么free()函数不会将内存返回给操作系统？

c – 为什么free()函数不会将内存返回给操作系统？

Linux 6年前 34

一个跨平台的应用打包工具，能够将H5页面直接打包成Android APK，并且具备直接调用原生功能的能力。

一个跨平台的应用打包工具，能够将H5页面直接打包成Android APK，并且具备直接调用原生功能的能力。

GitHub项目推荐 7月前 118

23个全网VIP影视剧解析工具（内置接口、有些支持搜索）

23个全网VIP影视剧解析工具（内置接口、有些支持搜索）

每日神器 5年前 5827

视频、图片去水印大师：已汉化！已解锁！支持去除图片水印和视频水印

视频、图片去水印大师：已汉化！已解锁！支持去除图片水印和视频水印

每日神器 4年前 46

python-没有名为gtk的模块

python-没有名为gtk的模块

Python 6年前 41

在Java中执行python编译脚本(.pyc)

在Java中执行python编译脚本(.pyc)

JAVA 6年前 64

我的笔记本电脑上的NVIDIA Geforce MX-150 GPU无法使用。

我的笔记本电脑上的NVIDIA Geforce MX-150 GPU无法使用。

程序员 6年前 53

“28岁裸辞，我赚到人生中第一个百万”

“28岁裸辞，我赚到人生中第一个百万”

每日神器 6年前 34

如何让C#中的EventHandler(SpeakCompleted)工作？(System.Speech)

如何让C#中的EventHandler(SpeakCompleted)工作？(System.Speech)

程序员 6年前 142

提供中华人民共和国行政区划数据，涵盖省级、地级、县级、乡级、村级的二级、三级、四级、五级联动地址数据。

提供中华人民共和国行政区划数据，涵盖省级、地级、县级、乡级、村级的二级、三级、四级、五级联动地址数据。

GitHub项目推荐 8月前 208

下一代强大的 Markdown 编辑器，诞生了！

下一代强大的 Markdown 编辑器，诞生了！

GitHub项目推荐 7月前 107

一个跨平台的应用打包工具，能够将H5页面直接打包成Android APK，并且具备直接调用原生功能的能力。

一个跨平台的应用打包工具，能够将H5页面直接打包成Android APK，并且具备直接调用原生功能的能力。

GitHub项目推荐 7月前 120

通过“高帧率抽帧混合”技术，重构视频数据指纹，从而规避短视频平台的查重机制。

通过“高帧率抽帧混合”技术，重构视频数据指纹，从而规避短视频平台的查重机制。

GitHub项目推荐 8月前 233

一个功能强大的PDF工具箱，能够对PDF文档进行编辑书签、剪裁旋转、解除限制、提取或合并文档、提取图片、转成图片等。

一个功能强大的PDF工具箱，能够对PDF文档进行编辑书签、剪裁旋转、解除限制、提取或合并文档、提取图片、转成图片等。

GitHub项目推荐 7月前 140

再见 iTerm2！这个高颜值的终端，相当牛逼

再见 iTerm2！这个高颜值的终端，相当牛逼

GitHub项目推荐 7月前 112

再见 VS Code，下一代编辑器，快如闪电！

再见 VS Code，下一代编辑器，快如闪电！

GitHub项目推荐 7月前 118

一个集找番、追番、看番的一站式弹幕追番平台，支持云收藏同步（Bangumi）、离线缓存、BitTorrent，以及弹幕云过滤。

一个集找番、追番、看番的一站式弹幕追番平台，支持云收藏同步（Bangumi）、离线缓存、BitTorrent，以及弹幕云过滤。

GitHub项目推荐 8月前 328

一个现代开源项目，可以将任何应用程序转变为原生 Windows 服务

一个现代开源项目，可以将任何应用程序转变为原生 Windows 服务

GitHub项目推荐 8月前 109

让游戏和应用程序在正确的 CPU 核心上运行，供对 CPU 核心的精细控制，从而优化性能。

让游戏和应用程序在正确的 CPU 核心上运行，供对 CPU 核心的精细控制，从而优化性能。

GitHub项目推荐 7月前 178

再见 Kindle！这个开源电子书阅读器，藏不住了

再见 Kindle！这个开源电子书阅读器，藏不住了

GitHub项目推荐 7月前 124

开源的餐饮店点餐微信小程序，一键生成桌码、打印小票等等功能，还支持会员充值、在线点餐、微信支付、余额支付、免单机会等基础功能。

开源的餐饮店点餐微信小程序，一键生成桌码、打印小票等等功能，还支持会员充值、在线点餐、微信支付、余额支付、免单机会等基础功能。

GitHub项目推荐 5月前 165