一个轻量级且高效的AI证件照制作工具，支持美颜、轻量级抠图、多种尺寸证件照生成、纯离线或端云推理等功能。

HivisionIDPhotos

“

一个轻量级且高效的AI证件照制作工具，利用AI模型工作流程实现多种拍照场景的证件照生成，支持轻量级抠图、多种尺寸证件照生成、纯离线或端云推理等功能。

Github地址

https://github.com/Zeyi-Lin/HivisionIDPhotos

在线体验

https://huggingface.co/spaces/TheEeeeLin/HivisionIDPhotos

一个轻量级且高效的AI证件照制作工具，支持美颜、轻量级抠图、多种尺寸证件照生成、纯离线或端云推理等功能。

项目特点

轻量级抠图：仅需CPU即可快速推理。
多样化生成：可生成标准证件照、六寸排版照等。
推理方式灵活：支持纯离线或端云推理。
美颜功能：支持证件照美颜。
智能换正装：该功能正在开发中。

使用方法

准备工作

环境要求：

Python >= 3.7（建议使用Python 3.10）。
支持的操作系统：Linux、Windows、MacOS。

克隆项目：

gitclonehttps://github.com/Zeyi-Lin/HivisionIDPhotos.git
cdHivisionIDPhotos

安装依赖：

pip install -r requirements.txt
pip install -r requirements-app.txt

下载模型权重文件：

使用脚本下载：

python scripts/download_model.py --models all

或手动下载并放置到hivision/creator/weights目录下。

人脸检测模型配置（可选）：

默认使用MTCNN模型。
可选RetinaFace模型，需下载权重文件并放置到hivision/creator/retinaface/weights目录下。
也可使用Face++的在线API，需配置API密钥。

运行Gradio Demo

运行命令：
```
python app.py
```
访问本地Web页面（如http://127.0.0.1:7860）进行证件照操作与交互。

Python推理

核心参数：

-i：输入图像路径。
-o：保存图像路径。
-t：推理类型（如idphoto、human_matting等）。
--matting_model：人像抠图模型权重选择。
--face_detect_model：人脸检测模型选择。

示例命令：

制作证件照：

python inference.py -i demo/images/test0.jpg -o ./idphoto.png --height 413 --width 295

人像抠图：

python inference.py -t human_matting -i demo/images/test0.jpg -o ./idphoto_matting.png --matting_model hivision_modnet

部署API服务

启动后端：
```
python deploy_api.py
```
请求API服务：参考docs/api_CN.md文档。

Docker部署

拉取或构建镜像：

拉取最新镜像：
```
docker pull linzeyi/hivision_idphotos
```

使用Dockerfile构建镜像：

docker build -t linzeyi/hivision_idphotos .

使用docker-compose构建：
```
docker compose build
```

运行服务：

启动Gradio Demo服务：

docker run -d -p 7860:7860 linzeyi/hivision_idphotos

启动API后端服务：

docker run -d -p 8080:8080 linzeyi/hivision_idphotos python3 deploy_api.py

同时启动两个服务：
```
docker compose up -d
```

性能参考

测试环境：Mac M1 Max 64GB，非GPU加速。
测试图片分辨率：512x715(1)与764x1146(2)。
模型组合及性能：

MODNet + mtcnn：内存占用410MB，推理时长(1)为0.207s，推理时长(2)为0.246s。
MODNet + retinaface：内存占用405MB，推理时长(1)为0.571s，推理时长(2)为0.971s。
birefnet-v1-lite + retinaface：内存占用6.20GB，推理时长(1)为7.063s，推理时长(2)为7.128s。

JAVA c c++go swift javascript Nginx UI/UE 小程序 Python C#php asp GitHub项目推荐

2024年可用、好用、值得推荐的磁力搜索引擎汇总（长期更新）

每日神器 5年前 208212

23个全网VIP影视剧解析工具（内置接口、有些支持搜索）

每日神器 4年前 5699

火车候补购票究竟啥意思？能提高抢票率吗？看完全明白了

每日神器 5年前 36

火星直播1610：已解锁超清直播源（附7个自建频道分享码）

每日神器 5年前 6654

Kubernetes集群调度

云计算 5年前 50

echarts实现渐变矩形水球图

vue.js 5年前 477

Lyft 发布最大 L5 自动驾驶预测数据集

自动驾驶 5年前 63

让游戏和应用程序在正确的 CPU 核心上运行，供对 CPU 核心的精细控制，从而优化性能。

GitHub项目推荐 6月前 140

猫影视TV115更新后空壳解决方案：新增2个影视源接口！图文演示~

每日神器 4年前 2869

python – 如何创建对象并向其添加属性？

Python 6年前 35

C类中的循环依赖

C# 6年前 39

DIYP影音无极版：畅享VIP电视直播、影视点播、4K影视、特色频道

每日神器 5年前 899

一款自动抓取热点，AI创作文章，自动发布的集成软件。支持头条，小红书，公众号等

GitHub项目推荐 7月前 185

一款功能强大且专业的 Android 设备数据取证工具，专门为执法部门、司法机构和安全调查人员设计开发

GitHub项目推荐 6月前 104

仅 5MB 开源小工具，比付费软件还好用！

GitHub项目推荐 4月前 121

告别手动剪辑！这款开源API让CapCut实现自动化视频处理

GitHub项目推荐 10月前 311

让游戏和应用程序在正确的 CPU 核心上运行，供对 CPU 核心的精细控制，从而优化性能。

GitHub项目推荐 6月前 140

开源的功能强大的在线客服系统，支持多语言，同时提供了详细的开发指南和社区支持，有出海业务客服需求，又想省钱的可以试试

GitHub项目推荐 6月前 144

一个人人可用的多Agent舆情分析助手，打破信息茧房，还原舆情原貌，预测未来走向，辅助决策

GitHub项目推荐 6月前 106

一款macOS用于实时监控主流加密货币价格的菜单栏应用，基于 Swift 编写，致力于打造一款高性能、极简风格的应用 APP

GitHub项目推荐 6月前 105

一款开源的邮件群发软件，支持邮件群发、邮件营销、邮箱爬取、任意变量等功能。

GitHub项目推荐 7月前 127

一个AI模型聚合管理分发系统，支持在线充值功能，支持模型按次数收费

GitHub项目推荐 7月前 111

自动检测你的电脑硬件配置，筛选出最适合你机器运行的大模型，并给出详细的性能评分和运行建议。

GitHub项目推荐 2月前 127

一个利用 AI 制作漫画的工具，支持脚本创作、分镜设计和角色风格控制。

GitHub项目推荐 7月前 148