paper2gui: A Jupyter Notebook repository from wisfern

Paper2GUI 🚀🚀🌟: 让每个人都简单方便的使用前沿人工智能技术

Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱，免安装即开即用，已支持 30+AI 模型，内容涵盖 AI 绘画、语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows、Mac、Linux 系统。

English | 中文 | Telegram | B站(媒体)

下载小白兔 AI：

已发布内容【下列独立 APP 完全免费】

语音合成

文字转语音工具，适用于配音、讲解、说书、广告等场景。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
微软语音合成 🔥	5Mb	FastSpeech	✅	✅	✅	✅	Download
抖音火山语音 🔥	13Mb	Unknown	🔲	✅	✅	✅	Download
阿里云语音合成	13Mb	Unknown	🔲	✅	✅	✅	Download

艺术绘画

文本转图片，想象力与 AI 的完美结合

名称	大小	Model	多语言	Windows	Mac	Linux	下载
StableDiffusion🔥	10Mb	Naifu	✅	✅	🔲	🔲	Download

视频超分辨放大

视频超分工具，适用于 720p 或 360p 视频转 1080p 或 4k 视频,画质升级且不模糊，目前主要用于动漫视频超分。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
RealESRGAN-GUI(RAM)🔥	41.8Mb	RealESRGANv3	✅	✅	🔲	🔲	Download
waifu2x-GUI	38.9Mb	waifu2x	⏳	✅	🔲	🔲	Download
RealESRGAN-GUI	28.8Mb	RealESRGANv2	🔲	✅	🔲	🔲	Download
RealCugan-GUI	56.4Mb	RealCugan	🔲	✅	🔲	🔲	Download
RealSR-GUI	94.5Mb	RealSR	🔲	✅	🔲	🔲	Download

视频补帧

运动类视频流畅度升级工具，可以将低帧率 30fps 升级到 60fps 或 360fps。适用于丝滑质感需求。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
RIFE-GUI(RAM)🔥	51.2Mb	Rife	✅	✅	🔲	🔲	Download
DAIN-GUI	72.6Mb	Dain	🔲	✅	🔲	🔲	Download

图像风格化(照片转动漫)

图像风格化，可以将照片转换为动漫风格、梵高风格、毕加索风格等等。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
AnimeGAN-GUI🔥	8.9Mb	AnimeGANv2	✅	✅	🔲	🔲	Download

人像抠图

AI 一键抠图，可生成透明图、绿幕、红幕、蓝幕等背景图片，头发丝处理良好，适合任意人物抠图需求。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
RVM-GUI🔥	12.9Mb	rvm	🔲	✅	🔲	🔲	Download

人像修复

人像修复，可以将人像修复为清晰的图片，提升清晰度。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
GFPGAN-GUI🔥	242Mb	GFPGAN	✅	✅	🔲	🔲	Download

视频抠图

视频抠图，利用 RVM 等算法，可实现无绿幕视频抠图，适合各种自媒体视频制作，节约大量时间。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
MODNet-GUI🔥	77.5Mb	modnet	🔲	✅	🔲	🔲	Download
MobileNetV2-GUI🔥	34.6Mb	MobileNetV2	🔲	✅	🔲	🔲	Download

目标检测

适用范围太广，比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
YOLOv6-GUI	46Mb	yolov6n	✅	✅	🔲	🔲	Download
YOLOv5-GUI	60.2Mb	yolov5s	✅	✅	🔲	🔲	Download
YOLOX-GUI	50Mb	yolox_nano	✅	✅	🔲	🔲	Download

辅助工具

辅助工具，提供了一些常用的辅助工具，比如视频比对工具等。

名称	大小	Model	多语言	Windows	Mac	Linux	下载
Video_compare🔥	56.1Mb			✅	🔲	🔲	Download

小白兔 AI - 聚合版【更专业的选择】

小白兔 AI 是一款功能非常强大的人工智能软件,实现了 AI 绘画、语音合成、视频抠图、动漫超分辨、视频补帧、录音降噪、视频上色、人脸动漫化、图片 OCR 批量识别等 30 余种功能，致力于打造一款实用、好玩又有趣的 AI 生产力聚合工具箱。面向生产力用户，可免费试用 14 天，支持 Windows 和 Mac 系统。

已内置功能	适用场景	功能简介
RealCugan-Pro 动漫超分辨	动漫图片或视频超分辨放大	自研 AI 引擎驱动，可获得最高质量的动漫超分辨效果，可能是目前唯一可轻松使用 RealCugan-Pro 模型的软件
RealESRGAN 动漫超分辨	动漫图片或视频	推理速度快，质量比 waifu2x 好太多，常规超分辨首选
智能抠图	任意图片或视频	推理速度快，一键获得透明图片或绿幕视，进行二次创作
人像动漫化	仅适合头像处理	转换效果出众，有趣又好玩
语音合成	自媒体视频配音、有声读书等	效果逼近真人，发音自然、带呼吸声、支持 txt 大文件极速合成
录音降噪	真人配音后处理	一键去除环境和背景噪音，提升录音清晰度，效果明显
视频补帧	运动类视频流畅度升级工具	可获得丝滑观感，已支持 RIFE 和 IFRNET 两种 AI 模型
一键超补	同时完成超分和补帧	融合超分和补帧模型，一键获得超补结果
AI 一键跑分	一键查看设备 AI 性能数据	模拟真实推理任务，统一量化推理任务，耗时越小越好
图片 OCR 识别	图片转文字	基于 Paddle-OCR-v3 模型，迄今最优秀的 OCR 识别模型、效果出众
视频字幕 OCR 提取	硬字幕提取	使用 PP-OCR 自动识别字幕位置及文字，输出字幕文件
视频上色	老旧黑白照片或视频上色	适合风景类黑白视频上色，推理速度快
人脸修复	人脸照片修复	可增强老旧照片、修复人脸，提高清晰度
目标检测	图像检测和分割	展示 AI 技术在通用场景下的检测、分割、追踪等效果