/paper2gui

Convert AI papers to GUI,Make it easy and convenient for everyone to use artificial intelligence technology。让每个人都简单方便的使用前沿人工智能技术

Primary LanguageJupyter NotebookMIT LicenseMIT

Paper2GUI 🚀🚀🌟: 让每个人都简单方便的使用前沿人工智能技术

Paper2GUI: 一款面向普通人的 AI 桌面 APP 工具箱,免安装即开即用,已支持 40+AI 模型,内容涵盖 AI 绘画、语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR 识别等领域。支持 Windows、Mac、Linux 系统。

English | 中文 | Telegram | B站(媒体)

小白兔 AI 3.0 版起永久免费 AI 绘画、人脸动漫化,图片修复和视频补帧功能,欢迎使用

下载小白兔 AI:

已发布内容【下列独立 APP 完全免费】

文字转语音工具,适用于配音、讲解、说书、广告等场景。

名称 大小 Model 多语言 Windows Mac Linux 下载
微软语音合成 🔥 5Mb FastSpeech Download
阿里云语音合成 13Mb Unknown 🔲 Download

文本转图片,想象力与 AI 的完美结合

名称 大小 Model 多语言 Windows Mac Linux 下载
StableDiffusion🔥 10Mb Naifu 🔲 🔲 Download

视频超分工具,适用于 720p 或 360p 视频转 1080p 或 4k 视频,画质升级且不模糊,目前主要用于动漫视频超分。

名称 大小 Model 多语言 Windows Mac Linux 下载
RealESRGAN-GUI(RAM)🔥 41.8Mb RealESRGANv3 🔲 🔲 Download
waifu2x-GUI 38.9Mb waifu2x 🔲 🔲 Download
RealESRGAN-GUI 28.8Mb RealESRGANv2 🔲 🔲 🔲 Download
RealCugan-GUI 56.4Mb RealCugan 🔲 🔲 🔲 Download
RealSR-GUI 94.5Mb RealSR 🔲 🔲 🔲 Download

运动类视频流畅度升级工具,可以将低帧率 30fps 升级到 60fps 或 360fps。适用于丝滑质感需求。

名称 大小 Model 多语言 Windows Mac Linux 下载
RIFE-GUI(RAM)🔥 51.2Mb Rife 🔲 🔲 Download
DAIN-GUI 72.6Mb Dain 🔲 🔲 🔲 Download

图像风格化,可以将照片转换为动漫风格、梵高风格、毕加索风格等等。

名称 大小 Model 多语言 Windows Mac Linux 下载
AnimeGAN-GUI🔥 8.9Mb AnimeGANv2 🔲 🔲 Download

AI 一键抠图,可生成透明图、绿幕、红幕、蓝幕等背景图片,头发丝处理良好,适合任意人物抠图需求。

名称 大小 Model 多语言 Windows Mac Linux 下载
RVM-GUI🔥 12.9Mb rvm 🔲 🔲 🔲 Download

人像修复,可以将人像修复为清晰的图片,提升清晰度。

名称 大小 Model 多语言 Windows Mac Linux 下载
GFPGAN-GUI🔥 242Mb GFPGAN 🔲 🔲 Download

视频抠图,利用 RVM 等算法,可实现无绿幕视频抠图,适合各种自媒体视频制作,节约大量时间。

名称 大小 Model 多语言 Windows Mac Linux 下载
MODNet-GUI🔥 77.5Mb modnet 🔲 🔲 🔲 Download
MobileNetV2-GUI🔥 34.6Mb MobileNetV2 🔲 🔲 🔲 Download

适用范围太广,比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。

名称 大小 Model 多语言 Windows Mac Linux 下载
YOLOv6-GUI 46Mb yolov6n 🔲 🔲 Download
YOLOv5-GUI 60.2Mb yolov5s 🔲 🔲 Download
YOLOX-GUI 50Mb yolox_nano 🔲 🔲 Download

辅助工具,提供了一些常用的辅助工具,比如视频比对工具等。

名称 大小 Model 多语言 Windows Mac Linux 下载
Video_compare🔥 56.1Mb 🔲 🔲 Download

小白兔 AI 是一款功能非常强大的人工智能软件,实现了 AI 绘画、语音合成、视频抠图、动漫超分辨、视频补帧、录音降噪、视频上色、人脸动漫化、图片修图、视频修复等 40 余种功能,致力于打造一款实用、好玩又有趣的 AI 生产力聚合工具箱。面向生产力用户,可免费试用 14 天,支持 Windows 和 Mac 系统。从 3.0 版起 AI 绘画、人脸动漫化、图片修复和视频补帧永久免费。

已内置功能 适用场景 功能简介
RealCugan-Pro 动漫超分辨 动漫图片或视频超分辨放大 自研 AI 引擎驱动,可获得最高质量的动漫超分辨效果,可能是目前唯一可轻松使用 RealCugan-Pro 模型的软件
RealESRGAN 动漫超分辨 动漫图片或视频 推理速度快,质量比 waifu2x 好太多,常规超分辨首选
智能抠图 任意图片或视频 推理速度快,一键获得透明图片或绿幕视,进行二次创作
人像动漫化 仅适合头像处理 转换效果出众,有趣又好玩
语音合成 自媒体视频配音、有声读书等 效果逼近真人,发音自然、带呼吸声、支持 txt 大文件极速合成
录音降噪 真人配音后处理 一键去除环境和背景噪音,提升录音清晰度,效果明显
视频补帧 运动类视频流畅度升级工具 可获得丝滑观感,已支持 RIFE 和 IFRNET 两种 AI 模型
一键超补 同时完成超分和补帧 融合超分和补帧模型,一键获得超补结果
AI 一键跑分 一键查看设备 AI 性能数据 模拟真实推理任务,统一量化推理任务,耗时越小越好
图片 OCR 识别 图片转文字 基于 Paddle-OCR-v3 模型,迄今最优秀的 OCR 识别模型、效果出众
视频字幕 OCR 提取 硬字幕提取 使用 PP-OCR 自动识别字幕位置及文字,输出字幕文件
视频上色 老旧黑白照片或视频上色 适合风景类黑白视频上色,推理速度快
人脸修复 人脸照片修复 可增强老旧照片、修复人脸,提高清晰度
目标检测 图像检测和分割 展示 AI 技术在通用场景下的检测、分割、追踪等效果
图像修复 老旧照片修复 可全身修复,也可只修复人脸,效果出众
视频转动漫 风格迁移 普通视频转换为动漫画风的视频
Whisper 语音识别 支持十几种语言识别 一键本地生成字幕
字幕翻译 连续语境下的字幕翻译 告别传统单条字幕翻译,连续语境更准确,支持 28 种语言互译
派蒙语音合成 本地 tts 约 800 多种语音,本地无限制合成

聚合版面向专业需求用户,付费只是为了持续产出优质 AI 应用。已开源的 20 个单独 APP 完全免费,各取所需,请勿喷我,如果项目帮到了你,不妨点个 Star。

部分截图

适配说明

本人开发环境为Windows系统,默认会发布WindowsLinux版本,得益于微软SandboxWSL2,可随时测试这些环境。为了拓展和持续产出优质又实用的 AI 生产力工具,现已上架“小白兔 AI”,欢迎大家助力开发者,推动人工智能的普及化。

社群交流

QQ 群:497556961

变更日志

查看

参考

Star History

Star History Chart