Disco-Diffusion-And-Stable-Diffusion-Windows-x64 V5.0 + | Disco-Diffusion-Windows-x64 V2.0 +
基于 https://github.com/alembics/disco-diffusion 和 https://github.com/CompVis/stable-diffusion ,用pyside2做了界面(持续更新),Windows 系统电脑可以,推荐2GB以上独显,30系列、20系列、10系列N卡最佳,AMD显卡不支持。
(1)百度网盘链接:链接:https://pan.baidu.com/s/1B0g4MPFe_drP_hRjgEnKGg 提取码:95kh
(2)天翼网盘链接:https://cloud.189.cn/t/ZZ7vuyZrMvmm (访问码:7dn8)
(3)谷歌网盘链接:https://drive.google.com/drive/folders/1mBtw3oz9rCsQflt5xzDw08Z9VRMDoB_T?usp=sharing
1、支持ControlNet 1.1作画、腾讯T2I-Adapter作画两种作画功能;
2、支持LORA(包括Lycoris类的lora模型)、众多VAE类模型加载;
3、所有作画功能支持参考图选择视频参考,自动逐帧参考,自动生成视频;
4、音视频转文字的最大模型后端改为faster_whisper,速度提升4倍,显存占用3-5G左右(int8和fp16模式),且不会出现繁体中文了;
5、加入清华大学的类chatgpt项目chatglm,6G显存就能用;
6、加入rembg抠图和SAM抠图(facebook的seg anything)功能;
7、图片说话加入音频驱动功能(包括维持原图,不仅仅是人脸视频了),图片说话参数设置里设置即可;
8、支持视频补帧,最高16倍补帧;
9、图片高清放大支持半精度模型,显存占用减小一倍,且支持高清放大视频了;
10、图片转3D支持选择几个模式输出以及视频码率设置;
11、主界面众多功能菜单化、作画参数设置界面分离化,参数分类不拥挤;
12、软件报错后不需要重开软件了,按钮仍可以点击。
1、SD作画加入xformers加速模块(仅Windows10、Windows 11可用加速),显存占用模式选项可选择+xformers,提速至少50%,显存占用也小很多;
2、SD作画加入DPM++等多种采样器,DPM采样器10-20步效果很好;
3、SD作画支持SD2.0、2.1模型加载,但目前仅做了文字转图片功能;
4、SD作画支持VAE模型导入;
5、SD作画支持safetensors格式模型;
6、SD作画新增另一种AI写描述,称为AI写描述2;
7、参数设置导入配置按钮,支持在黑窗显示所有带有图片meta信息的图片内容;
8、加入图片仿照说话视频功能,最终实现人像静图说话的功能,主界面点击【图片说话】按钮选择图片即可;
9、音视频转文字种的大模型更新到2代,扩展到100多种语言;
10、删除俄罗斯图片风格仿造和SD的风格仿造功能,因为现在的SD参考图仿图效果明显效果更好;
11、软件主界面标题显示显存、CPU、内存等信息;
12、主界面设置的大小会记住,参数设置界面选择会记住上次设置的tab。
1、加入DeepDanbooru解析功能,参数设置下方点击对应按钮,导入图片即可解析背后的TAG,对于SD作画诸如NovelAI等模型有些用处;
2、加入SD自动写描述功能,随便写个开头,描述框右边AI写描述按钮即可续写描述;
3、图片上色功能支持黑白二次元图上色;
4、SD作画支持进度显示和预览图,在参数设置里设置预览频次即可,目前仅在描述转图模式下生效;
5、SD作画显存占用模式非常低改为超级低,现在的非常低相比超级低多用1G显存,提速将近1倍;
6、SD作画参考图支持自适应宽高比选项,比如参考图尺寸宽高为1024×512,绘图参数尺寸设置512×512,默认无,代表不自适应,最终出的图尺寸为512×512;固定宽代表,以绘图参数尺寸设置的宽512为准,参考图宽高比2比1,高自动修改为256,最终输出512×256的图;
7、AI高清放大现在支持2-10倍放大设置了;
8、DD作画支持设置多张显卡用户的单卡使用序号,比如想要用第二张显卡,序号设置为1即可;
9、快捷描述现在不是替换了,而是可以基于原来的描述插入;
10、新增图片或者视频上色功能,点击主界面图片/视频上色按钮,批量选择图片或者视频即可进行上色操作;
11、鉴黄模型在官方模型基础上加入另一个模型,两个模型共存投票(全票通过)进行最终结果判别,不好的图直接黑图了;
12、SD动画、参考视频支持负描述,修复参考视频差异度参数、种子无效的bug;
13、DD和SD参考图作画保存的文件名字包含参考图名字;
14、谷歌的prompt2prompt占坑,SD参数设置勾选文字编辑模式即可跑修改描述关键词更改画面风格功能,目前做的很简陋,基本先占坑;
15、SD模型融合支持,可选择两个ckpt格式的SD模型进行按比例融合,融合后的ckpt格式模型,可在SD设置里调用;
16、老照片修复功能还同时输出高清修复的纯人脸图片和原来的人脸照片。
1、Stable Diffusion(下面简称SD)作画功能支持2D动画功能(支持参考图模式,选择参考图,即可以参考图引导动画帧生成;支持三轴移动、缩放、角度调整等)、参考视频功能,动画模式2D输入描述支持帧数设置,如下换行描述(三个冒号后面跟着帧序号): a:::10 b:::20 c:::30 代表,a描述有10帧,b描述20帧。。。。
2、加入Dream Booth模型训练功能,CPU和显卡两种方式都可以,显卡目前24G显存可以,CPU训练内存32G以上估计就可以;鼠标悬停训练参数旁边的问号有参数解释;训练完成后会自动在模型目录对11GB大小的模型进行裁剪到2GB大小;支持DB断点模型选择;模型名字显示步数;
3、SD作画增加局部修改功能,点击局部修改按钮,对图片继续涂鸦,即可局部修改,不过此功能效果有些图片有限;
4、SD文字描述支持负描述,所谓负描述就是不想让画面出现的元素;
5、SD支持调用第三方的ckpt格式的SD模型,SD参数设置下方选择自定义模型按钮即可;
6、SD支持图片仿造功能,不过需要至少16G显存,SD参数设置最下方,选择待仿造图片,无需描述,即可生成类似风格图片;
7、SD作画16代显卡黑图问题修复,SD设置里勾选16代即可;
8、伴奏人声分离4G显卡可以用了,伴奏人声分离设置勾选低显存占用模式即可;
9、加入音视频转文字功能,批量选择音视频,即可生成srt字幕文件和纯文字txt版文件,支持大量国外语言;
10、修复图片转3D找不到图片的报错问题;
11、修复图片高清放大、老照片修复,DD或SD作画写到图片的配置丢失问题。
1、加入Stable Diffusion作画模型,主界面点击【SD作画】按钮即可Stable Diffusion作画,参数设置里是SD作画设置,支持和DD作画一样的队列模式等功能;
2、加入人声伴奏分离功能,导入歌曲,即可分离人声、伴奏、鼓点等,支持批量选择音频。
1、参数设置下方,【AI图片描述解析】按钮,支持选择图片,AI解析描述,当然描述会有偏差,但效果还是不错的,可以适当润色;目前测试【AI图片描述解析】功能仅占用4-5G显存左右;
2、加入AI高清人脸老照片修复功能,点击【AI老照片修复】选择图片即可修复,高清修复仅修复人脸,可配合AI高清放大功能使用,支持批量选择图片;
3、配置文件导入支持colab在线版DD生成的配置文件,注意后缀修改为json格式才行,后续将支持更多其他在线配置文件。
1、支持导入AI作画配置文件,也就是images_out文件夹下的json配置文件,注意必须是DD5_V3.10生成的图片配置文件才能导入,之前的json文件不支持;
2、支持导入AI作画配置文件,支持生成的图片参数导入注意必须是DD5_V3.10生成的图片才能导入,之前的图片文件不支持,此选项可以参数设置里关掉;
3、加入小说训练模型,导入txt格式的小说集,选择参数即可训练,也是看loss数值降到比较低的模型才是好模型;
4、修改界面上一些文字显示歧义或者错误。
1、修复json文件损坏,打开参数设置崩溃的bug;
2、软件目录的【描述风格库】是后续快捷描述的调用库,都是csv文件,各位可以自己按照模板csv文件格式创建自己的模板库,软件自动调用;
3、添加随机描述批量模式,在队列模式下,文字描述格式输入by {400|1|艺术家},代表从【描述风格库】文件夹得艺术家.csv文件里调用单个艺术家,生成400个设置文件,也就是同样描述下仅艺术家不一样,400个艺术家的描述,具体还得看B站视频介绍;
4、队列模式下,可以多选参考图,生成多个setting文件,也就是同样的参数,不同的参考图;
5、扩散模型训练支持选择多少步停止训练、支持基于模型基础上继续训练;
6、修复某些扩散模型加载报错的问题;
7、加入三次元真人全身生成,和原先的二次元参数设置基本一致;
8、加入AI作画提前终止功能,注意当绘制5步以上时,才可以点击终止按钮。
1、加入自定义的几种模型:人像模型、科幻模型、国画模型,使用这几种模型后,画出的风格倾向于模型对应的风格;
2、加入自己训练扩散模型的功能,这样上面的自定义模型,你也可以自己训练,6GB显存就能训练出国画模型;
3、加入AI写小说功能,这个功能比较简单,输入开头,即可续写;
4、图片风格仿造功能,支持仿造图片数量设置,此功能10GB显存以下目前直接不让用了,因为跑不动;
5、二次元小姐姐生成功能轮播模式,支持设置轮播时长;
6、删除参数设置里的go_big模式,此模式一直没做占空,现在测试作用不大;
7、其他bug修复。
1、加入rudalle项目的图片风格仿造功能,点击主界面图片风格仿造按钮,选择一张图,即可输出4张风格类似的四张图,此功能要求至少10GB显存;
2、加入基于TAADNE项目的二次元人像和全身半身生成功能,点击主界面二次元小姐姐按钮,即可生成各种不同类型的二次元,参数设置里可进行参数设置,以生成不同类型;
3、修复快捷描述,部分用户打开失败的bug;
4、加入3D视频输出目录的按钮。
1、加入快捷描述功能,点击文字描述旁边的快捷描述按钮,即可添加各种画家、风格、景物、形容词、艺术网站等,可以手动通过软件目录的csv文件自行添加说明,目前画家的说明没有整理完;
2、主界面下方加入打开图片输出目录按钮,以及缓存崩溃文件CrashDumps目录按钮,点击查看崩溃文件,手动删除即可。
V3.5版本:2022-06-18 V3.5视频说明:https://www.bilibili.com/video/BV1Ut4y1H7yL
1、添加Disco Diffusion V5.3的对称功能,可以在参数设置里设置水平和垂直对称;
2、修复AI图片高清放大功能放大中文路径图片无法保存的问题;
3、网盘里删减无用的包,现在软件体积整体变小了,且模型库分为必装的模型包和可选的模型包,可选模型包仅在需要的时候下载即可。
V3.4版本:2022-06-12 ,V3.4视频说明:https://www.bilibili.com/video/BV1Ut4y1H7yL
1、图片转3D支持时长和摄像机位移设置,原图尺寸输出视频,清晰度更高;
2、AI高清放大,实测6G显存1920×1080的图用x4模型放大4倍也不会超显存了,因为可以设置tile_size(拼图大小)参数;
3、加入目前挺火的像素PIXEL DD绘画模式https://github.com/KaliYuga-ai/Pixel-Art-Diffusion ,这个模型占用显存不大,小显存诸如6G能上1200×600,参数设置里提供两种绘图Diffusion模型引擎选择,原版DD和像素版DD;
4、参数设置界面记忆上次拉伸界面,不同分辨率显示器不用每次都拉伸界面了;
5、加入use_secondary_model这个选项,如果关闭此选项,DD将使用常规(大型)扩散模型,开启此选项则使用二级模型更快且显存占用小–一位用户报告渲染速度提高了50%!然而,二次模型要小得多,可能会降低图像质量和细节;
6、加入clamp_max参数设置,clamp_max设置clamp grad的上限,数值范围0-0.3。默认0.05在图像中提供更平滑、更柔和的着色,但设置更高的值(0.15-0.3)可以提供有趣的对比度和活力。
V3.3版本:2022-06-01 V3.3视频说明:https://www.bilibili.com/video/BV1aU4y197tW/
1、新增图片转3D模式,基于 https://github.com/vt-vl-lab/3d-photo-inpainting 项目,实现图片批量转换成3D效果的视频,支持jpg、png格式图片,图片转3D比较慢,耐心等待转换过程;
2、新增中译英翻译,文字描述旁边的中译英按钮即可实现;
3、加入关于软件界面,更加显得正式,哈哈。
1、新增队列模式,也就是批量参数画图模式,此功能可以实设置诸如不同描述词,进行批量绘制,详情参见视频:https://www.bilibili.com/video/bv1ZZ4y1t7wW ;
2、eta默认值由0.5改为0.8,和官方保持一致;
3、参数设置界面的参考图设置、图像质量设置都加入到基本设置里,更方便高效设置;
4、参数设置界面整体配色更加护眼;
5、文字描述默认改为:a beautiful painting of winter, trending on artstation;
6、绘制图片轮数n_batches改为1;每轮中间保存数改为1;
7、增设项目名称,默认TimeToDisco,也就是原来图片的都会在软件目录【images_out/TimeToDisco】文件夹下,现在比如设置项目名称为【我的项目】,则图片都会保存软件目录【images_out/我的项目】文件夹下。
1、加入开源AI超分辨率项目功能,此项目很优秀,可以对二次元、三次元图进行2~4倍高清放大,见主界面【AI高清放大】按钮,支持批量选择图片,在参数设置界面的【Real-ESRGAN画质增强】tab下可以设置放大倍数和模型选择; 调用项目:https://github.com/xinntao/Real-ESRGAN
2、skip_steps最大不能超过steps-1,防止有部分小伙伴设置steps和skip_steps相同导致不画图;
3、软件主界面的【生成】按钮改名为【开始AI作画】;
4、n_batches默认由5改为2,这样一套参数默认画两张图了;
5、默认图片尺寸由256×256修改为128×128;
6、加入主界面几个按钮的帮助提示;
7、更改软件图标,鸣谢图标设计者B站主页:https://space.bilibili.com/22936830/channel/series 。
1、相比V2.0版本,引入新的内核架构,测试性能提升5%~10%;
2、上个版本爆显存的弹窗指示不够完善,删掉此功能,爆显存依然通过黑窗CUDA OUT OF MEMORY查看;
3、启动时,黑窗的引起误会的warning去除掉了;
4、简化V2.0版本的安装要求,将移动到C盘用户文件夹下的vgg16-397923af.pth模型,也归属到models文件夹,现在安装就很简单了,两部操作:解压到pic_disco文件夹;models文件夹移动到pic_disco文件夹即可完成安装。
3、安装(视频教程1分钟后开始:https://www.bilibili.com/video/BV1aU4y197tW )
解压pic_disco.zip,生成pic_disco目录,不要解压到C盘。
网盘里的models文件夹移动到pic_disco目录中;
进入软件目录pic_disco,双击打开DD5_V3.0程序即可,软件界面如下所示 :
pic_disco\images_out。
pic_disco\progress.png,每几个step(频率可配置)更新一次图片。
目前没有实现停止绘图功能,主要是显存没有释放干净,关闭黑窗,就关闭软件,释放显存了,然后重新打开软件即可。
可能需要至少6GB显存,以下为测试情况:
(1) RTX2060 6G独显,图片尺寸256x512可行;
(2) RTX1070 8G独显,250steps耗时预估2小时,图片尺寸1280x720;
(3) RTX2070S 8G独显,450steps耗时预估16分钟,图片尺寸960x448;
(4) RTX3090 24G独显,450steps耗时预估10分钟,图片尺寸1280x720。
注:默认参数因为选了3个CLIP模型,如果想要尺寸更大,少选几个模型即可,但效果肯定有所影响,诸如6G独显的2060显卡,之选如下第一个模型,尺寸768×512都没问题:
下面这些都是图片设置过大导致的爆显存,或者6GB以下的显卡:
(1) Unable to find a valid cuDNN algorithm to run convolution
(2) CUDA out of memory
下均是网友利用离线版V2.0+版本生成的图,供各位参考:
(1)默认参数下,仅尺寸改为1280×720,RTX3090生成
(2)默认参数下,仅尺寸改为768×448,RTX3070-8G独显笔记本版生成
(3)默认参数下,仅尺寸改为1280×512,RTX3090生成
(4)默认参数下,仅尺寸改为1280×512,RTX3090生成