shader-book-learn 总结篇

引擎最近开发了两年左右了，准备系统的过一遍，先把shader入门精要在过一遍，记录下过程笔记。

第四章（神奇的数学）

一些推导细节可以看下games101的几节视频讲的比较透彻。

法线利用约束求变换，还有mul() 可以利用矩阵的左乘或者又乘减少一次主动的矩阵转置。
mul（UNITY_MATRIX_MVP,X））是又乘的，因为unity内置的矩阵都是按照列方式存储的 p90 (pvm)*x

课后有几个问题比较有意思 a. 在一个圆弧范围内判断两点关系。如点 A,B 构成向量AB -> B减去A,获得向量，求模，判断在没在圆形范围内，根据向量点乘法，获得arcos 值，反推角度。 b. 判断一个点在三角形内还是三角形外: 简单方法 ABC 按照这个顺序和对应点P求cross ，符号一致即在三角形内部，不一致三角形外部。 games101也有一个简化方法重心法 c.三角形重心坐标，即模型的三个顶点覆盖的那个像素，通过重心坐标求平均值。

另外补充下103 vector.dot 到法线平面距离
一个利用vector.cross（sin(theata 求到圆心距离的公式，也挺有意思)

第五章(基础shader篇)

subshader 类似 direct X 中的 techniques 一样，在多pass种找到最合适的那一个。 ### 1 subshader 和 pass 不区分大小写，但是为了规范还是写成SubShader 和 Pass 测试发现SV_POSITION 和 SV_Target 大小写也不影响。 ### 2.pass 写几个就会执行几次，如之前错误的在一个pass后面又写了一个pass，导致材质球最后是白的。

Fallback 紧跟着SubShader后面

3.如果定义v2f的话，vert shader 不用加一个SV_POSITION语义了，DX10新出的（因为函数返回值是个v2f自定义的数据结构，而该数据结构内部已定义好语义）

https://stackoverflow.com/questions/58543318/invalid-output-semantic-sv-position-legal-indices-are-in-0-0

反之下面这种则需要加上SV_POSITION的语义

4 vs和ps中的一些数值计算，需要注意ps的数值是平均数值。（ndc变换那一坨，除以那个w的操作）

在vs中只进行mvp变化，变换后仍是线性空间。（因为vs中需要保持线性空间，vs和ps的桥梁是光栅化，光栅化会把vs中算出的值平均到ps中，所以vs要保持线性数值）
在ps中才进行ndc变换，即除以 w分量才会变换到[-1,1]范围内（dirextX z的范围为[0,1]） **vs 和 ps 的一个不同就是，vs中所有数值都在线性空间里面，而ps里面如果要确保各个值都是线性的，需要慎重进行归一化 **

一般不在vs中进行ndc变换，(只做mvp变换，在写引擎的时候可以考虑下这个问题)
1 .因为z轴变换后是非线性的了。
2 .vs算出来的值会平均给到vs，都归一化之后的平均会有问题。 纸质书第一版p92页 http://candycat1992.github.io/unity_shaders_book/unity_shaders_book_chapter_4.pdf 61-p99
vs shading 也叫Gouraud shading .(高洛德着色) ps shading 也将Phong shading.

5.切线空间（顶点自带一个tangent 属性，利用tangent 切线和法线垂直约束推导法线变换矩阵）。

a. 法线变换矩阵 法线也是在模型空间的，不能和模型一样的变换矩阵，否则不垂直。（但是切线tangent可以，因为切线本质就是顶点的属性，切线可以用和顶点一样的矩阵做变换,可以利用切线变换后和法线垂直的特性来算出法线变换矩阵）
http://candycat1992.github.io/unity_shaders_book/unity_shaders_book_chapter_4.pdf 55-p93

法线变换矩阵推导原理为 向量点乘可以换成两个矩阵的乘法,第一个向量转置成一个矩阵，然后按照约束条件，
大概可参考这个 https://zhuanlan.zhihu.com/p/86442304

6.调试部分和平台差异。

a. 假色彩图像，每个值都除以2（具体的写法是x 0.5)然后在加0.5 就把值限制在了0-1之间了。（这里可以认为 appdata传到vs里面的值都被限制到了0-1之间了，这样就都约束都限制在0-1了）
b. opengl 和directX 一个左下角（0,0）一个右上角（0,0），unity 有个宏可以区分 UNITY_UV_AT_TOP 宏区分开，如果渲染到屏幕上： unity自身会做处理。渲染到rendertexture上，单张贴图：graphic.blit 无需考虑。
多张贴图需要考虑这个问题（mrt技术，即可以渲染多张贴图的技术）

c. tex2d函数采样。directx9/11 只能在ps中用，不能在vs用，如果vs确实想采样图片，可以使用tex2dlod函数代替，需要开启#pragma target3.0 编译选项才可以 p116。
d. 慎用if 等语句，gpu的设计情况有关系，GI book 讲的也比较清晰。

第六章（基础光照）

1. 经验模型（不考虑brdf）：

color = ambient + diffuse + specular + emission (自发光) ，最简单的光照公式，各向同性。

但是通过什么保证这几个数相加小于等于1的呢？(当前还没有证明)

2. Tags标记(即Unity中引擎处理forward渲染管线的一些**):

a.LightMode, 前向渲染有两个，ForwardBase 和 ForwardAdd。 两个标记分别unity的一个优化，ForwardBase 只有最亮的第一个光源ps执行，其他 VS/SH 球谐函数计算，然后在执行ForwardAdd的pass。

本质**：减少 m*n的减少复杂度 （光源是m,物体是n）
  1.引擎层收集所有Tag标记为 ForwardBase/ForwardAdd的 Object.形成两个std::vector<object>
  2.先拿出场景中最亮的那1个灯光，然后和ForwardBase的那个std::vector<object>做一次循环即
  3.在拿剩下的最多n个光源 和ForwardAdd的std::vector<object> 做第二个循环,然后结果相加。 

其实优化**和defferd shading 差不多一样（高斯模糊N*N  变成水平N+竖直N）下面 参考链接

3.cg中的 reflect(input,normal)函数

约定方向是以 -_WorldSpaceLightPos0.xyz ，从光源方向看向原点的方向计算的。 原理为（都转化到了世界空间，所以可以看成在坐标原点的计算）
（简单来说，得到入射光线的负方向，然后矢量加法做个推导得出）

更多的时候光照specular用了blinn-phong**（即 normallize(viewDir + lightDir)）

4. specular 计算 viewDir(之前看书没实践忽略的一个地方)

worldViewDir =_WorldSpaceCameraPos.xyz - i.vertexWord (对于vs/ps来说，各个处理单位有自己独立的一个视角方向 顶点的方向到相机的方向) 。这个之前忽略的一点。

当前的光照模型简单概括下：

Color = ambient + diffuse + specular

其中：
    a. ambient  环境光，直接取最亮的环境光即可，unity中的为 UNITY_LIGHTMODEL_AMBIENT.xyz
    b. diffuse  漫反射项目（和观察角度无关，各向同性）:
        b.1 通用的lambert 光照模型：  lightColor * _Diffuse.xyz * saturate( dot(normal , lightViewDir));
            和视角无关，注意的是 需要 saturate(dot) 或者max(0,dot) 注意负角度。
        
        b.2 value公司的half-lambert模型（cs的那个模型）
        diffuse = （ lightColor * _Diffuse.xyz ）* （0.5 * dot(normal,lightViewDir) + 0.5) 
    
    c. specular 高光项（视角有关、两种模型）
        c.1 phong 光照模型（利用reflect函数计算反射角，需要考虑负角度问题）
            反射方向：reflectDir = reflect( -lightDir , normal)
            视角方向：specular = lightColor * _Specular.xyz * pow ( max( 0 , dot( viewDir , reflectionDir )) , _Gloss )
        
        c.2 blinn-phong 光照模型：简化了反射方向(不需要计算反射了)
            半程向量 ：half = normalize( viewDir + lightDir )
            最终高光：specular = lightColor * _Specular.xyz * pow(max(0, dot( half, normal )) , _Gloss )

5.一个重要的数学变换：法线变换矩阵

worldNormal = normalize( mul( v.normal , unity_WorldToObject));

即顶点法线需要乘以：objectToWorld的逆转矩阵（这里有一个技巧，就是mul 交换位置，可以省下来一次矩阵转置（简单的矩阵乘法特性））

法线变换矩阵的推导利用了和tangent的正交性质进行的推导：（参考3、4）

参考链接

1.延迟渲染本质减少m*n 和 shader复杂度的

http://download.nvidia.com/developer/presentations/2004/6800_Leagues/6800_Leagues_Deferred_Shading.pdf

2reflect 函数: 负方向三角函数相加

https://zhuanlan.zhihu.com/p/152561125

3.法线变换矩阵的推导：利用和tangent的约束推导

http://candycat1992.github.io/unity_shaders_book/unity_shaders_book_chapter_4.pdf ： 55 P93

https://zhuanlan.zhihu.com/p/86442304

第七章：基础纹理（abedo,normal,ramp,mask）

1 纹理坐标(左上角还是右上角是(0,0)的那个)

a.除了屏幕空间区分，MRT外 ，普通的贴图也要考虑这个概念。
unity使用纹理坐标是openGL的传统保持一致，即左下角为（0，0）点。

2 图片的采样格式(unity中的贴图格式)

a. point: 最邻近点采样，各种情况下只取最近的那一个元素。（像素风游戏等。
b. Bilinear ：四点插值
c. Triliner ：考虑了Mipmap，若贴图不开启mipmap 则两者几乎相同。

3.图片的tilling和scale (TRANSFORM_TEX 多图片可以看情况共用一个XXX_ST,节省寄存器）

a.问 同样的512x512贴图，为什么有的可以拉伸，有的必须要repeat模式呢？

    设置XXX_ST 在shader里面。
    每个properties 定义的贴图，在inspect界面都会有_ST，但是可以共用一个，减少寄存器使用。
     
    很简答的**：因为uv计算好之后乘以 XXX_ST.xy + XXX_ST.zw 本质就是把小的放大了，设置图片格式后才有对应的超边界情况。

4. mipmap采样层数计算相关

（202中也讲过）

1. 光栅化最小处理单元 ddx ddy 对应贴图采样。 获取。
2. log2N 的方式求mipmap的指定层数， 如1.2 则在两层lerp 在线性求个lerp 即可计算出，

4. 法线贴图，重点注意！！！

0.  unity 给法线初始化有个特殊的优化 即 "bump" {} ，贴图导入也要选择NormalMap ，才可以使用UnpackNormal等函数
    如_BumpMap("normal map",2D) = "bump" {}


1. 存储空间问题： 存储到了切线空间，更容易保存和压缩，如利用 sqrt(1-dot(xy,xy))反推出来z

2. 压缩范围问题, 贴图存储范围是[0-1],发现范围是[-1,1]所以要做个 unpack操作
    即 xy*2 -1 做个unpack
    通过还有bumpScale, 
        tangentNoraml.xy = tangentMormal.xy * bumpScale;
        //所以在反推z轴
        tangentNoraml.z  = sqrt(1-dot(tangentNoraml.xy,tangentMormal.xy));

（h42有个优化，去掉了顶点的副切线）

法线的值存储到贴图上也要考虑这个问题：*0.5 + 0.5 转化到[0-1]范围
https://answers.unity.com/questions/1698762/why-does-the-example-normal-shader-multiply-by-05.html

3. normal 法线 转tangent space 还是world space的问题。子和父空间变换问题
    通常转tangentSpace计算，因为ps中可以直接采样normal,直接结算。
    否则的话 需要在ps中做一次矩阵转化 ，将tangentNoram 转化到世界空间上。

4. defferd shading中 GBuffer的 简单的normal 压缩。
    Unity 中有一个DXT5nm的纹理格式，只用a通道和g通道，其他通道会被过滤掉的方式去对normal map 本身的四通道进行一个类似压缩。
    (在UnityCG的UnpackNormal() 函数中也可以看到展开方式)

5. ramp 贴图（做二次元常用的大块区域一个色块）

本质就是按照某种规则生成UV,然后按照这个UV去采样ramp贴图。 
x轴和y轴的值对应的贴图上的值都是一样的。

这里手撸了个 half-lambert diffuse的，即 0.5 * dot(normal,lightDir) + 0.5 来限制到[0,1]范围内
光线和法线夹角越小，值越大，使用ramp贴图越后面的值，从而过渡色块。

6. mask贴图（多张贴图采样问题）

1.多张贴图采样

可以根据需求，如normal /mask /abedo 共用一个uv的话（具体情况具体分析，即顶点携带几套贴图，按需用）
    只用 _MainTexture_ST ，在vert阶段算好一个uv
    ps 阶段 ，用相同的uv采样其他texture.(可以节省寄存器)
    （另外以 OpelGL 举例子的话，多个贴图，在bind的时候根据模型属性，比较灵活，不用想的那么死）

7 重要的矩阵变换（子空间和父空间的坐标轴变换）

(核心多读几遍这个 4.6.2) http://candycat1992.github.io/unity_shaders_book/unity_shaders_book_chapter_4.pdf (4.6.2 p73)

理解之后比较简单的一个推导是(包括顶点动画，之前项目的横版特效功能)：
1.  所有坐标轴都是相对于父物体的。 如x轴 = (1,0,0) 是在世界坐标轴下的，所有坐标轴都是嵌套的（骨骼动画树，比较明显）

2.  比如 世界坐标转tangent 坐标 （等于tangent 转世界的逆矩阵）只考虑x,y,z的话。
    
    求出x轴，y轴，z轴 在世界空间的表示( tangent,binormal ,normal) 
    (切线，副切线，法线顺序不能变，因为有cross,还要考虑tangent.w)
    
    worldNormal = UnityObjectToWorldNormal(v.normal);
    worldTangent  = UnityObjectToWorldDir(v.tangent.xyz);    
    worldBinormal = cross(worldNormal, worldTangent) * v.tangent.w; 

    切线转世界空间的三个坐标轴都已经有了
    （所以切线转世界，等于三个坐标轴按照列展开）
    （世界转切线等于其逆矩阵，等于三个坐标轴按行展开）

    tangentToWorldMatrix =  fixed3x3 ( worldTangent.x , worldBinormal.x , worldNormal.x,
                                      worldTangent.y , worldBinormal.y , worldNormal.y,
                                      worldTangent.z , worldBinormal.z . worldNormal.z)
                                      
    worldToTangent = fixed3x3(  worldTangent ,
                                worldBinormal,
                                worldNormal )

3 另外unity中可以定义宏去写通用代码，如 TANGENT_SPACE_ROTATION

第八章: 透明效果（渲染顺序，混合，Cull、ZWrite）

本质是和Framebuffer中已经渲染的值做个混合

1.两个概念：

a. 透明度测试 ：即 clip 函数，透明度小于某个阈值直接干掉该片元像素

b. 透明度混合：半透效果 Blend, ZWrite 命令和已经在FrameBuffer中颜色做混合

2. 渲染**：（即利用渲染顺序，先渲染，后混合）

先渲染不透明物体（结果存储到framebuffer中），后渲染半透物体，通过Blend 命令和之前的渲染结果做混合。（ZWrite 根据实际场景需要选择打开或关闭，如42半透在水里的效果）

a. unity中有个Queue的Tag ,可设置物体的渲染顺序 (索引越小越早被提前渲染)
b. 不透明物体渲染顺序不重要，因为会有early-z等各种优化，弊端是overdraw 都9012年了，不透明物体可以不考虑顺序
c. Queue Alphatest 、Transparent

https://docs.unity3d.com/ScriptReference/Rendering.RenderQueue.html

有个问题，水体半透渲染的问题。（水上水下的问题）

3. 半透明物体自身的遮挡相关。（本书第一次双pass实践，即第一个pass写深度 ColorMask 过滤掉其他，第二个pass 正常渲染）

单Pass ,alpha混合的结果

双pass。开启了深度写入效果。（注意的是：第一个pass写了深度，模型自身的透明效果看不到了）

ZWrite On
ColorMask 0

4. 混合命令（正片叠底，线性减淡，就是PhotoShop里面的图层混合）

0. 混合命令
    SrcXXX 指的是当前的颜色
    Dxx 指的是当前Framebuffer中已经有的颜色。

1.  在Unity中只使用Blend命令就行（除了Blend off 外）. 
    openGL中 要使用glEnable(GL_BLEND)来开启混合。

2.  混合是逐片元的操作。不可编程。高度可配置，
    （正片叠底等ps的乱七八糟的效果）
    
    常用的 如：
        Blend SrcAplha OneMinusSrcAlpha
        Blend One One

5.Cull 在透明度相关的注意

默认是会Cull Back的。不透明物体需要看情况 Cull off

1.透明度测试，要想显示clip 后的pixel ，要设置Cull off
2.透明度混合，如果要显示模型后面的，可以双pass ，
    pass 1 : Cull Front 
    pass 2:  Cull Back

第九章：光照（Forward , defferd 的处理）

Forward 光源的优化** Blend 双Pass ,LUT 衰减

渲染路径（LightMode）

1.三种渲染路径：

前向渲染路径(Forward Rendering)
延迟渲染路径：defferd rendering：新旧两种，目前主要是新的。
顶点照明(vertex rendering path)：已废弃。

前向渲染，延迟渲染：

言简意赅一个PPT 就懂了，本质是写引擎底层的**

（本质降低复杂度的m*n 的*操作） http://download.nvidia.com/developer/presentations/2004/6800_Leagues/6800_Leagues_Deferred_Shading.pdf

defferd shading的缺点（也可以通过其他方法规避掉）

a. 不支持真正意义上的AA(AA 本质是先模糊后采样，模糊即平均（求卷积) 多个点求平均即为模糊）
b. 半透明物体
c. MRT必须支持。

2 Forward Rendering:

a. 多种LightMode ForwardBase、ForwardAdd  (Defferd、ShadowCaster)
b.三种处理光照方法：逐顶点处理、逐像素处理、球谐函数（SH）处理。
    1. Light的property 的Render Mode 的 important 属性
    按照规则选择对应处理方式
    not important 会逐顶点或者SH处理。

    2. ForwardBase 只会在中最重要的那一个“ 平行光 ” 逐像素处理，
                剩下的4个逐顶点处理，剩下的其他按照SH处理。 
    （有个QualitySetting 中可以设置逐像素光源的数量）
    
    3.ForwardAdd会把剩下的import 光源按照逐偏片元去计算

大概总结如下图：

http://candycat1992.github.io/unity_shaders_book/unity_shaders_book_images.html

注意：

1. 编译指令可以优化正确效果（实验证明）：例如光照衰减系数(也被坑过)
#pragma multi_compile_fwdbase  
#pragma multi_compile_fwdadd

2. bass pass 左边是支持一些光照特性， 例如 BasePase 可以访问光照纹理（LightMap）
  （add pass 也可以通过统一衰减计算光照衰减和shadow 衰减）

3. 阴影，base pass 平行光默认支持阴影，additional 需要更多的宏才能打开阴影。!
    就是那个#pragma multi_compile_fwadd_fullshadows

4. 环境光 自发光都在base计算(add pass 本质是叠加混合)。

5. add pass 本质是混合，所以开启Blend ，一般使用Blend One One

3.Unity中的延迟渲染

新旧两种，旧版本只是不支持PBR相关计算。

双Pass,第一个渲染Gbuffer,第二个光照计算。
RT 有多种格式，RT0,RT1,RT2,RT3（normal 可以按照之前弥赛亚的方法压缩 R8G8A8 存储x,y，反推Z值）
可访问的变量 _LightColor,_LightMatrix0 (采样cookie 和光照衰减纹理（_LightTexture0）)

4. Unity中代码的实践。(本书的第二次双pass实践)

1.ForwardBase Pass :

环境光 ambient + 漫反射 diffuse + 高光 specular + 自发光
base pass中 处理场景最重要的平行光，且一定是平行光。
（如果没有平行光base pass中全黑光源处理）
所以base pass 都可以按照平行光的属性去计算，如衰减，_LightColor0 ，_WorldSpaceLightPos0

（如果没有平行光base pass中全黑光源处理，如下图，关了平行光源打开了点光源）

add pass ,去掉环境光,自发光的计算:

 a. 颜色仍然可以使用_LightColor0
 b.衰减 使用了LUT表,减少开根号，如games202的球形衰减
 (有个宏区分是平行光源，还是非平行光源：USING_DIRECTIONAL_lIGHT)

 具体计算方法：
 //先计算出来改wordpos在光照贴图上的uv
 fixed3 lightCoordUV = mul(unity_WorldToLight , fixed4( i.worldPos ,1.0)) 
 //光照贴图是Ramp 贴图，进行采样去计算衰减系数 atten 

 注意点乘是一个数字，所以下面用了 (dot (xx)).rr ，即取值两次。
 fixed atten = tex2D( _LightTexture0 ,dot(lightCoord,lightCoord).rr).UNITY_ATTEN_CHANNEL;

在FrameBuffer中的调试：

多个光源按照重要度做排序了，重要度是距离+远近 +衰减强度共同决定的。

注意的是： unity中的光照衰减。(离开光照范围内会发生突变，因为底层不会执行additional pass )

 a. 查找表的衰减，纹理贴图本身的大小格式会影响效率。_LightTexture0 
 有利有弊，快速， Look up table (LUT)

 若对光源使用cookie则使用： _LightTextureB0 
  (如下图，SPOT中计算衰减系数中有用到_LightTextureB0 )
   （另外也要注意下spot 和point 光源的处理）

第九章：光照第二部分（ shadow ）

两种shadow 方法：传统的lightmap + Screen Space Shadow Map (MRT 延迟渲染的一种技术)

1. Unity中的阴影原理。

1.games201中讲的双pass ，(即传统的阴影方法)。(本质都是对比z值)
    第一个pass ，把物体顶点信息变换到光源空间中， 输出到texture中。
        x,y分量采样，得到深度信息，两者比较
    第二个pass ，从摄像机角度出发，每一个点，和上面一样的变换矩阵A
    然后在shadowMap上采样，对比z值。
    （一些描述还要撸一遍）

2.unity中简单的shadow map 技术，即摄像机放到光源的位置，看不到的地方就是阴影
    a.前置条件（Light 要开启阴影）
    （soft shadow (pcf类似，Bias偏移，vssm 等概率sdf阴影),hard shadow ）
    
    b. ShadowCaster pass :
    额外的一类光照Pass : LightMode = ShadowCaster 的 pass，目标不是Frambuffer ，而是ZBuffer（更新深度值）
    
    传统光栅化本质就是渲染两个buffer (FrameBuffer + ZBuffer） 
    (可以用ForwardBase,ForwardAdd去做z深度计算,为了性能只用计算深度即可，Unity单独用了 ShadowCaster 的pass)
    (即引擎底层获取所有object的 ShadowCaster pass 去计算)

3. Unity5中更新的 ShadowMap:Screen Shadow Map (本质延迟渲染产物，需要MRT设备支持)
    （设置LightMode= "ShadowCaster"后）
    1.  两个纹理，光源处的深度纹理 +  摄像机的深度纹理
    2. 采样贴图的两个点比较Z值，Z值小的才能被光源看到 ，即没在阴影里面.
    3.如果想要在物体上显示阴影，需要在shader里面对阴影贴图进行采样处理。

引擎底层本质：如果一个 Light 开启阴影的话，
摄像机放在该Light的位置，遍历范围内的物体，
找到shader (FallBack)中LightMode = ShadowCaster的 模型，执行一次pass ，
输出到一个ZBuffer 贴图里。

2 阴影的代码实践（投射阴影、接收阴影）

1.物体投射阴影（引擎收集ShadowCater的pass）

a. Mesh 中的CastShadow + Receive Shadow  
需要shader中有 ShadowCaster的Pass （ 或者 FallBack的“VertexLit” ）

mesh 中投影有个two sided 双面投影属性。

2.物体接收阴影（ shader中的计算）（源码都在AutoLight.cginc）

a. v2f寄存器中定义 ： SHADOW_COORDS(X) 
    下一个可用寄存器的值！！ ,如上一个是TEXCOORD2 ,X 需要取3 

b. vertex shadow 中的计算
    TRANSFER_SHADOW(o)

c. ps 中采样LUT 采样衰减 
SHADOW_ATTENUATION()

注意：1 . v2f 中不能用vertex 关键字,否则会有下面的trace!，而且SV_POSITION 的名字一定要是pos

渲染分析，四个部分，先更新深度，然后绘制。

问unity的两种阴影技术，怎么在 Frame Debug上看呢？

待更

可以统一管理阴影和光照衰减。（源码也在AutoLight.cginc里面）

1. bass pass ,add pass 可以使用一样的光照计算和阴影计算代码了
(前面的SHADOW_COORDS 和 TRANSFER_SHADOW 定义和计算不变，只是计算衰减统一了)
UNITY_LIGHT_ATTENUATION （）函数统一计算，在base pass，和addition pass 光照计算代码可以统一。

2. 唯一的不同，需要将
#pragma multi_compile_fwdadd 替换成 
#pragma multi_compile_fwdadd_fullshadows
（前面光照那一个图片实际也显示了）

3. 透明度物体的阴影处理

分为两种情况：

1.透明度测试的情况。核心（clip函数）

a.需要合适的Fallback Fallback = "Transparent/Cutoff/VertexLit"才可以
b. Properties ： 需要增加一个_Cutoff 属性，才可以被正确的 Fallback 
c.正确的#pragma，否则会看不到部分效果！  #pragma multi_compile_fwdadd 、 #pragma multi_compile_fwbase 、 #pragma multi_compile_fwdadd_fullshadows


如果#pragma 不正常就会有问题。(坑了几十分钟)

透明度混合（实际用 dirty trick 的方法去处理的。） (对透明度混合来说，底层没计算阴影，所以需要用工程方法去做)

 1 显示阴影，
 Queue 不能设置成Transparent 否则显示不出来阴影(也是坑了几十分钟)
 (冯乐乐的方法是shader 里面TransParent 但是在场景里设置了Alphatest)

2 投射阴影：

Transparent/VertexLit 不行
可以Fallback  VertexLit 设置。

写shader的话统一光照和阴影的衰减方便一些，定义和计算都一样，只是ps里面换了个更统一的函数。

第十章：高级纹理（CubeMap/RT/procedural）

CubeMap (天空盒子 IBL 环境光贴图，立方体或者球，保存环境光贴图 )
RT (1. 相机生成，传给shader。 2 grab pass 带名字字符串/不带名字字符串)

ProduceDural Texture 程序化动态生成贴图

 1. new Texture2D() ,texture2d.SetPixel() ,texture2d.apply(),pass to shader。
 2. commandbuffers  ：控制camera和 light渲染阶段 camera render state Light render stage 
 3. Substance Designer

一立方体纹理

存储环境光的一种方式。即反射方向放一个面片，tex2D采值参与计算或lerp。 (pbr中 IBL 的类似irradiance map ，SH lightprobe 等存储环境光)

a. 凸面体采样周围环境光准确一些，（因为凹面体可能反射自身）。
b. unity立方体纹理常用的地方： 1：天空盒子。（skybox）
2：周围环境光反射。（ environment reflections ）
（此处主要是静态的用法，物体可以变位置，但是整个场景环境不能变，变的话需要重新烘焙,或者 Camere.RenderToCubemap实时更新RT，但是很耗 ,实时一般用 ReflectionProbes)

https://docs.unity3d.com/Manual/class-Cubemap.html

1 ：天空盒子（skybox）

a. SkyBox 对周围环境包围一个盒子，这个盒子六个面，Unity中整个世界都被包含了六个面。
b. 渲染顺序：在所有不透明物体渲染之后渲染的。
c. 背后的网格mesh: 是立方体网格或者球体网格（本质一个面片放了贴图）。
d. PBR中：可设置HDR的CubeMap。

可动态runtime/静态editor 创建，通常美术场景会弄好。静态效果好一些（废话） https://docs.unity3d.com/ScriptReference/Camera.RenderToCubemap.html

动态(runtime)： Camera.RenderToCubeMap() , CubeMap 需要勾选 readable 选项。
This function is mostly useful in the editor for "baking" static cubemaps of your Scene. 
If you want a realtime-updated cubemap, use RenderToCubemap variant that uses a RenderTexture with a cubemap dimension

Note also that ReflectionProbes are a more advanced way of performing realtime reflections

shader中常用的用法： reflect, refraction ,菲涅耳现象（一定角度全反射，菲涅耳曲线，夕阳下的地板）

a.反射（像是外面镀了一层金属一样）

(即人眼看到的方向 viewDir，通过反射公式（reflect）获得入射方向，然后入射方向在环境面片上采像素值)

当前简单的例子：

a. 在该位置烘焙一个CubeMap ，然后在shader中 samperCUBE , texCUBE 采样该CubeMap  
b.  CG中的reflect 方法求出 入射方向:  inCubeDir = reflect(-worldViewDir,worldNormal)  
c.  入射方向 采样环境光。 这里是CubeMap存储 ,CG里的 texCUBE(inCubeDir )。采样函数不需要归一化方向  
d.  此处的例子为： diffuse 颜色 和 reflection 颜色做线性 lerp 。

b. 折射 （当前简单折射）
现实中的折射通常发生两次/多次，一般图形学模拟都是一次，看起来是对的（实时渲染领域） (如皮肤的次表面散射，BSSRDF)

简单例子：反射定律。(refract 函数)

worldRefractDir = refract(-normalize( o.worldViewDir ) ,normalize(o.worldNormal),_RefractionRatio);

此处的例子为：反射方向做一个偏移，然后从cubemap或其他环境光容器中取值做lerp

c.菲涅耳现象 （如现实世界中的菲涅耳曲线）

两个模拟曲线的方程

1.Schlick 著名公式:(两个参数) F0 + (1-F0)(1-dot(v,n))^5
2.Empricial (三个控制参数，广泛公式) max( 0, min(1,bias + scale * pow( (1-dot(v,n)), power) ) )

在本书反射的例子里：反射是diffuse,reflection的线性lerp
而菲涅耳现象的这里用例相当于自动lerp。

反射混合： 
    fixed3 color = ambient + ( lerp(diffuse, reflection , _ReflectAmont) + specular) * atten;
菲涅耳混合：
    fixed3 fresnel = _FresnelScale + (1- _FresnelScale) * pow(1-dot( worldViewDir, normalDir ),5);
    fixed3 color = ambient + lerp(diffuse,reflection, saturate(fresnel));

书上还写了一个：菲涅耳和反射光相乘，叠加到漫反射上，可以模拟边缘光照

2 ：渲染纹理（RenderTexture RT） (Command buffer)

(即现代GPU允许将渲染内容，临时放在一个缓存里，允许CPU 去操作如 Defferd GBuffer )
个人理解：GPU和CPU的一种桥梁，如渲染一半临时存起来，然后在输入设置参数，GPU在读取缓存，然后draw

Unity专门定义了一种图片格式：render texture

Unity中两种方式RT

静态绑定：摄像机直接生成renderTexture,可以设置各种属性。

 第一种示例，在shader里面采样render texture 制作镜像效果。
 静态绑定好 场景，相机设置成Render Texture 模式

 (镜像，即水平翻转，水平翻转的特点是y不变，x=1-x)
 **：在shader中采样贴图的值，翻转x值 ，直接显示出来
 如下计算 o.uv 的值：
 o.uv.x = 1 - o.uv.x;

 给mesh的material 赋值该shader，该shader 采样该render texture

动态生成 :

 a.shader 中通过GrabPass 命令（无法控制大小，和屏幕大小一样， 注意抓取顺序）

 一种带字符串，一种不带字符串 ，可以pass 内部共用，
 带字符串只会抓取一次，不带每次都会抓取 ,properties 中的属性设置
 Queue 最好是保证所有不透明物体都已经渲染完了 在去抓取屏幕

 b. cpu端 c# OnRendeImage（后处理相关）函数生成的 Render Texture。

动态grab pass 正常会打断GPU的并行Job ，性能需要考虑

有点丑的毛玻璃效果，Grab pass

Command Buffers 扩展流水线
Unity 5, we settled on ability to create "list of things to do" buffers, which we dubbed "Command Buffers".

（本质是camera 和 light 在渲染阶段暴露出来了一些阶段事件）

(draw call( DrawIndexedPrimitive )也是一种command )
https://docs.unity3d.com/Manual/GraphicsCommandBuffers.html

detail and source code

https://blog.unity.com/technology/extending-unity-5-rendering-pipeline-command-buffers

3 ：程序纹理（Texture2D) (Substance Designer 包括U1的好多HDR贴图)

（无非就是程序可控性参数强一些，批量化资源）

整体比较简单:如下

texture =  new Texture2D()   
texture.SetPixel(x,y ,pixel)  
texture.apply()  
material.setTexture("xxx",texture)

现在3A标配：Substance Designer （hodini）

Substance Designer 简单教程
https://zhuanlan.zhihu.com/p/99362830

一个视频教程
https://assetstore.unity.com/packages/tools/utilities/substance-in-unity-110555

第十一章：画面动起来（两个有趣的数学：求UV,billboard 求旋转坐标）

在shader中使用时间的变量（_Time,_SinTime,_CosTime,unity_DeltaTime ）float4 类型
uv 求坐标比较简单。

billboard 求旋转坐标比较有趣：（同父子空间变换矩阵区分开）
简单理解就是点A原始空间的坐标位置 = 旋转后的位置。对于坐标系来说相对位置始终是不变的

1. 纹理动画（UV，序列帧）

若背景贴图是半透明：

a. 属性  
    { Queue = Transparent ,RenderType =Transparent IgnoreProjector = True}
    (RenderType多用于shader中的替换)
b.command 
    ZWrite off (不过这个通常看情况，因为就算深度写入了，如果渲染顺序比较晚，不透明问题已经渲染好了，加个Blend 即可)
    Blend SrcAlpha OneMinusScrAlpha

有一点需要注意的就是计算行列UV的算法：

比如 S = 4 * 行 + 列
所以先求出行，然后余数是列，即很简单的一个四行四列求坐标的问题。
令 S= time 
则 行 =S/4  ,列 = S - S*4

一个注意是：UV偏移中的y要用减法，
因为：Unity纹理坐标的竖直方向是从下到上逐渐增大的

示例2：两张贴图混合。两张贴图都在一个shader里面采样，可以完美的利用后面那张图的a通道进行混合。
（正好透明和不透明混合）

2.顶点动画（DisableBatching , shadow caster ）billborad 算法

1 水流效果
注意：顶点动画 tag 需要关闭batch
相同渲染状态的才能合批，所以UI的shader里面不能改变顶点位置，每一帧的渲染状态都变了。
(不关闭也可能会和其他底层合批了，效果就不对了)

2.顶点动画广告牌 bilboard 效果。
调整朝向到摄像机，旋转下坐标轴
核心算法：不管怎么旋转，顶点在模型空间的相对位置是不变的。
即原来的点A,原来的三个坐标轴 Ox,Oy,Oz, A = Ox * x + Oy * y + Oz * z
旋转后的点A,旋转后的三个坐标轴 Rx,Ry,Rz ,A = Rx * x + Ry * y + Rz * z

（三个轴构建坐标系，一个锚点，即该坐标轴绕着锚点旋转）
（法线（视口方向），up,right）

output.pos = mul(UNITY_MATRIX_P, 
            mul(UNITY_MATRIX_MV, float4(0.0, 0.0, 0.0, 1.0))
            + float4(input.vertex.x, input.vertex.y, 0.0, 0.0));

//核心**是将原点朝向相机后，原坐标空间的某个点，在新坐标 还在这个点上。

shadow gun 有一个优化，即构建新的坐标轴

float3  viewerLocal = mul(unity_WorldToObject, float4(_WorldSpaceCameraPos, 1));
float3  localDir = viewerLocal - float3(0,0,0);

localDir.y = lerp(0, localDir.y, _VerticalBillboarding);

localDir = normalize(localDir);

//正常情况下模型空间的up 是 0，1，0, 但是因为local dir 是正常算的，可能和up方向平行
//如果平行 ，则取右方向（当然右方向也可能重合，可以工程规避）

//另外这里还有个?选择语句
float3  upLocal = abs(localDir.y) > 0.999f ? float3(0, 0, 1) : float3(0, 1, 0);
float3  rightLocal = normalize(cross(localDir, upLocal));
upLocal = cross(rightLocal, localDir);

//在新坐标轴中还原x,y,z信息
float3  BBLocalPos = rightLocal * v.vertex.x + upLocal * v.vertex.y;
o.pos = mul(UNITY_MATRIX_MVP, float4(BBLocalPos, 1));

一个比较好的文章
https://zhuanlan.zhihu.com/p/29072964

ps 另外当前几个矩阵挺有意思的：

1 法线变换矩阵
2 父子空间变换矩阵
3 billboard的坐标轴变换

另外games103讲的 旋转矩阵本身就是正交矩阵，也挺清晰的

另外要注意的是：如果写了投射阴影，在LightMode = shadow caster 的pass中要做相同的顶点变换。

第十二章：屏幕后处理技术

(本质：一个覆盖全屏幕的面片，给这个面片赋值material(shader),然后render it)
https://github.com/QianMo/X-PostProcessing-Library （毛星云的一个炫酷的库）

默认是在透明和不透明渲染之后渲染RT src (ImageEffectOpaque属性可设置渲染顺序)
https://docs.unity3d.com/ScriptReference/ImageEffectOpaque.html
_MainTex 使用 RT src渲染出来的结果
MonoBehavior.OnRenderImage(src,dst)
Graphic.Blit(src,renderTexture dst ,material ,pass)
(pass 默认-1，表示会执行所有pass)

1 简单的概括

官网最新的三种后处理Pipeline :
https://docs.unity3d.com/Manual/PostProcessingOverview.html

核心API:

[RequireComponent(typeof(Camera))]  
MonoBehavior.OnRenderImage( scr , dst )  
material = new Material(shader); //_MainTex 默认为src
material.setXXX("_XXX",XXX)  
Graphic.blit(src,dst,material,Pass)

注意：

1. 可以省略shader中 Properties 变量的定义（只是inspector 界面看不到，shader中还可以照常定义使用）。  
2. src 纹理会传给shader中 _MainTex 的纹理属性。
3. pass 默认-1 会执行所有pass,否则只渲染指定pass (如高斯模糊等效果可以自定义渲染指定pass) 
4. ImageEffectOpaque  
5. shader中固定的ZTest Always ,ZWrite Off  Cull off

2. 代码调整亮度示例

调整屏幕亮度(代码公式和HDR颜色空间的亮度公式 )

fixed luminance = 0.2125 * renderTex.r + 0.7154 * renderTex.g + 0.0721 * renderTex.b;

如下蚊香的KM的HDR文章中 "色彩坐标空间变换" 关于亮度的说明

（冯乐乐的HDR系列也能找到:https://zhuanlan.zhihu.com/p/129095380）

1. TRANSFORM_TEX 使用不使用都可以(即需不需要缩放(xxx_ST) 控制)。

2. shader 中 Properties 中的声明可以去掉  （仅仅material面板显示调整参数）  
3. ZTest Always ,ZWrite Off  Cull off ,因为可以在c#端设置后处理Scr生成顺序，所以ZWrite off ，等固定参数

3.边缘检测（卷积，求平均的**）（half2 XXX_PixelSize:当前texture的像素点)

目的：主要是边缘找出线，给线加个颜色 可以根据情况做更多的图片原色混合。

梯度：数学上如从等高线来分析即下降最快的方向（即垂直方向）(103-第3讲**蛮不错的)
这里用的例子是：Sobel Gx,Gy 求两次卷积

卷积核心是求当前贴图采样点周围卷积核 范围内的贴图，取出其像素，求平均。

所以unity中的几个注意点吧：

0.  XXX_ST 控制的是缩放。
    XXX_TexelSize 是当前的纹素点
    (两者都要定义才能使用！否则会报错)

1. XXX_TexelSize 获取指定范围内若干个像素点的方法（需要定义下TexelSize）
    a. 当前像素点:          uv + _MainTex_TexelSize.xy  *  half2( 0 , 0);  
    b. 周围(-1,-1) 像素点： uv + _MainTex_TexelSize.xy  *  half2(-1,-1);
    c. 求周围以此类推

    d. 如图片大小是512x512的话，对应的XXX_TexelSize  就是 1/512,1/512 （0.001953）
    
2. struct v2f 中的 half2 uv[9] : TEXCOORD0 ;  //shander中定义了一个half2 数组方法。

uv[9]的定义和计算图片周围像素的方法

其他计算就是一些lerp的插值，工程的方法了

half edge = sobel(i); //求出卷积核的平均值
fixed4 oriColor = tex2D(_MainTex,i.uv[4]); //采样原始贴图

fixed4 withEdgeColor = lerp( _EdgeColor , oriColor , edge); //边缘沟边（一般边缘检测的目的是边缘加一圈线）
fixed4 onlyEdgeColor = lerp( _EdgeColor , _BackgroundColor,edge); //如果想实现显示沟边，可以加个和背景色混合  

return lerp(withEdgeColor , onlyEdgeColor ,_EdgeOnly); //和背景做lerp

如下图：如果想去掉背景色（图片原来的颜色），可以在做个混合。

若只做边缘色混合

一些实际工程效果可以根据情况来弄

4.高斯模糊（双pass， N*N -> N+N ）（DownSamle）(CGINCLUDE) (USEPASS )

双pass 时间复杂度是N*N ，水平一遍pass->存起来->竖直一遍pass 复杂度 n+n
（核心是操作一个buffer，对buffer进行操作，降低复杂度）

a. 双pass 高斯模糊叠加起来

//down sample 例子
int rtW = src.width / downSample; 
int rtH = src.height / downSample;

RenderTexture buffer = RenderTexture.GetTemporary(rtW,rtH,0); //
buffer.filterMode = FilterMode.Bilinear

Graphic.blit(src,buffer,mat ,0) //执行pass 0
Graphic.blit(buffer,dst,mat ,1) //执行pass 1

RenderTexture.repleaseTempory(buffer) //释放buffer

b. pass name ,use pass

pass
{
    Name "GAUSSIAN_BLUR_VERTICAL"

    CGPROGRAM
    #pragma vertex vertexBlurVertical
    #pragma fragment fragBlur
    ENDCG
}

可以直接使用pass,根据所处的pass 定义位置，决定其 pass index

UsePass "Unity Shader book/Chapter12/GaussionShader/GAUSSIAN_BLUR_VERTICAL"

c. CGINCLUDE 定义和使用

CGINCLUDE  
    xxx
ENDCG

5. Bloom效果（第一次把buffer作为texture的属性传给shader）

bloom 本质（和hdr的区分）：（buffer 混合注意原点是左上角还是右下角需要考虑）

1.提取亮度部分 生成buffer图片
2.将buffer图片做模糊或者缩放和已有图片做混合（图片原点左上角或者右下角问题）

高斯模糊是横竖两遍对全图做模糊， Bloom横竖两遍提取出高亮部分，模糊，混合。

核心API clamp：https://developer.download.nvidia.cn/cg/clamp.html

saturate  ：限制到0-1范围内 ,clamp限制到a-b范围内
clamp (float4 ,float4 min,float4 max)/clamp (float4 ,float min,float max) ，如 clamp(x,0,1)限制到0,1范围内

具体执行步骤为：

1.生成一张图片，干掉某个部分，（简单粗暴可以用alpha test的 clip函数）  这里用的是clamp函数
2.shader中提取一部分高于指定亮度的部分，做一个高斯模糊
    a：提取出来亮度超过某个值的
        两张贴图混合，需要考虑DX/OpenGL 左上角右下角 的处理
        程序动态生产的贴图需要考虑。
    b. 前1步骤生成的图片(rt里面放在一个buffer里面)，做一遍高斯模糊
        （水平pass, 竖直pass）
    c. 融合前两步的pass

UsePass 中的 pass 名字必须是大写，因为底层会把所有pass名称都转为大写的。

补充一个项目内部的使用

之前开发流程用到的bloom流程

https://zhuanlan.zhihu.com/p/125744132 GDC 2003的一个关于bloom的分享，实现某种Bloom

6.运动模糊1.0（比较简单的方法，即RenderTexture.MarkRestoreExpected）

核心API： RenderTexture.MarkRestoreExpected

(重置过期，即贴图不会重置就不会清除原本的rt了)

（即如API所述，累计缓存，不清除即可，但是有消耗）

AvatarGuo/shader-book-learn