文KRIFE齐的博客

发表于2025-11-06|Unity就业路线学习笔记UP——Unity性能优化笔记UPL9——增强渲染性能

UPL9-5——减少曲面细分曲面细分在图形渲染中，曲面细分是把一个较粗的网格（低多边形）自动拆分成更多的小三角形，形成更平滑的几何表面比如：一张四边形面，可以被细分成 4、16、64 个小面片这样视觉上更圆润，但会大幅增加顶点数量和三角形数量一般通过曲面细分着色器来实现这样的功能，在对美术表现要求高的游戏中才会使用的技术当你有以下这些需求时，才会考虑使用曲面细分着色器高端画质、近景特写需要真实几何表现而不是靠法线带来的视觉假象大规模环境曲面细分对 GPU 的性能影响在GPU渲染管线中，曲面细分会增加多种负担顶点处理压力增加每细分一次，顶点数成倍增长 GPU 顶点着色器、几何阶段需要处理更多数据片元（像素）处理间接增加更多的三角形，意味着更密集的覆盖像素，意味着片元着色器嗲用次数会上升内存带宽开销上升顶点数据（坐标、法线、UV、权重等）需要传输，细分越多，显存到 GPU 核心的数据带宽消耗越大缓存效率下降 GPU...

UPL9-4——遮挡剔除

发表于2025-11-04|Unity就业路线学习笔记UP——Unity性能优化笔记UPL9——增强渲染性能

UPL9-4——遮挡剔除遮挡剔除 Unity 默认只会进行视锥剔除，即摄像机视锥外的物体不会渲染，但是在视锥内，被其他物体挡住的东西仍然会被渲染，而遮挡剔除就是用来弥补这一点的遮挡剔除（Occlusion Culling）的作用：让被遮挡，不可见的物体不再进入渲染管线减少 DrawCall，顶点处理，像素填充等开销提升性能，尤其是在室内场景，城市场景，森林这种遮挡很多的环境比如：玩家在一个房间里，外面的街道模型其实完全看不到，没有必要渲染他们如果没有遮挡剔除，这些在摄像机视锥范围内的对象依然会被送进 GPU 渲染，浪费性能说人话：遮挡剔除弥补了视锥剔除的局限性，让 Unity 可以剔除那些在摄像机视锥内，但是被挡住的对象，这样可以节约 GPU 渲染性能遮挡剔除的具体内容可见：遮挡剔除 - Unity 手册遮挡剔除的作用设置需要使用遮挡剔除的对象为遮挡静态对象会遮挡别人的物体（比如建筑、墙体、山体等）——> 设置为 Occluder Static（静态遮挡物）可能被遮挡的物体（比如角色、家具、树木等）——> 设置为...

UPL9-3——LOD

发表于2025-11-04|Unity就业路线学习笔记UP——Unity性能优化笔记UPL9——增强渲染性能

UPL9-3——LOD LOD LOD（Level of Detail，细节层次） LOD 的核心目的：减少远处物体的几何复杂度（顶点，三角形数量），降低 GPU 顶点处理压力，让场景在视觉上几乎无损的前提下提升性能具体好处包括：提升性能远处的物体在屏幕上只占很少像素，用高模浪费算力，LOD 可以替换成低模，让 GPU 处理更轻松节省显存和带宽高模 → 低模 → Billboard 加载和显存压力逐步减轻兼顾画质与性能近处依旧报错高质量，远处用简化版本，玩家几乎察觉不到说人话：LOD 的主要作用就是动态平衡画质和性能 LOD 的使用 Unity 提供了 LOD Group 组件来管理 LOD 使用步骤：准备好模型让美术输出同一个物体的多个精度版本模型（如 LOD0、LOD1、LOD2）或者使用 Mesh Simplification（网格简化算法）工具自动生成低精度模型创建一个空物体，添加 LOD Group 组件，将多个精度版本模型作为其子对象对 LOD Group...

UPL9-2——降低几何复杂度

发表于2025-11-04|Unity就业路线学习笔记UP——Unity性能优化笔记UPL9——增强渲染性能

UPL9-2——降低几何复杂度为什么要降低几何复杂度降低几何复杂度的主要目的是减轻 GPU 与 CPU 在几何处理阶段的负担减轻内存带宽压力和显存压力等等从GPU角度 GPU 渲染管线的第一步就是处理顶点，如果场景里有几百万甚至上千万个顶点，GPU 必须逐个变换（模型矩阵、光照计算、蒙皮等），负担会极大，可能带来：帧率下降移动端功耗升高、发热严重顶点带宽不足导致 GPU 卡顿等等因此，降低几何复杂度，相当于直接减少了顶点着色器的工作量从 CPU 角度每个网格渲染之前，CPU 要把网格数据提交给 GPU（DrawCall），如果模型过于复杂（高面数、网格碎片多），则会导致 CPU 消耗在渲染准备工作上，挤占逻辑、物理计算上的时间因此，降低几何复杂度，可以间接减少 CPU...

UPL9-1——GPU Skinning

发表于2025-11-04|Unity就业路线学习笔记UP——Unity性能优化笔记UPL9——增强渲染性能

UPL9-1——GPU Skinning GPU Skinning GPU Skinning（GPU 蒙皮）是 Unity 中提供给我们的一个功能开关可以在 Project Settings ——> Player ——> Other Settings ——> GPU Skinning 中进行设置它的设置决定了角色动画（带 Skinned Mesh Renderer 蒙皮网格渲染器的对象）里顶点随骨骼运动的变形计算在 GPU 还是 CPU 中进行 GPU Skinning 的三种模式 CPU 所有蒙皮运算都在 CPU 中完成，完成后，CPU 把最终的顶点位置传给 GPU 这种方式虽然兼容性好，但是 CPU 压力很大，大量角色存在时可能导致 CPU 成为瓶颈 GPU CPU 只算部分内容，比如骨骼矩阵，顶点变形由 GPU 顶点着色器来做这种方式可以大幅减少 CPU 运算和数据传输 GPU 会对每个模型单独计算蒙皮，如果 DrawCall 较高，会带来一定开销 GPU (Batched) GPU Skinning 的批处理版本，Unity...

UPL9——增强渲染性能

发表于2025-11-04|Unity就业路线学习笔记UP——Unity性能优化笔记

UPL9——增强渲染性能 GPU Skinning 降低几何复杂度 LOD 遮挡剔除减少曲面细分优化 UI 系统更多的 Canvas 组件禁用 Raycast Target 禁用 Canvas（画布）组件，避免使用 Animator 为世界空间画布定义摄像机不要使用透明度组件隐藏组件优化 ScrollRect 使用 UIText 进行全屏交互更多方案优化粒子系统着色器优化降低计算量减少采样开销降低填充率压力阴影质量光照烘焙光照探针反射探针善用 GPU 并行特性 Compute Shader 优化移动端渲染性能 ‍

UPL8——影响 GPU 性能的主要因素

发表于2025-11-03|Unity就业路线学习笔记UP——Unity性能优化笔记

UPL8——影响 GPU 性能的主要因素影响 GPU 性能的主要因素在开发时注意这些优化点，可以减少性能问题的发生当发生性能问题时先定位问题，再针对性解决问题结合性能分析窗口、帧调试窗口来分析定位问题，不要凭感觉填充率填充率（Fill Rate）是 GPU 的一个性能指标，是最经典的衡量图形处理器片元阶段吞吐能力的指标之一表示 GPU 在单位时间内能处理（写入）的像素数量一般用像素 / 秒 (Pixels per Second，GPixel/s = 十亿像素/秒，MPixel/s = 百万像素每秒) 来衡量相当于填充率决定了每帧能处理多少个像素假设 RTX4090 GPU 的理论填充率为 450 Gpixel/s = 4500 亿像素/s 一个 60 FPS的游戏，每帧该 GPU 理论上能处理 4500亿 / 60 = 75亿像素即每帧可以处理 75 亿个片元如果是一个4K显示器 3840 × 2160 ≈ 829 万个像素每个像素只处理一次的话理论上来说，RTX4090 可以每帧处理 4K 画面 75亿 / 829万 ≈...

UPL7-8——碰撞检测相关合理利用碰撞层矩阵设置想要减小碰撞检测带来的开销，根本上就是要减少碰撞候选对的产生所谓的候选对就是指，在广义检测 / 粗检测（Broadphase）阶段得到的一组可能相交的物体对产生的候选对越多，在下一步进行狭义检测 / 精检测（Narrowphase）的工作量就越大，CPU 压力就越大因此，我们应该尽量避免无意义的碰撞产生，最有效直接的方式就是利用碰撞层矩阵让无关层（相互之间不需要发生碰撞检测的层）全部互斥，这样可以大幅减少候选对的产生，从而达到优化性能的目的利用 Physics 公共类 API 单独忽略物体碰撞有时可能通过碰撞层矩阵不太好进行碰撞忽略，比如处于某两层中的物体，并不是所有都不需要碰撞检测，而只希望个别忽略举例：角色丢出的手榴弹，不要和自己身上的 Collider 撞到近战武器的 Collider 要忽略和角色自身的 Collider 的碰撞等等如果只是想控制个别对象之间的碰撞检测忽略，我们可以利用物理公共类中的忽略碰撞方法 1234class Physics{ public...

UPL7-7——刚体相关知识回顾：碰撞体、刚体、运动学刚体、碰撞检测类型详细可见：U1L13——物理系统碰撞体相关碰撞体：对于不移动的物体，但是需要和物理对象产生碰撞的物体只需要加碰撞体组件，因为它不需要有受力表现，只希望阻挡其他物理对象我们一般称只带有碰撞器的对象为静态碰撞体刚体：要移动，并且需要有物理受力表现的物体，需要添加碰撞器和刚体我们一般称带刚体和碰撞器的对象为动态碰撞体运动学刚体：刚体上勾选了是运动学的（Is Kinematic）选项的刚体称为运动学刚体它的作用类似静态碰撞体的效果，即与其它对象产生碰撞时，自身不会有力作用表现好处是我们可以利用刚体相关 API 让其移动，由于运动学刚体对象不会对撞击它的对象做出物理反应它在运行时会简单的把其他动态碰撞器推开，因此，有时我们会在某些类型的游戏中将玩家对象设置为运动学刚体碰撞检测类型（Collision Detection）： Discrete（离散检测）原理：每个物体只在固定物理步长的采样点...

UPL7-6——避免复杂碰撞体类型

发表于2025-10-11|Unity就业路线学习笔记UP——Unity性能优化笔记UPL7——物理引擎相关

UPL7-6——避免复杂碰撞体类型碰撞器性能消耗排行如果我们将 Unity 提供给我们的自带碰撞器进行性能消耗排行，那么得到的结果是这样的（前面的消耗更低，后面的消耗更高）球体（Sphere Collider）最省性能，因为数学公式简单，适合用于子弹、角色感知范围、球类等胶囊体（Capsule Collider）稍比球复杂，但依旧是数学公式计算，常用于角色、NPC 碰撞体盒体（Box Collide）稍微复杂一点，但仍然是矩阵与边界检测，性能非常高，场景里使用最广泛，比如地板、墙壁、方形物体组合碰撞体（由多个原始碰撞体（Sphere、Box、Capsule）拼接）开销比单一原始体略高，但仍远低于网格碰撞器(Mesh Collider) 轮子碰撞体（WheelCollider）它的本质不是网格求交，主要开销来自于垂直射线检测和摩擦、扭矩、制动相关的计算地形碰撞体（Terrain Collider）专门为地形系统优化的特殊碰撞器，内部使用高度图数据，而不是逐三角面，在大规模场景中比 Mesh Collider...