前言
好久不见!今天使用Unity Compute Shader来实现一个大量正方体的随机颜色赋值,作为我的Unity ComputeShader入门练习。这个练习可以说很经典了。
Compute Shader的简单介绍
使用Compute Shader可以让GPU参与任意数据类型的运算,以此减小CPU的运算负荷。总所周知GPU十分擅长执行大量并行的简单算法,所以将此类运算交给GPU将能有效提升项目运行效率。Unity的Compute Shader使用的是HLSL书写。 你可以将Compute Shader当做C#脚本的一种延申,Compute Shader需要通过脚本来告诉它该什么时候执行以及如何执行。
Compute Shader在Editor中
你可以在Create -> Shader -> Compute Shader新建一个Compute Shader。
Unity Compute Shader代码原理简介
#pragma kernel CSMain
RWTexture2D<float4> Result;
[numthreads(8,8,1)]
void CSMain (uint3 id : SV_DispatchThreadID)
{
Result[id.xy] = float4(id.x & id.y, (id.x & 15)/15.0, (id.y & 15)/15.0, 0.0);
}
这就是Compute Shader默认代码,你在里面先声明Compute Shader运行时(从C#里面Dispatch时)要调用的函数(#pragma kernel CSMain),kernel可以有很多个。用于和C#脚本传递数据的参数(这里是RWTexture2D,要处理任意数据一般使用StructuredBuffer类型),以及函数本身的定义(在这里他产生了一堆float4的数据,其实就是一张图),函数参数括号里面的东西是线程的ID。 此外,你还需要调整numthreads里的参数,这个玩意指定了Compute Shader会生成的线程数,需要根据情况设置,具体的我也不懂了,先保持默认。 函数内部的运算要尽可能简单,GPU不能很好的执行分支操作,所以也不要在里面做if之类的操作。 如果你对细节感兴趣,链接这篇老外写的文章能解释更多。
Getting Started With Compute Shaders In Unity 知乎中文翻译版: Unity3d | 浅谈 Compute Shader 简书大佬教程 Unity Compute Shader入门初探
CPU对照组
为了体现Compute Shader的作用,我们先实现一个单纯使用CPU的对照组方法。
using System;
using System.Collections;
using System.Collections.Generic;
using UnityEngine;
struct Cube
{
public Vector3 position;
public Color color;
}
public class ComputeShaderDemo : MonoBehaviour
{
public int repetions;
public List<GameObject> objects;
public int count = 50;
private void Start()
{
CreateCubes();
}
private void CreateCubes()
{
for (int i = 0; i < count; i++)
{
for (int j = 0; j < count; j++)
{
var go = GameObject.CreatePrimitive(PrimitiveType.Cube);
go.transform.position = new Vector3(i, j, 0);
Color color = UnityEngine.Random.ColorHSV();
go.GetComponent<MeshRenderer>().material.SetColor("_Color", color);
objects.Add(go);
go.transform.SetParent(this.transform);
}
}
}
[ContextMenu("OnRandomize CPU")]
public void OnRandomizeCPU()
{
for (int i = 0; i < repetions; i++)
{
for (int c = 0; c < objects.Count; c++)
{
GameObject obj = objects[c];
obj.transform.position = new Vector3(obj.transform.position.x, obj.transform.position.y, UnityEngine.Random.Range(-0.1f, 0.1f));
obj.GetComponent<MeshRenderer>().material.SetColor("_Color", UnityEngine.Random.ColorHSV());
}
}
}
上述为C#脚本,干的事情就是给一堆正方体对象随机赋予颜色和y轴坐标,然后重复若干次,目的就是为了模拟需要大量运行的简单运算。 在50 * 50个正方体,执行1000次时,我的CPU运行起来就已经相当卡了,10000次重复直接卡死。
运用Compute Shader解决问题
现在我们将运用Compute Shader调用GPU来进行运算。
#pragma kernel CSMain
struct Cube {
float3 position;
float4 color;
};
RWStructuredBuffer<Cube> cubes;
float repetions;
float resolution;
float rand(float2 co)
{
return(frac(sin(dot(co.xy, float2(12.9898, 78.233))) * 43758.5453)) * 1;
}
[numthreads(10,1,1)]
void CSMain (uint3 id : SV_DispatchThreadID)
{
float xPos = id.x / resolution;
Cube cube = cubes[id.x];
for (int i = 0; i < repetions; i++)
{
float zPos = rand(float2(xPos, cube.position.z));
cube.position.z = zPos;
float r = rand(float2(cube.color.r, cube.color.g));
float g = rand(float2(cube.color.g, cube.color.b));
float b = rand(float2(cube.color.b, cube.color.r));
cube.color = float4(r, g, b, 1.0);
}
cubes[id.x] = cube;
}
这是用来做这件事的Compute Shader代码,基本上干的就是OnRandomizeCPU的事情,当然,数据要从C#脚本中传递给Compute Shader,Compute Shader拿数据做完运算后再将运算结果返回给C#脚本,脚本最后再运用这些结果。
[ContextMenu("OnRandomize GPU")]
public void OnRandomizeGPU()
{
int colorSize = sizeof(float) * 4;
int vector3Size = sizeof(float) * 3;
int totalSize = colorSize + vector3Size;
ComputeBuffer cubeBuffer = new ComputeBuffer(data.Length, totalSize);
cubeBuffer.SetData(data);
computeShader.SetBuffer(0, "cubes", cubeBuffer);
computeShader.SetFloat("resolution", data.Length);
computeShader.SetFloat("repetions", repetions);
computeShader.Dispatch(0, data.Length / 10, 1, 1);
cubeBuffer.GetData(data);
for (int i = 0; i < objects.Count; i++)
{
GameObject obj = objects[i];
Cube cube = data[i];
obj.transform.position = cube.position;
obj.GetComponent<MeshRenderer>().material.SetColor("_Color", cube.color);
}
cubeBuffer.Dispose();
}
}
这是C#脚本,干的就是我刚刚说的,传递数据给Compute Shader,运行Shader,拿到结果并将结果赋值给对象。
效果
效果可以说非常好了,10000次重复都是秒完成,当次数到100万次时才出现了一点点延迟,Compute Shader的性能瓶颈往往来自数据传递过程。
|