test/tint/buffer/uniform/std140/unnested/mat2x2_f16/to_private.wgsl.expected.dxc.hlsl - dawn - Git at Google

 cbuffer cbuffer_u : register(b0, space0) {
   uint4 u[1];
 };
 static matrix<float16_t, 2, 2> p = matrix<float16_t, 2, 2>(float16_t(0.0h), float16_t(0.0h), float16_t(0.0h), float16_t(0.0h));

 matrix<float16_t, 2, 2> u_load(uint offset) {
   const uint scalar_offset = ((offset + 0u)) / 4;
   uint ubo_load = u[scalar_offset / 4][scalar_offset % 4];
   const uint scalar_offset_1 = ((offset + 4u)) / 4;
   uint ubo_load_1 = u[scalar_offset_1 / 4][scalar_offset_1 % 4];
   return matrix<float16_t, 2, 2>(vector<float16_t, 2>(float16_t(f16tof32(ubo_load & 0xFFFF)), float16_t(f16tof32(ubo_load >> 16))), vector<float16_t, 2>(float16_t(f16tof32(ubo_load_1 & 0xFFFF)), float16_t(f16tof32(ubo_load_1 >> 16))));
 }

 [numthreads(1, 1, 1)]
 void f() {
   p = u_load(0u);
   uint ubo_load_2 = u[0].x;
   p[1] = vector<float16_t, 2>(float16_t(f16tof32(ubo_load_2 & 0xFFFF)), float16_t(f16tof32(ubo_load_2 >> 16)));
   uint ubo_load_3 = u[0].x;
   p[1] = vector<float16_t, 2>(float16_t(f16tof32(ubo_load_3 & 0xFFFF)), float16_t(f16tof32(ubo_load_3 >> 16))).yx;
   p[0][1] = float16_t(f16tof32(((u[0].y) & 0xFFFF)));
   return;
 }
	cbuffer cbuffer_u : register(b0, space0) {
	uint4 u[1];
	};
	static matrix<float16_t, 2, 2> p = matrix<float16_t, 2, 2>(float16_t(0.0h), float16_t(0.0h), float16_t(0.0h), float16_t(0.0h));

	matrix<float16_t, 2, 2> u_load(uint offset) {
	const uint scalar_offset = ((offset + 0u)) / 4;
	uint ubo_load = u[scalar_offset / 4][scalar_offset % 4];
	const uint scalar_offset_1 = ((offset + 4u)) / 4;
	uint ubo_load_1 = u[scalar_offset_1 / 4][scalar_offset_1 % 4];
	return matrix<float16_t, 2, 2>(vector<float16_t, 2>(float16_t(f16tof32(ubo_load & 0xFFFF)), float16_t(f16tof32(ubo_load >> 16))), vector<float16_t, 2>(float16_t(f16tof32(ubo_load_1 & 0xFFFF)), float16_t(f16tof32(ubo_load_1 >> 16))));
	}

	[numthreads(1, 1, 1)]
	void f() {
	p = u_load(0u);
	uint ubo_load_2 = u[0].x;
	p[1] = vector<float16_t, 2>(float16_t(f16tof32(ubo_load_2 & 0xFFFF)), float16_t(f16tof32(ubo_load_2 >> 16)));
	uint ubo_load_3 = u[0].x;
	p[1] = vector<float16_t, 2>(float16_t(f16tof32(ubo_load_3 & 0xFFFF)), float16_t(f16tof32(ubo_load_3 >> 16))).yx;
	p[0][1] = float16_t(f16tof32(((u[0].y) & 0xFFFF)));
	return;
	}