以追溯方式,Direct3D 版本 11 要求在 Direct3D 版本 10 DDI 函数上以 pfnCalcPrivate 开头的驱动程序函数为自由线程。 此追溯要求与 Direct3D 版本 11 DDI 的行为匹配,以始终要求 pfnCalcPrivate* 和 pfnCalcDeferredContextHandleSize 函数成为自由线程,即使驱动程序指示它不支持 DDI 线程处理也是如此。
1. 核心要求
强制自由线程的函数列表
无论驱动程序是否声明支持 D3D11DDICAPS_FREETHREADED,以下函数 必须 实现为线程安全:
- pfnCalcPrivateResourceSize
- pfnCalcPrivateOpenedResourceSize
- pfnCalcPrivateShaderResourceViewSize
- pfnCalcPrivateRenderTargetViewSize
- pfnCalcPrivateDepthStencilViewSize
- pfnCalcPrivateElementLayoutSize
- pfnCalcPrivateBlendStateSize
- pfnCalcPrivateDepthStencilStateSize
- pfnCalcPrivateRasterizerStateSize
- pfnCalcPrivateSamplerSize
- pfnCalcPrivateQuerySize
- pfnCalcPrivateDeferredContextHandleSize (D3D11新增)
线程安全级别
安全要求 | 描述 |
---|---|
无竞态条件 | 多线程并发调用时,函数内部状态(如全局缓存)必须保持一致。 |
无阻塞操作 | 避免使用可能引发线程挂起的操作(如阻塞式内核调用)。 |
原子性保证 | 对共享数据的修改需通过原子操作或锁保护。 |
2. 驱动实现规范
基础线程安全模板
// 全局锁保护示例(适用于所有pfnCalcPrivate*函数)
CRITICAL_SECTION g_CalcPrivateLock;
SIZE_T APIENTRY pfnCalcPrivateResourceSize(
D3D10DDI_HDEVICE hDevice,
const D3D10DDIARG_CREATERESOURCE* pCreateResource
) {
EnterCriticalSection(&g_CalcPrivateLock);
// 线程安全计算逻辑
SIZE_T size = CalculateResourceSize(pCreateResource);
LeaveCriticalSection(&g_CalcPrivateLock);
return size;
}
无锁优化方案(推荐)
若计算逻辑无共享状态,可完全避免锁开销:
SIZE_T APIENTRY pfnCalcPrivateShaderSize(
D3D10DDI_HDEVICE hDevice,
const UINT* pCode,
const D3D11DDIARG_TESSELLATION_HS_DESC* pTessDesc
) {
// 纯函数式计算,无共享数据
return pTessDesc ? sizeof(HS_DRIVER_DATA) : sizeof(SHADER_DRIVER_DATA);
}
3. 与 D3D11 DDI 的协同要求
函数表一致性
- D3D10 DDI 函数表:即使驱动未声明 D3D11DDICAPS_FREETHREADED,pfnCalcPrivate* 仍须线程安全。
- D3D11 DDI 函数表:所有 CalcPrivate* 函数默认要求自由线程,无论硬件能力如何。
错误处理
若驱动未满足线程安全要求:
- 调试层检测:启用 D3D11_CREATE_DEVICE_DEBUG 时,运行时可能注入线程竞争测试。
- 潜在后果:多线程调用下资源尺寸计算错误或崩溃。
4. 性能优化建议
线程局部缓存
对频繁计算的类型(如常规模板状态对象),使用线程本地存储(TLS)缓存结果:
thread_local std::unordered_map<size_t, SIZE_T> g_SizeCache;
SIZE_T APIENTRY pfnCalcPrivateBlendStateSize(
D3D10DDI_HDEVICE hDevice,
const D3D10_DDI_BLEND_DESC* pDesc
) {
size_t hash = ComputeBlendDescHash(pDesc);
if (g_SizeCache.count(hash)) {
return g_SizeCache[hash];
}
SIZE_T size = sizeof(BLEND_STATE_DRIVER_DATA);
g_SizeCache[hash] = size;
return size;
}
静态预计算
对固定大小的资源(如查询对象),直接返回常量:
SIZE_T APIENTRY pfnCalcPrivateQuerySize(
D3D10DDI_HDEVICE hDevice,
const D3D10DDIARG_CREATEQUERY* pCreateQuery
) {
return sizeof(QUERY_DRIVER_DATA); // 所有查询类型大小相同
}
5. 调试与验证
多线程压力测试
- 自定义测试工具:创建多个线程并发调用 pfnCalcPrivate* 函数,验证结果一致性。
- PIX 捕获:检查线程冲突导致的资源创建失败或内存损坏。
调试层警告
若检测到非线程安全行为,调试层可能输出:
[D3D11 WARNING] Thread safety violation in pfnCalcPrivateResourceSize.
Concurrent calls detected without synchronization.
6. 向后兼容性
- D3D10 驱动:若未升级到D3D11 DDI,仍需通过Windows Update分发线程安全补丁。
- 混合模式驱动:同时支持D3D10/D3D11时,共用同一线程安全实现。
总结
- 强制线程安全:所有 pfnCalcPrivate* 函数必须无条件支持多线程调用,与驱动能力声明无关。
- 轻量级实现:优先采用无锁设计或细粒度锁,避免性能损耗。
- 调试支持:利用工具链验证线程安全性,确保兼容性。