GoLang Filepath.Walk遍历优化

原生标准库在文件量过大时效率和内存均表现不好

1400万文件遍历Filepath.Walk

1400万文件重写直接调用windows api并处理细节

结论

1400万文件遍历时对比

对比条目 filepath.walk windows api并触发黑科技
运行时间 710秒 22秒
内存占用 480M 38M

关键代码

go 复制代码
//超级快的文件遍历
func FindFileWin(dir string, callbackfunc MyFindFileCallBack) {

	dir = dir + `\`

	finstruct := win.WIN32_FIND_DATAW{}
	handle := win.FindFirstFileW(dir+`*`, &finstruct)
	if win.IsInvalidHandle(handle) {

		for {
			//文件夾
			if (finstruct.DwFileAttributes & win.FILE_ATTRIBUTE_DIRECTORY) != 0 {
				if (finstruct.CfileNameGo != "..") && (finstruct.CfileNameGo != ".") {
					FindFileWin(dir+finstruct.CfileNameGo, callbackfunc)
				}
			} else {
				callbackfunc(dir + finstruct.CfileNameGo)
			}
			if win.FindNextFileW(handle, &finstruct) == 0 {
				break
			}
		}
	}
}
go 复制代码
var (
	kernel32           = syscall.NewLazyDLL("Kernel32.dll")
	procCreateFileW    = kernel32.NewProc("CreateFileW")
	procOpenEventW     = kernel32.NewProc("OpenEventW")
	procSetEvent       = kernel32.NewProc("SetEvent")
	procFindFirstFileW = kernel32.NewProc("FindFirstFileW")
	procFindNextFileW  = kernel32.NewProc("FindNextFileW")

	//procCreateFileA = kernel32.NewProc("CreateFileA")
)

func FindFirstFileW(fileName string, lpFindFileData *WIN32_FIND_DATAW) HANDLE {
	strname := unsafe.Pointer(syscall.StringToUTF16Ptr(fileName))
	handle, _, _ := procFindFirstFileW.Call(
		uintptr(strname),
		uintptr(unsafe.Pointer(lpFindFileData)),
	)
	if handle != 0 {

		lpFindFileData.CfileNameGo = syscall.UTF16ToString(lpFindFileData.cFileName[:])
	}
	return HANDLE(handle)
}
func IsInvalidHandle(handle HANDLE) bool {
	if handle != 0 && int(handle) != -1 {
		return true
	}
	return false
}
func FindNextFileW(hFindFile HANDLE, lpFindFileData *WIN32_FIND_DATAW) BOOL {
	ret, _, _ := procFindNextFileW.Call(
		uintptr(hFindFile),
		uintptr(unsafe.Pointer(lpFindFileData)),
	)
	if ret != 0 {

		lpFindFileData.CfileNameGo = syscall.UTF16ToString(lpFindFileData.cFileName[:])
	}
	return BOOL(ret)
}
相关推荐
canonical_entropy10 小时前
AI时代,我们还需要低代码吗?—— 一场关于模型、演化与软件未来的深度问答
后端·低代码·aigc
颜如玉10 小时前
HikariCP:Dead code elimination优化
后端·性能优化·源码
考虑考虑11 小时前
Jpa使用union all
java·spring boot·后端
bobz96512 小时前
virtio vs vfio
后端
Rexi12 小时前
“Controller→Service→DAO”三层架构
后端
bobz96513 小时前
计算虚拟化的设计
后端
深圳蔓延科技13 小时前
Kafka的高性能之路
后端·kafka
Barcke13 小时前
深入浅出 Spring WebFlux:从核心原理到深度实战
后端
JuiceFS13 小时前
从 MLPerf Storage v2.0 看 AI 训练中的存储性能与扩展能力
运维·后端
大鸡腿同学13 小时前
Think with a farmer's mindset
后端