目录

parquet-go的CSVWriter

parquet-go的CSVWriter

代码:

go 复制代码
package main

import (
	"github.com/xitongsys/parquet-go-source/local"
	"github.com/xitongsys/parquet-go/writer"
	"log"
)

func main() {
	var err error
	md := []string{
		"name=Name, type=BYTE_ARRAY, convertedtype=UTF8, encoding=PLAIN",
		"name=address, type=LIST, valuetype=BYTE_ARRAY, valueconvertedtype=UTF8",
	}

	//write
	fw, err := local.NewLocalFileWriter("csv.parquet")
	if err != nil {
		log.Println("Can't open file", err)
		return
	}
	pw, err := writer.NewCSVWriter(md, fw, 4)
	if err != nil {
		log.Println("Can't create csv writer", err)
		return
	}

	num := 10
	for i := 0; i < num; i++ {
		data2 := []interface{}{
			"Student Name",
			[]string{"string1", "string2", "string3"},
		}
		if err = pw.Write(data2); err != nil {
			log.Println("Write error", err)
		}

	}
	if err = pw.WriteStop(); err != nil {
		log.Println("WriteStop error", err)
	}
	log.Println("Write Finished")
	fw.Close()

}

执行这段代码会报错:

go 复制代码
pw, err := writer.NewCSVWriter(md, fw, 4)

报错如下:

shell 复制代码
failed to create schema from tag map: type LIST: not a valid Type string

分析原因后是CSVWriter不支持LIST。

具体报错在这里:

go 复制代码
if t, err := parquet.TypeFromString(info.Type); err == nil {
	schema.Type = &t

} else {
		return nil, fmt.Errorf("type " + info.Type + ": " + err.Error())
}

进入parquet.TypeFromString()

go 复制代码
func TypeFromString(s string) (Type, error) {
	switch s {
	case "BOOLEAN":
		return Type_BOOLEAN, nil
	case "INT32":
		return Type_INT32, nil
	case "INT64":
		return Type_INT64, nil
	case "INT96":
		return Type_INT96, nil
	case "FLOAT":
		return Type_FLOAT, nil
	case "DOUBLE":
		return Type_DOUBLE, nil
	case "BYTE_ARRAY":
		return Type_BYTE_ARRAY, nil
	case "FIXED_LEN_BYTE_ARRAY":
		return Type_FIXED_LEN_BYTE_ARRAY, nil
	}
	return Type(0), fmt.Errorf("not a valid Type string")
}

可以看到这里并没有LIST,也没有MAP。只支持如上一些类型。

本文是转载文章,点击查看原文
如有侵权,请联系 xyy@jishuzhan.net 删除
相关推荐
欧宸雅几秒前
Perl语言的文件系统
开发语言·后端·golang
uhakadotcom6 分钟前
使用 boto3 读取 AWS S3 文件的简单指南
后端·面试·github
写代码的小王吧14 分钟前
【安全】Java幂等性校验解决重复点击(6种实现方式)
java·linux·开发语言·安全·web安全·网络安全·音视频
程序猿chen25 分钟前
《JVM考古现场(十六):太初奇点——从普朗克常量到宇宙弦的编译风暴》
jvm·git·后端·程序人生·金融·java-ee·量子计算
字节源流26 分钟前
【spring Cloud Netflix】OpenFeign组件
java·spring boot·后端
淘源码d34 分钟前
如何运用C#.NET快速开发一套掌上医院系统?
开发语言·c#·.net·源码·掌上医院
一个程序员(●—●)38 分钟前
xLua环境控制+xLua的Lua调用C#的1
开发语言·unity·c#·lua
java搬砖工-苤-初心不变41 分钟前
解决 Go 模块与 GitLab 私有仓库权限问题:SSH、HTTPS 和自动认证指南
golang·ssh·gitlab
Asthenia04121 小时前
Numpy:数组的范围创建/变形/转置/展平
后端
兔子的洋葱圈1 小时前
【django】3 (django路由) 路由配置和反向解析
后端·python·django