解析以逗号分隔的数据

Golang 版本

1.12.1

前言

有多种表格数据格式。 CSV逗号分隔值 )是主要用于数据传输和导出的最基本格式之一。没有定义CSV的标准,但RFC 4180中描述了格式本身。

实现

data.csv
"Name","Surname","Age"
# this is comment in data
"John","Mnemonic",20
Maria,Tone,21
data.go
package main

import (
	"encoding/csv"
	"fmt"
	"os"
)

func main() {

	file, err := os.Open("data.csv")
	if err != nil {
		panic(err)
	}
	defer file.Close()

	reader := csv.NewReader(file)
	reader.FieldsPerRecord = 3
	reader.Comment = '#'

	for {
		record, e := reader.Read()
		if e != nil {
			fmt.Println(e)
			break
		}
		fmt.Println(record)
	}
}
$ go run data.go
[Name Surname Age]
[John Mnemonic 20]
[Maria Tone 21]
EOF
data_uncommon.csv
Name;Surname;Age
"John";Mnemonic;20
"Maria";Tone;21
data_uncommon.go
package main

import (
	"encoding/csv"
	"fmt"
	"os"
)

func main() {

	file, err := os.Open("data_uncommon.csv")
	if err != nil {
		panic(err)
	}
	defer file.Close()

	reader := csv.NewReader(file)
	reader.Comma = ';'

	for {
		record, e := reader.Read()
		if e != nil {
			fmt.Println(e)
			break
		}
		fmt.Println(record)
	}
}
$ go run data_uncommon.go
[Name Surname Age]
[John Mnemonic 20]
[Maria Tone 21]
EOF

原理

strings.Splitencoding/csvNewReaderReaderReaderread
ReaderFieldsPerRecord

另一个有趣的配置是注释参数,它允许您在已解析的数据中定义注释字符。在本例中,以这种方式忽略整行。

Go 1.10现在禁止使用无意义的逗号和注释设置。这意味着null、回车、换行符、无效的符文和Unicode替换字符。此外,禁止将逗号和注释设置为相等。