解析以逗号分隔的数据
Golang 版本
1.12.1
前言
有多种表格数据格式。 CSV ( 逗号分隔值 )是主要用于数据传输和导出的最基本格式之一。没有定义CSV的标准,但RFC 4180中描述了格式本身。
实现
data.csv
"Name","Surname","Age" # this is comment in data "John","Mnemonic",20 Maria,Tone,21
data.go
package main import ( "encoding/csv" "fmt" "os" ) func main() { file, err := os.Open("data.csv") if err != nil { panic(err) } defer file.Close() reader := csv.NewReader(file) reader.FieldsPerRecord = 3 reader.Comment = '#' for { record, e := reader.Read() if e != nil { fmt.Println(e) break } fmt.Println(record) } }
$ go run data.go [Name Surname Age] [John Mnemonic 20] [Maria Tone 21] EOF
data_uncommon.csv
Name;Surname;Age "John";Mnemonic;20 "Maria";Tone;21
data_uncommon.go
package main import ( "encoding/csv" "fmt" "os" ) func main() { file, err := os.Open("data_uncommon.csv") if err != nil { panic(err) } defer file.Close() reader := csv.NewReader(file) reader.Comma = ';' for { record, e := reader.Read() if e != nil { fmt.Println(e) break } fmt.Println(record) } }
$ go run data_uncommon.go [Name Surname Age] [John Mnemonic 20] [Maria Tone 21] EOF
原理
strings.Splitencoding/csvNewReaderReaderReaderread
ReaderFieldsPerRecord
另一个有趣的配置是注释参数,它允许您在已解析的数据中定义注释字符。在本例中,以这种方式忽略整行。
Go 1.10现在禁止使用无意义的逗号和注释设置。这意味着null、回车、换行符、无效的符文和Unicode替换字符。此外,禁止将逗号和注释设置为相等。