解析以逗号分隔的数据
Golang 版本
1.12.1
前言
有多种表格数据格式。 CSV ( 逗号分隔值 )是主要用于数据传输和导出的最基本格式之一。没有定义CSV的标准,但RFC 4180中描述了格式本身。
实现
data.csv
"Name","Surname","Age" # this is comment in data "John","Mnemonic",20 Maria,Tone,21
data.go
package main
import (
"encoding/csv"
"fmt"
"os"
)
func main() {
file, err := os.Open("data.csv")
if err != nil {
panic(err)
}
defer file.Close()
reader := csv.NewReader(file)
reader.FieldsPerRecord = 3
reader.Comment = '#'
for {
record, e := reader.Read()
if e != nil {
fmt.Println(e)
break
}
fmt.Println(record)
}
}
$ go run data.go [Name Surname Age] [John Mnemonic 20] [Maria Tone 21] EOF
data_uncommon.csv
Name;Surname;Age "John";Mnemonic;20 "Maria";Tone;21
data_uncommon.go
package main
import (
"encoding/csv"
"fmt"
"os"
)
func main() {
file, err := os.Open("data_uncommon.csv")
if err != nil {
panic(err)
}
defer file.Close()
reader := csv.NewReader(file)
reader.Comma = ';'
for {
record, e := reader.Read()
if e != nil {
fmt.Println(e)
break
}
fmt.Println(record)
}
}
$ go run data_uncommon.go [Name Surname Age] [John Mnemonic 20] [Maria Tone 21] EOF
原理
strings.Splitencoding/csvNewReaderReaderReaderread
ReaderFieldsPerRecord
另一个有趣的配置是注释参数,它允许您在已解析的数据中定义注释字符。在本例中,以这种方式忽略整行。
Go 1.10现在禁止使用无意义的逗号和注释设置。这意味着null、回车、换行符、无效的符文和Unicode替换字符。此外,禁止将逗号和注释设置为相等。