Go 并发编程 — 结构体多字段的原子操作 atomic.Value

多字段更新？

并发编程中，原子更新多个字段是常见的需求。

struct PersonPerson.namePerson.age

有童鞋可能奇怪了，为什么要保证原子性？

我们以一个示例程序开端，公用内存简化成一个全局变量，开 10 个并发协程去更新。你猜最后的结果是啥？

package main

import (
    "fmt"
    "sync"
    "time"
)

type Person struct {
    name string
    age  int
}

// 全局变量（简单处理）
var p Person

func update(name string, age int) {
    // 更新第一个字段
    p.name = name
    // 加点随机性
    time.Sleep(time.Millisecond*200)
    // 更新第二个字段
    p.age = age
}

func main() {
    wg := sync.WaitGroup{}
    wg.Add(10)
    // 10 个协程并发更新
    for i := 0; i < 10; i++ {
        name, age := fmt.Sprintf("nobody:%v", i), i
        go func() {
            defer wg.Done()
            update(name, age)
        }()
    }
    wg.Wait()
    // 结果是啥？你能猜到吗？
    fmt.Printf("p.name=%s\np.age=%v\n", p.name, p.age)
}

打印结果是啥？你能猜到吗？

可能是这样的：

p.name=nobody:2
p.age=3

也可能是：

p.name=nobody:8
p.age=7

按照排列组合来算，一共有 10*10 种结果。

那我们想要什么结果？我们想要 name 和 age 一定要是匹配的，不能牛头不对马嘴。换句话说，name 和 age 的更新一定要原子操作，不能出现未定义的状态。

我们想要的是（ nobody:i，i ），正确的结果只能在以下预定的 10 种结果出现：

（ nobody:0, 0 ）
（ nobody:1, 1 ）
（ nobody:2, 2 ）
（ nobody:3, 3 ）
    ...
（ nobody:9, 9 ）

这仅仅是一个简单的示例，童鞋们思考下自己现实的需求，应该是非常常见的。

现在有两个问题：

第一个问题：这个 demo 观察下运行时间，用 time 来观察，时间大概是 200 ms 左右，为什么？

root@ubuntu:~/code/gopher/src/atomic_test# time ./atomic_test 
p.name=nobody:8
p.age=7

real 0m0.203s
user 0m0.000s
sys 0m0.000s

如上就是 203 毫秒。划重点：这个时间大家请先记住了，对我们分析下面的例子有帮助。

update

update

第二个问题：怎么解决这个正确性的问题。

大概两个办法：

锁互斥
原子操作

下面详细分析下异同和优劣。

锁实现

在并发的上下文，用锁来互斥，这是最常见的思路。 锁能形成一个临界区，锁内的一系列操作任何时刻都只会有一个人更新，如此就能确保更新不会混乱，从而保证多步操作的原子性。

首先配合变量，对应一把互斥锁：

// 全局变量（简单处理）
var p Person
// 互斥锁，保护变量更新
var mu sync.Mutex

更新的逻辑在锁内：

func update(name string, age int) {
    // 更新：加锁，逻辑串行化
    mu.Lock()
    defer mu.Unlock()

    // 以下逻辑不变
}

大家按照上面的把程序改了之后，逻辑是不是就正确了。一定是（ nobody:i，i ）配套更新的。

但你注意到另一个可怕的问题吗？

程序运行变的好慢！！！！

time

root@ubuntu:~/code/gopher/src/atomic_test# time ./atomic_test 
p.name=nobody:8
p.age=8

real 0m2.017s
user 0m0.000s
sys 0m0.000s

不禁要问自己，为啥？

还记得上面我提到过，一个 update 固定要 200 毫秒。

updateupdateupdate

第 1 个协程加上锁了，后面 9 个都要等待，依次类推。最长的等待时间应该是 1.8 秒。

update

加锁不怕，抢锁等待才可怕。在大量并发的时候，由于锁的互斥特性，这里的性能可能堪忧。

还有就是抢锁失败的话，是要把调度权让出去的，直到下一次被唤醒。这里还增加了协程调度的开销，一来一回可能性能就更慢了下来。

思考：用锁之后正确性是保证了，某些场景性能可能堪忧。那咋吧？

在本次的例子，下一步的进化就是：原子化操作。

温馨提示：

怕童鞋误会，声明一下：锁不是不能用，是要区分场景，不分场景的性能优化措施是没有意义的哈。大部分的场景，用锁没啥问题。且锁是可以细化的，比如读锁和写锁，更新加写锁，只读操作加读锁。这样确实能带来较大的性能提升，特别是在写少读多的时候。

原子操作

atomic.Value

怎么改造？

atomic.Value

// 全局变量（简单处理）
var p atomic.Value

update

func update(name string, age int) {
    lp := &Person{}
    // 更新第一个字段
    lp.name = name
    // 加点随机性
    time.Sleep(time.Millisecond * 200)
    // 更新第二个字段
    lp.age = age
    // 原子设置到全局变量
    p.Store(lp)
}

mainLoad

    // 结果是啥？你能猜到吗？
    _p := p.Load().(*Person)
    fmt.Printf("p.name=%s\np.age=%v\n", _p.name, _p.age)

这样就解决并发更新的正确性问题啦。感兴趣的童鞋可以运行下，结果都是正确的（ nobody:i，i ）。

root@ubuntu:~/code/gopher/src/atomic_test# time ./atomic_test 
p.name=nobody:7
p.age=7

real 0m0.202s
user 0m0.000s
sys 0m0.000s

竟然是 200 毫秒作用，比锁的实现时延少 10 倍，并且保证了正确性。

为什么会这样？

p.Store(lp)

锁和原子变量都能保证正确的逻辑。在我们这个简要的场景里，我相信你已经感受到性能的差距了。

当然了，还是那句话，具体用那个实现要看具体场景，不能一概而论。而且，锁有自己无可替代的作用，它能保证多个步骤的原子性，而不仅仅是字段的赋值。

atomic.Value

原理可能要大跌眼镜。

趁现在我们还不懂内部原理，先思考个问题（不然待会一下子看懂了就没意思了）？

Value.StoreValue.LoadStoreLoad

提前透露下：并非如此。

atomic.Value 原理

1 atomic.Value 结构体

atomic.Valuesrc/sync/atomic/value.go

type Value struct {
    v interface{}
}

interface {}efacesrc/runtime/iface.go

type eface struct {
    _type *_type
    data  unsafe.Pointer
}

interface {}efaceatomic.Valuevalue.goifaceWords

interface {}efaceifaceWords

2 Value.Store 方法

看一下简要的代码，这是一个简单的 for 循环：

func (v *Value) Store(x interface{}) {
    // 强制转化类型，转变成 ifaceWords （三种类型，相同的内存布局，这是前提）
    vp := (*ifaceWords)(unsafe.Pointer(v))
    xp := (*ifaceWords)(unsafe.Pointer(&x))
    for {
        // 获取数据类型
        typ := LoadPointer(&vp.typ)
        // 第一个判断：atomic.Value 初始的时候是 nil 值，那么就是走这里进去的；
        if typ == nil {
            runtime_procPin()
            if !CompareAndSwapPointer(&vp.typ, nil, unsafe.Pointer(^uintptr(0))) {
                runtime_procUnpin()
                continue
            }
            // 初始赋值
            StorePointer(&vp.data, xp.data)
            StorePointer(&vp.typ, xp.typ)
            runtime_procUnpin()
            return
        }
        // 第二个判断：这个也是初始的时候，这是一个中间状态；
        if uintptr(typ) == ^uintptr(0) {
            continue
        }
        // 第三个判断：类型校验，通过这里就能看出来，Value 里面的类型不能变，否则会 panic；
        if typ != xp.typ {
            panic("sync/atomic: store of inconsistently typed value into Value")
        }
        // 划重点啦：只要过了初始化赋值阶段，基本上就是直接跑到这行代码啦
        StorePointer(&vp.data, xp.data)
        return
    }
}

有几个点稍微解释下：

atomic.Value^uintptr(0)CompareAndSwapPointer^uintptr(0)atomic.Value

这里有没有大跌眼镜？

StoreStoreStorePointer

我的天？是这样的吗？那何来的原子操作。

Value.Store()

这里就回答了上面的问题：Store，Load 是否有数据拷贝？

划重点：没有！没动数据

atomic.Value

update

func update(name string, age int) {
    // 注意哦，局部变量哦
    lp := &Person{}
    // 更新字段 。。。。
 
    // 设置的是全新的内存地址给全局的 atomic.Value 变量
    p.Store(lp)
}

p.Store( /* */ )

事情会是这样的：

runtime.convT2EefaceValue.StoreStore

CompareAndSwapPointer

ifaceWords

atomic.Value

3 Value.Load 方法

有写就有读嘛，看一下读的简要的实现：


func (v *Value) Load() (x interface{}) {
    vp := (*ifaceWords)(unsafe.Pointer(v))
    typ := LoadPointer(&vp.typ)
    // 初始赋值还未完成
    if typ == nil || uintptr(typ) == ^uintptr(0) {
        return nil
    }
    // 划重点啦：只要过了初始化赋值阶段，原子读的时候基本上就直接跑到这行代码啦；
    data := LoadPointer(&vp.data)
    xp := (*ifaceWords)(unsafe.Pointer(&x))
    // 赋值类型，和数据结构体的地址
    xp.typ = typ
    xp.data = data
    return
}

LoadPointer

总结

interface {}efaceifaceWordsatomic.ValueStorePointeratomic.ValueStoreLoadatomic.ValueLoadStoreatomic.Value

后记

说实话，原理让我大跌眼镜，当然也让我们避免踩坑，就怕你以为 atomic.Value 是万能的， Store 进去了一个会并发操作的内存块，那就尴了个尬了。