Golang系列(三)之并发编程

(一)并发基础

1.概念

并发意味着程序在运行时有多个执行上下文,对应多个调用栈。

并发与并行的区别:

并发的主流实现模型:

实现模型 说明 特点
多进程 操作系统层面的并发模式 处理简单,互不影响,但开销大
多线程 系统层面的并发模式 有效,开销较大,高并发时影响效率
基于回调的非阻塞/异步IO 多用于高并发服务器开发中 编程复杂,开销小
协程 用户态线程,不需要操作系统抢占调度,寄存于线程中 编程简单,结构简单,开销极小,但需要语言的支持

共享内存系统:线程之间采用共享内存的方式通信,通过加锁来避免死锁或资源竞争。

消息传递系统:将线程间共享状态封装在消息中,通过发送消息来共享内存,而非通过共享内存来通信。

2.协程

执行体是个抽象的概念,在操作系统中分为三个级别:进程(process),进程内的线程(thread),进程内的协程(coroutine,轻量级线程)。协程的数量级可达到上百万个,进程和线程的数量级最多不超过一万个。Go语言中的协程叫goroutine,Go标准库提供的调用操作,IO操作都会出让CPU给其他goroutine,让协程间的切换管理不依赖系统的线程和进程,不依赖CPU的核心数量。

3.并发通信

并发编程的难度在于协调,协调需要通过通信,并发通信模型分为共享数据和消息。共享数据即多个并发单元保持对同一个数据的引用,数据可以是内存数据块,磁盘文件,网络数据等。数据共享通过加锁的方式来避免死锁和资源竞争。Go语言则采取消息机制来通信,每个并发单元是独立的个体,有独立的变量,不同并发单元间这些变量不共享,每个并发单元的输入输出只通过消息的方式。

(二)goroutine

1. go关键字

//定义调用体
func Add(x,y int){
  z:=x+y
  fmt.Println(z)
}
//go关键字执行调用,即会产生一个goroutine并发执行
//当函数返回时,goroutine自动结束,如果有返回值,返回值会自动被丢弃
go Add(1,1)
//并发执行
func main(){
  for i:=0;i<10;i++{//主函数启动了10个goroutine,然后返回,程序退出,并不会等待其他goroutine结束
    go Add(i,i)     //所以需要通过channel通信来保证其他goroutine可以顺利执行
  }
}

2. sync.WaitGroup

sync.WaitGroup用来实现启动一组goroutine,并等待任务做完再结束goroutine。

使用方法是:

  • wg.Add():main协程通过调用 wg.Add(delta int) 设置worker协程的个数,然后创建worker协程;
  • wg.Done():worker协程执行结束以后,都要调用 wg.Done(),表示做完任务,goroutine减1;
  • wg.Wait() :main协程调用 wg.Wait() 且被block,直到所有worker协程全部执行结束后返回。
  • 针对可能panic的goroutine,可以使用defer wg.Done()来结束goroutine。

示例:

package main

import (
	"fmt"
	"sync"
)

func main() {
	var wg sync.WaitGroup
	for i := 0; i <= 9; i++ {
		wg.Add(1)
		go func(i int) {
			fmt.Println(i)
			wg.Done()
		}(i)
	}
	wg.Wait()
}

输出如下,随机输出0到9的数字

9
5
6
7
8
1
0
3
4
2

3. sync.Map

Go 语言原生 map 并不是线程安全的,对它进行并发读写操作的时候,需要加锁。sync.map 则是一种并发安全的 map,可以使用在并发读写map的场景中。

sync.Map常见操作:

  • 写入:m.Store("1", 18)
  • 读取:age, ok := m.Load("1")
  • 删除:m.Delete("1")
  • 遍历:m.Range(func(key, value interface{}) bool{}
  • 存在则读取否则写入: m.LoadOrStore("2", 100)
package main

import (
	"fmt"
	"sync"
)

func main() {
	var m sync.Map
	// 1. 写入
	m.Store("1", 18)
	m.Store("2", 20)

	// 2. 读取
	age, ok := m.Load("1")
	fmt.Println(age, ok)

	// 3. 遍历
	m.Range(func(key, value interface{}) bool {
		name := key.(string)
		age := value.(int)
		fmt.Println(name, age)
		return true
	})

	// 4. 删除
	m.Delete("1")
	age, ok = m.Load("1")
	fmt.Println(age, ok)

	// 5. 如果key存在则读取,否则写入给定的值
	m.LoadOrStore("2", 100)
	age, _ = m.Load("2")
	fmt.Println(age)
}

示例:

3.1. 不加锁的map并发读写

以下使用线程不安全的map,进行并发写入,就会出现并发报错。可以通过加锁来解决并发问题,但更推荐使用sync.Map来实现。

示例1:

package main

import (
	"fmt"
	"math/rand"
	"sync"
	"time"
)

func main() {
	// 生成随机种子
	rand.Seed(time.Now().Unix())

	sm := make(map[int]int)
	var wg sync.WaitGroup
	for i := 0; i <= 9; i++ {
		wg.Add(1)
		go func(i int) {
			for j := 0; j <= 9; j++ {
				r := rand.Intn(100) // 生成0-99的随机数
				sm[j] = r  // 同时对map进行并发写入
			}

			wg.Done()
		}(i)
	}
	wg.Wait()

	// 打印map中的值
	fmt.Println(sm)
}

输出异常:

map不能并发写入。

fatal error: concurrent map writes

3.2. 加锁的并发读写

示例2:

package main

import (
	"fmt"
	"math/rand"
	"sync"
	"time"
)

func main() {
	// 生成随机种子
	rand.Seed(time.Now().Unix())

	sm := &SafeMap{
		Map: make(map[int]int),
	}
	var wg sync.WaitGroup
	for i := 0; i <= 9; i++ {
		wg.Add(1)
		go func(i int) {
			for j := 0; j <= 9; j++ {
				r := rand.Intn(100) // 生成0-99的随机数
				sm.Set(i, r)        // 同时对map进行并发写入
			}

			wg.Done()
		}(i)
	}
	wg.Wait()

	// 打印map中的值
	fmt.Println(sm.Map)
}

// SafeMap
type SafeMap struct {
	Map  map[int]int
	lock sync.RWMutex // 加锁
}

// Set
func (m *SafeMap) Set(key, value int) {
	m.lock.Lock()
	defer m.lock.Unlock()
	m.Map[key] = value
}

// Get
func (m *SafeMap) Get(key int) int {
	return m.Map[key]
}

正常输出

map[0:52 1:16 2:86 3:50 4:97 5:38 6:54 7:75 8:26 9:32]

3.3. 使用sync.Map并发读写

示例3:

以下使用线程安全的sync.Map来实现对map的值进行并发的读写。

package main

import (
	"fmt"
	"math/rand"
	"sync"
	"time"
)

func main() {
	// 生成随机种子
	rand.Seed(time.Now().Unix())
	// 使用线程安全的sync.Map
	var sm sync.Map
	var wg sync.WaitGroup
	for i := 0; i <= 9; i++ {
		wg.Add(1)
		go func(i int) {
			for j := 0; j <= 9; j++ {
				r := rand.Intn(100) // 生成0-99的随机数
				sm.Store(j, r)
			}

			wg.Done()
		}(i)
	}
	wg.Wait()

	// 打印map中的值
	sm.Range(func(k, v interface{}) bool {
		fmt.Println(k, v)
		return true
	})
}

正常输出:

2 92
4 5
8 48
9 6
0 50
1 64
6 27
7 86
3 59
5 57

(三)channel

​ channel就像管道的形式,是goroutine之间的通信方式,是进程内的通信方式,跨进程通信建议用分布式系统的方法来解决,例如Socket或http等通信协议。channel是类型相关,即一个channel只能传递一种类型的值,在声明时指定。

1、基本语法

1)channel的声明

//1、channel声明,声明一个管道chanName,该管道可以传递的类型是ElementType
//管道是一种复合类型,[chan ElementType],表示可以传递ElementType类型的管道[类似定语从句的修饰方法]
var chanName chan ElementType
var ch chan int                  //声明一个可以传递int类型的管道
var m map[string] chan bool      //声明一个map,值的类型为可以传递bool类型的管道

2)初始化

//2、初始化ch:=make(chan int)   //make一般用来声明一个复合类型,参数为复合类型的属性

3)管道读写

//3、管道写入,把值想象成一个球,"<-"的方向,表示球的流向,ch即为管道
//写入时,当管道已满(管道有缓冲长度)则会导致程序堵塞,直到有goroutine从中读取出值
ch <- value
//管道读取,"<-"表示从管道把球倒出来赋值给一个变量
//当管道为空,读取数据会导致程序阻塞,直到有goroutine写入值
value:= <-ch 

4)select

//4、每个case必须是一个IO操作,面向channel的操作,只执行其中的一个case操作,一旦满足则结束select过程
//面向channel的操作无非三种情况:成功读出;成功写入;即没有读出也没有写入
select{
  case <-chan1:
  //如果chan1读到数据,则进行该case处理语句
  case chan2<-1:
  //如果成功向chan2写入数据,则进入该case处理语句
  default:
  //如果上面都没有成功,则进入default处理流程
}

2、缓冲和超时机制

1)缓冲机制

//1、缓冲机制:为管道指定空间长度,达到类似消息队列的效果
c:=make(chan int,1024)  //第二个参数为缓冲区大小,与切片的空间大小类似
//通过range关键字来实现依次读取管道的数据,与数组或切片的range使用方法类似
for i :=range c{
  fmt.Println("Received:",i)
}

2)超时机制

//2、超时机制:利用select只要一个case满足,程序就继续执行而不考虑其他case的情况的特性实现超时机制
timeout:=make(chan bool,1)    //设置一个超时管道
go func(){
  time.Sleep(1e9)      //设置超时时间,等待一分钟
  timeout<-true        //一分钟后往管道放一个true的值
}()
//
select {
  case <-ch:           //如果读到数据,则会结束select过程
  //从ch中读取数据
  case <-timeout:      //如果前面的case没有调用到,必定会读到true值,结束select,避免永久等待
  //一直没有从ch中读取到数据,但从timeout中读取到了数据
}

3、channel的传递

//1、channel的传递,来实现Linux系统中管道的功能,以插件的方式增加数据处理的流程
type PipeData struct{
  value int
  handler func(int) int   //handler是属性?
  next chan int   //可以把[chan int]看成一个整体,表示放int类型的管道
}
func handler(queue chan *PipeData){ //queue是一个存放*PipeDate类型的管道,可改变管道里的数据块内容
  for data:=range queue{     //data的类型就是管道存放定义的类型,即PipeData
    data.next <- data.handler(data.value)    //该方法实现将PipeData的value值存放到next的管道中
  }
}

4、单向channel

//2、单向channel:只能用于接收或发送数据,是对channel的一种使用限制
//单向channel的声明
var ch1 chan int    //正常channel,可读写
var ch2 chan<- int  //单向只写channel  [chan<- int]看成一个整体,表示流入管道
var ch3 <-chan int  //单向只读channel  [<-chan int]看成一个整体,表示流出管道
//管道类型强制转换
ch4:=make(chan int)     //ch4为双向管道
ch5:=<-chan int(ch4)    //把[<-chan int]看成单向只读管道类型,对ch4进行强制类型转换
ch6:=chan<- int(ch4)    //把[chan<- int]看成单向只写管道类型,对ch4进行强制类型转换
func Parse(ch <-chan int){    //最小权限原则
  for value:=range ch{
    fmt.Println("Parsing value",value)
  }
}

5、关闭channel

//3、关闭channel,使用内置函数close()函数即可
close(ch)
//判断channel是否关闭
x,ok:=<-ch //ok==false表示channel已经关闭
if !ok {   //如果channel关闭,ok==false,!ok==true
  //执行体
}

(四)多核并行化与同步锁

1、多核并行化

//多核并行化
runtime.GOMAXPROCS(16) //设置环境变量GOMAXPROCS的值来控制使用多少个CPU核心
runtime.NumCPU() //来获取核心数
//出让时间片
runtime.Gosched() //在每个goroutine中控制何时出让时间片给其他goroutine

2、同步锁

//同步锁
sync.Mutex //单读单写:占用Mutex后,其他goroutine只能等到其释放该Mutex
sync.RWMutex //单写多读:会阻止写,不会阻止读
RLock() //读锁
Lock() //写锁
RUnlock() //解锁(读锁)
Unlock() //解锁(写锁)
//全局唯一性操作
//once的Do方法保证全局只调用指定函数(setup)一次,其他goroutine在调用到此函数是会阻塞,直到once调用结束才继续
once.Do(setup)

最后修改 May 10, 2023: add code (7f583d9)