4.7 并发模式实战：生产者-消费者与工作池¶

同学们好！在Go语言中，并发编程是其最强大的特性之一。掌握经典并发模式对于构建高性能、高可用的Go应用至关重要。今天我们将深入探讨两种最常用的并发模式：生产者-消费者模式和工作池模式，通过实战练习掌握它们的实现方法，并学习如何处理相关的错误和性能问题。

学习目标¶

通过本章学习，你将能够： - 理解并实现生产者-消费者模式，解决并发环境下的数据传递问题 - 设计和实现灵活高效的工作池，实现任务的并发处理 - 掌握协程池的动态扩缩容技术，优化资源利用率 - 有效处理并发环境下的错误，并防范协程泄露等常见问题

内容规划¶

实战练习1：实现生产者-消费者模式¶

生产者-消费者模式是并发编程中的经典模式，它通过一个共享的缓冲区（通常是通道）连接生产者和消费者，实现两者之间的解耦和异步通信。这种模式特别适合处理数据生产和消费速度不匹配的场景。

设计要求分析： - 多生产者和多消费者：允许多个goroutine同时生产数据和消费数据 - 可配置缓冲区：通道的容量可以根据需求调整 - 优雅关闭：能够安全地停止所有生产者和消费者，避免数据丢失 - 监控统计：跟踪生产和消费的数量，了解系统运行状态

完整实现代码：

package main

import (
    "context"
    "fmt"
    "log"
    "math/rand"
    "os"
    "os/signal"
    "sync"
    "syscall"
    "time"
)

// Data 表示生产和消费的数据单元
type Data struct {
    ID    int
    Value string
}

// Stats 用于统计生产和消费的数量
type Stats struct {
    mu            sync.Mutex
    ProducedCount int
    ConsumedCount int
}

// 增加生产计数
func (s *Stats) AddProduced() {
    s.mu.Lock()
    defer s.mu.Unlock()
    s.ProducedCount++
}

// 增加消费计数
func (s *Stats) AddConsumed() {
    s.mu.Lock()
    defer s.mu.Unlock()
    s.ConsumedCount++
}

// 获取当前统计信息
func (s *Stats) Get() (int, int) {
    s.mu.Lock()
    defer s.mu.Unlock()
    return s.ProducedCount, s.ConsumedCount
}

func main() {
    fmt.Println("=== 生产者-消费者模式演示 ===")

    // 配置参数
    bufferSize := 5
    numProducers := 2
    numConsumers := 3
    runtime := 10 * time.Second

    // 创建带缓冲的通道
    dataChan := make(chan Data, bufferSize)

    // 创建上下文，用于优雅关闭
    ctx, cancel := context.WithTimeout(context.Background(), runtime)
    defer cancel()

    // 等待组，用于等待所有goroutine完成
    var wg sync.WaitGroup

    // 统计对象
    stats := &Stats{}

    // 启动生产者
    for i := 0; i < numProducers; i++ {
        wg.Add(1)
        go producer(ctx, i, dataChan, &wg, stats)
    }

    // 启动消费者
    for i := 0; i < numConsumers; i++ {
        wg.Add(1)
        go consumer(ctx, i, dataChan, &wg, stats)
    }

    // 启动监控goroutine
    go monitor(ctx, stats)

    // 等待中断信号或超时
    waitForInterrupt(cancel)

    // 等待所有goroutine完成
    wg.Wait()

    // 输出最终统计
    produced, consumed := stats.Get()
    fmt.Printf("\n最终统计: 生产=%d, 消费=%d\n", produced, consumed)
}

// producer 生产者函数
func producer(ctx context.Context, id int, dataChan chan<- Data, wg *sync.WaitGroup, stats *Stats) {
    defer wg.Done()

    for {
        select {
        case <-ctx.Done():
            fmt.Printf("生产者 %d 停止工作\n", id)
            return
        default:
            // 模拟数据生产
            data := Data{
                ID:    rand.Intn(1000),
                Value: fmt.Sprintf("生产者-%d-数据", id),
            }

            // 尝试发送数据，如果上下文已取消则放弃
            select {
            case dataChan <- data:
                stats.AddProduced()
                fmt.Printf("生产者 %d 生产了: %v\n", id, data)
            case <-ctx.Done():
                fmt.Printf("生产者 %d 停止工作\n", id)
                return
            }

            // 模拟生产时间
            time.Sleep(time.Duration(rand.Intn(500)) * time.Millisecond)
        }
    }
}

// consumer 消费者函数
func consumer(ctx context.Context, id int, dataChan <-chan Data, wg *sync.WaitGroup, stats *Stats) {
    defer wg.Done()

    for {
        select {
        case <-ctx.Done():
            fmt.Printf("消费者 %d 停止工作\n", id)
            return
        case data, ok := <-dataChan:
            if !ok {
                fmt.Printf("消费者 %d: 通道已关闭\n", id)
                return
            }

            // 处理数据
            stats.AddConsumed()
            fmt.Printf("消费者 %d 处理了: %v\n", id, data)

            // 模拟处理时间
            time.Sleep(time.Duration(rand.Intn(800)) * time.Millisecond)
        }
    }
}

// monitor 监控函数，定期输出统计信息
func monitor(ctx context.Context, stats *Stats) {
    ticker := time.NewTicker(2 * time.Second)
    defer ticker.Stop()

    for {
        select {
        case <-ctx.Done():
            return
        case <-ticker.C:
            produced, consumed := stats.Get()
            fmt.Printf("[监控] 生产: %d, 消费: %d, 差值: %d\n", 
                produced, consumed, produced-consumed)
        }
    }
}

// waitForInterrupt 等待中断信号
func waitForInterrupt(cancel func()) {
    sigChan := make(chan os.Signal, 1)
    signal.Notify(sigChan, syscall.SIGINT, syscall.SIGTERM)

    go func() {
        sig := <-sigChan
        fmt.Printf("\n接收到信号: %v，正在优雅关闭...\n", sig)
        cancel()
    }()
}

代码解析：

数据结构设计：
Data 结构体：表示生产和消费的数据单元
Stats 结构体：用于跟踪生产和消费的数量，使用互斥锁保证并发安全
核心功能实现：
producer 函数：模拟数据生产，通过channel发送数据，支持通过context取消
consumer 函数：从channel接收数据并处理，同样支持通过context取消
优雅关闭机制：
使用context.WithTimeout设置运行时间
监听系统信号（SIGINT, SIGTERM）实现手动终止
通过WaitGroup等待所有goroutine完成
合理的channel关闭时机，避免panic
监控统计：
单独的监控goroutine定期打印统计信息
最终输出完整的统计报告

运行与测试：运行程序后，你将看到生产者不断生成数据，消费者处理数据，监控信息定期输出。程序会在指定时间后自动退出，或通过Ctrl+C手动终止，退出前会打印最终统计信息。

扩展思考： - 如何修改代码以支持带优先级的任务处理？ - 如何实现数据处理的重试机制？ - 如何在高负载情况下保护系统不被压垮？

实战练习2：实现工作池模式¶

工作池（Worker Pool）模式是另一种常用的并发模式，它维护一组固定或动态变化的工作协程，从任务队列中获取任务并执行。这种模式可以有效控制并发数量，避免资源耗尽。

核心功能分析： - 工作协程管理：创建和管理一定数量的工作协程 - 任务队列：存储待执行的任务 - 动态扩缩容：根据任务量自动调整工作协程数量 - 错误处理：捕获和处理任务执行过程中的错误

完整实现代码：

package main

import (
    "context"
    "errors"
    "fmt"
    "log"
    "math/rand"
    "os"
    "os/signal"
    "sync"
    "sync/atomic"
    "syscall"
    "time"
)

// Task 接口定义任务的基本行为
type Task interface {
    Execute() error
    ID() string
}

// SimpleTask 简单的任务实现
type SimpleTask struct {
    id string
}

func (t *SimpleTask) Execute() error {
    // 模拟任务执行时间
    time.Sleep(time.Duration(rand.Intn(500)) * time.Millisecond)

    // 模拟随机失败
    if rand.Float32() < 0.1 {
        return errors.New("任务执行失败")
    }

    return nil
}

func (t *SimpleTask) ID() string {
    return t.id
}

// WorkerPool 工作池结构体
type WorkerPool struct {
    ctx         context.Context
    cancel      context.CancelFunc
    tasks       chan Task
    errors      chan error
    wg          sync.WaitGroup
    mu          sync.Mutex

    // 配置参数
    minWorkers  int
    maxWorkers  int
    scaleUpThreshold int
    scaleDownThreshold int

    // 状态变量
    workerCount int
    isRunning   atomic.Bool

    // 统计
    totalTasks      atomic.Int64
    completedTasks  atomic.Int64
    failedTasks     atomic.Int64
}

// PoolConfig 工作池配置
type PoolConfig struct {
    MinWorkers         int
    MaxWorkers         int
    QueueSize          int
    ScaleUpThreshold   int
    ScaleDownThreshold int
}

// NewWorkerPool 创建新的工作池
func NewWorkerPool(config PoolConfig) *WorkerPool {
    if config.MinWorkers < 1 {
        config.MinWorkers = 1
    }
    if config.MaxWorkers < config.MinWorkers {
        config.MaxWorkers = config.MinWorkers
    }
    if config.QueueSize < 1 {
        config.QueueSize = 10
    }

    ctx, cancel := context.WithCancel(context.Background())

    pool := &WorkerPool{
        ctx:      ctx,
        cancel:   cancel,
        tasks:    make(chan Task, config.QueueSize),
        errors:   make(chan error, 100),
        minWorkers: config.MinWorkers,
        maxWorkers: config.MaxWorkers,
        scaleUpThreshold: config.ScaleUpThreshold,
        scaleDownThreshold: config.ScaleDownThreshold,
    }

    pool.isRunning.Store(true)
    pool.startWorkers(config.MinWorkers)
    go pool.monitorAndScale()
    go pool.handleErrors()

    return pool
}

// Submit 提交任务到工作池
func (p *WorkerPool) Submit(task Task) error {
    if !p.isRunning.Load() {
        return errors.New("工作池已停止")
    }

    select {
    case p.tasks <- task:
        p.totalTasks.Add(1)
        return nil
    case <-p.ctx.Done():
        return errors.New("工作池已关闭")
    default:
        return errors.New("任务队列已满")
    }
}

// startWorkers 启动指定数量的工作协程
func (p *WorkerPool) startWorkers(count int) {
    p.mu.Lock()
    defer p.mu.Unlock()

    for i := 0; i < count && p.workerCount < p.maxWorkers; i++ {
        p.workerCount++
        p.wg.Add(1)

        go func(workerID int) {
            defer p.wg.Done()
            defer func() {
                p.mu.Lock()
                p.workerCount--
                p.mu.Unlock()
            }()

            for {
                select {
                case <-p.ctx.Done():
                    return
                case task, ok := <-p.tasks:
                    if !ok {
                        return
                    }

                    // 执行任务
                    err := task.Execute()
                    if err != nil {
                        p.failedTasks.Add(1)
                        select {
                        case p.errors <- fmt.Errorf("任务 %s 执行失败: %v", task.ID(), err):
                        default:
                            // 错误通道已满，丢弃错误
                        }
                    } else {
                        p.completedTasks.Add(1)
                    }
                }
            }
        }(p.workerCount)
    }
}

// monitorAndScale 监控和自动扩缩容
func (p *WorkerPool) monitorAndScale() {
    ticker := time.NewTicker(3 * time.Second)
    defer ticker.Stop()

    for {
        select {
        case <-p.ctx.Done():
            return
        case <-ticker.C:
            queueLen := len(p.tasks)
            currentWorkers := p.workerCount

            p.mu.Lock()
            // 扩容逻辑
            if queueLen > p.scaleUpThreshold && currentWorkers < p.maxWorkers {
                addCount := min(2, p.maxWorkers-currentWorkers) // 每次最多增加2个worker
                fmt.Printf("队列长度 %d > 阈值 %d，扩容 %d 个worker\n", 
                    queueLen, p.scaleUpThreshold, addCount)
                p.startWorkers(addCount)
            }

            // 缩容逻辑（这里简化处理，实际应该基于空闲时间等更复杂的逻辑）
            if queueLen < p.scaleDownThreshold && currentWorkers > p.minWorkers {
                // 实际缩容应该更复杂，这里只是示例
                fmt.Printf("队列长度 %d < 阈值 %d，考虑缩容\n", 
                    queueLen, p.scaleDownThreshold)
            }
            p.mu.Unlock()

            // 输出状态信息
            fmt.Printf("工作池状态: workers=%d, queue=%d/%d, tasks=%d/%d/%d\n",
                currentWorkers, queueLen, cap(p.tasks),
                p.completedTasks.Load(), p.failedTasks.Load(), p.totalTasks.Load())
        }
    }
}

// handleErrors 处理错误
func (p *WorkerPool) handleErrors() {
    for {
        select {
        case <-p.ctx.Done():
            return
        case err, ok := <-p.errors:
            if !ok {
                return
            }
            // 这里可以扩展为更复杂的错误处理，如重试、报警等
            fmt.Printf("错误处理: %v\n", err)
        }
    }
}

// Stop 停止工作池
func (p *WorkerPool) Stop() {
    if p.isRunning.CompareAndSwap(true, false) {
        p.cancel()
        close(p.tasks)
        close(p.errors)
        p.wg.Wait()

        fmt.Printf("工作池已停止. 最终统计: 总任务=%d, 成功=%d, 失败=%d\n",
            p.totalTasks.Load(), p.completedTasks.Load(), p.failedTasks.Load())
    }
}

func main() {
    fmt.Println("=== 工作池模式演示 ===")

    // 创建工作池配置
    config := PoolConfig{
        MinWorkers:         2,
        MaxWorkers:         10,
        QueueSize:          20,
        ScaleUpThreshold:   5,
        ScaleDownThreshold: 2,
    }

    // 创建工作池
    pool := NewWorkerPool(config)

    // 等待中断信号
    sigChan := make(chan os.Signal, 1)
    signal.Notify(sigChan, syscall.SIGINT, syscall.SIGTERM)

    // 模拟任务提交
    go func() {
        taskCount := 0
        for {
            select {
            case <-pool.ctx.Done():
                return
            default:
                task := &SimpleTask{id: fmt.Sprintf("task-%d", taskCount)}
                if err := pool.Submit(task); err != nil {
                    fmt.Printf("提交任务失败: %v\n", err)
                    time.Sleep(100 * time.Millisecond)
                    continue
                }
                taskCount++
                time.Sleep(time.Duration(rand.Intn(200)) * time.Millisecond)

                // 模拟负载变化
                if taskCount%30 == 0 {
                    time.Sleep(2 * time.Second)
                }
            }
        }
    }()

    // 等待中断信号
    <-sigChan
    fmt.Println("\n接收到中断信号，正在停止工作池...")
    pool.Stop()
    fmt.Println("程序退出")
}

func min(a, b int) int {
    if a < b {
        return a
    }
    return b
}

代码解析：

核心组件设计：
Task 接口：定义任务的基本行为（执行和获取ID）
SimpleTask：具体的任务实现，模拟实际工作负载
WorkerPool：工作池核心结构体，管理工作协程和任务队列
PoolConfig：工作池配置参数，控制其行为
动态扩缩容机制：
监控协程定期检查任务队列长度
当队列长度超过扩容阈值且未达最大工作数时自动扩容
当队列长度低于缩容阈值且超过最小工作数时自动缩容
扩容通过新增工作协程实现，缩容通过自然淘汰空闲协程实现
错误处理策略：
任务执行错误通过专用错误通道收集
单独的错误处理协程处理错误（可扩展为报警、重试等）
错误通道使用缓冲，避免阻塞主流程
统计与监控：
记录总任务数、完成数、失败数等关键指标
定期打印工作池状态，包括工作协程数量和队列长度
退出时输出完整统计报告

运行与测试：运行程序后，工作池会根据任务量自动调整工作协程数量。你可以观察到： - 当任务提交速度快于处理速度时，队列长度增加，工作池会自动扩容 - 当任务提交速度减慢时，队列长度减少，工作池会自动缩容 - 程序会定期输出当前状态，包括工作协程数量和任务处理情况 - 按Ctrl+C可以优雅关闭工作池，等待所有任务处理完成

扩展思考： - 如何实现基于CPU利用率的扩缩容策略？ - 如何为不同类型的任务设置优先级？ - 如何实现任务的超时控制？ - 如何在分布式系统中扩展工作池模式？

总结¶

本章我们通过两个实战练习深入探讨了Go语言中的两种重要并发模式：

生产者-消费者模式：通过共享通道实现了生产者和消费者的解耦，支持多生产者、多消费者协同工作，并实现了优雅关闭和监控统计功能。这种模式特别适合处理数据生产和消费速度不匹配的场景。
工作池模式：实现了一个支持动态扩缩容的工作池，能够根据任务量自动调整工作协程数量，优化资源利用率。同时提供了完善的错误处理和统计监控功能，适合处理大量可并行的任务。

在实际开发中，这两种模式经常结合使用。例如，生产者-消费者模式中的消费者可以是工作池中的工作协程，形成更灵活高效的并发处理系统。

关键注意事项： - 始终注意协程泄露问题，确保所有启动的goroutine都能正常退出 - 使用适当的同步机制（如互斥锁）保护共享资源 - 设计合理的优雅关闭流程，确保数据完整性 - 实现完善的监控和错误处理，提高系统可维护性

下一节：4.8 并发安全与性能优化：缓存系统实战