C++线程池

    科技2024-07-31  29

    C++线程池

    文章目录

    C++线程池介绍使用C++实现线程池1. 查看系统支持的最大线程数量2. 线程池的方法和数据结构3. 线程池的构造函数4. 无限循环的函数5. 线程池的析构函数6. start函数 测试参考资料

    C++线程池的简单实现。

    完整代码:https://github.com/ocfBNj/ThreadPool

    介绍

    线程池(英语:thread pool):一种线程使用模式。线程过多会带来调度开销,进而影响缓存局部性和整体性能。而线程池维护着多个线程,等待着监督管理者分配可并发执行的任务。这避免了在处理短时间任务时创建与销毁线程的代价。线程池不仅能够保证内核的充分利用,还能防止过分调度。线程数一般取cpu数量+2比较合适,线程数过多会导致额外的线程切换开销。

    上面是维基百科对线程池的介绍。

    使用C++实现线程池

    1. 查看系统支持的最大线程数量

    unsigned int size = std::thread::hardware_concurrency();

    使用std::thread::hardware_concurrency()获得系统支持的最大线程数量。

    2. 线程池的方法和数据结构

    class ThreadPool { public: ThreadPool(unsigned int size = std::thread::hardware_concurrency()); ~ThreadPool(); // 启动一个任务 template <typename F, typename... Args> auto start(F&& f, Args&&... args) -> std::future<decltype(std::forward<F>(f)(std::forward<Args>(args)...))>; private: // 线程池中执行无限循环函数 std::vector<std::thread> pool; // 任务队列 std::queue<std::function<void()>> taskQueue; // 同步 std::mutex mutex; std::condition_variable condition; bool stop; void infiniteLoop(); };

    3. 线程池的构造函数

    ThreadPool::ThreadPool(unsigned int size) : pool(size), stop(false) { for (std::thread& thread : pool) { thread = std::thread{std::bind(&ThreadPool::infiniteLoop, this)}; } }

    因为线程的创建和摧毁需要时间开销。对于一个高效的线程池,一次性创建size个线程,并且在之后不再创建新的线程或摧毁旧的线程。每个线程池中的线程中通过无限循环的函数从任务队列中取走并执行任务。

    4. 无限循环的函数

    void ThreadPool::infiniteLoop() { while (true) { std::function<void()> task; { std::unique_lock<std::mutex> lock{mutex}; condition.wait(lock, [this] { return !taskQueue.empty() || stop; }); if (stop && taskQueue.empty()) { return; } task = taskQueue.front(); taskQueue.pop(); } task(); } }

    当任务队列为空时,阻塞直到任务队列不为空或线程池被停止(即将被销毁)。

    当线程池被停止时,执行完未完成的任务,然后退出该无限循环函数。

    从任务队列取出一个任务后,执行它。

    5. 线程池的析构函数

    ThreadPool::~ThreadPool() { { std::unique_lock<std::mutex> lock{mutex}; stop = true; } condition.notify_all(); for (std::thread& thread : pool) { thread.join(); } }

    停止线程池并通知线程池中的线程。

    等待线程池中的线程执行完毕。

    6. start函数

    template <typename F, typename... Args> inline auto ThreadPool::start(F&& f, Args&&... args) -> std::future<decltype(std::forward<F>(f)(std::forward<Args>(args)...))> { using ReturnType = decltype(std::forward<F>(f)(std::forward<Args>(args)...)); auto task = std::make_shared<std::packaged_task<ReturnType()>>( std::bind(std::forward<F>(f), std::forward<Args>(args)...)); { std::unique_lock<std::mutex> lock{mutex}; if (stop) { throw std::runtime_error("start task on stopped ThreadPool"); } taskQueue.emplace([task] { (*task)(); }); } condition.notify_one(); return task->get_future(); }

    start函数将一个任务(函数)添加到任务队列中,并通过std::future获得该任务的返回值。

    std::packaged_task打包一个可调用目标(如函数,lambda表达式,bind表达式或其他函数对象),它的返回值可以通过std::future获得。

    使用智能指针std::shared_ptr共享std::packaged_task对象(因为它不可拷贝,且在lambda表达式中被共享)。

    最后通过std::condition_variable通知线程池中的线程有新任务到达。

    测试

    简单的测试代码:

    #include <chrono> #include <iostream> #include <vector> #include "ThreadPool.h" constexpr int n = 20'000; void task(int arg) { for (volatile int i = 0; i != arg; i++) { ; } } void testThreadPool() { std::vector<std::future<void>> ret; ThreadPool pool; auto begin = std::chrono::high_resolution_clock::now(); for (volatile int i = 0; i != n; i++) { ret.emplace_back(pool.start(task, 10'000)); } for (auto& future : ret) { future.get(); } auto end = std::chrono::high_resolution_clock::now(); auto time = std::chrono::duration_cast<std::chrono::milliseconds>(end - begin); std::cout << "thread pool: " << time.count() / 1000.0 << "s\n"; } void testThread() { std::vector<std::thread> ret; auto begin = std::chrono::high_resolution_clock::now(); for (volatile int i = 0; i != n; i++) { ret.emplace_back(task, 10'000); } for (auto& thread : ret) { thread.join(); } auto end = std::chrono::high_resolution_clock::now(); auto time = std::chrono::duration_cast<std::chrono::milliseconds>(end - begin); std::cout << "only thread: " << time.count() / 1000.0 << "s\n"; } int main() { using namespace std::literals; testThread(); std::this_thread::sleep_for(5s); testThreadPool(); }

    可能的输出:

    only thread: 0.985s thread pool: 0.177s

    参考资料

    https://stackoverflow.com/questions/15752659/thread-pooling-in-c11

    https://github.com/progschj/ThreadPool

    https://cppreference.com

    Processed: 0.011, SQL: 8