[Python] Pandas df.iterrow 平行处理

用户投稿发布于2024-05-31

#import pakageimport pandas as pdimport multiprocessing#指定主机有多少CPU，并把df 平均分配sizenum_processes = multiprocessing.cpu_count()chunk_size = int(df.shape[0]/num_processes)#将df 拆解成 num_processes 个 chunk 的df listchunks = [df.ix[df.index[i:i + chunk_size]] for i in range(0, df.shape[0], chunk_size)]

#定义 functiondef myfunc(d):   return d * dpool = multiprocessing.Pool(processes=num_processes)result = pool.map(myfunc, chunks)

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

给这篇文章的作者打赏

关于作者: 网站小编

相关文章

HBO Max vs.Netflix：当你负担不起两者时如何选择

课内笔记整理---作业系统实务(资安相关篇)

excel vba捞网页数据问题

热门文章

1[Python] Pandas df.iterrow 平行处理

2【C#、Dapper】 小技巧、研究 #1 : QueryFirstOrDefault

3[Python]B03─运算子(operator)

4[Python]B04─简单类别(simple type)

5[Python]B05─资料结构(data structure)

2【C#、Dapper】小技巧、研究 #1 : QueryFirstOrDefault