Python每天3分钟 – 批量合并不同文件夹内的多个csv文件-友码网

欢迎访问Python每天3分钟系列。

每天花3分钟时间，学习或温习一个Python知识点。

经过几天的考虑，我决定从每天更新改成每周5次更新。这个频率不再改变，至少更新到第199篇。感谢大家的支持！

今天是第033篇：

批量合并不同文件夹内的多个csv文件

这是麦友@罗敬芳的留言：

“麦叔，希望学个知识：不同文件夹内的多个csv文件批量合并

这里面有三个知识点：

文件的基本操作：读文件，写文件
对文件夹的驾驭
csv库的使用

我给两个方案，一个简单方案，一个灵活方案。

为了支持简单方案，我们先做如下假设：

这些csv文件格式都是相同的。这个假设对灵活方案也是需要的。
有两个文件夹d1，d2，下面分别放着一个csv文件

目标是把这2个文件合并成一个csv文件。

file1内容：

name,age,score
张三,12,98
李四,14,88
麦叔,15,99

file2内容：

name,age,score
Tom,12,98
Jack,14,88
Marry,15,99

简单实现

下面是一个简单的实现，文件夹和文件的名字都是写死的。虽然不是最好的方案，但对学习还是有帮助的：

import csv 

# 打开结果文件，名为all.csv
with open('all.csv', 'w') as result:
    # 把结果文件转成一个csv写入器对象
    csv_writer = csv.writer(result)

    # 打开第一个文件
    with open('d1/file1.csv') as file:
        # 把源文件转成一个csv读入器
        csvreader = csv.reader(file)
        # 循环读入每一行
        for row in csvreader:
            # 调用写入器写入一行
            csv_writer.writerow(row)
    
    # 打开第2个文件
    with open('d2/file2.csv') as file:
        csvreader = csv.reader(file)
        # 跳过第一行，否则会出现重复的csv文件的头
        next(csvreader)
        for row in csvreader:
            csv_writer.writerow(row) 

print('合并后的结果：')
with open('all.csv') as result:
    for row in result:
        # 注意打印时加上end=''，否则会出现多余的空行
        print(row, end='')

如果在Windows上，生成的csv文件也许会有多余的空行，这时候可以把下面的代码：

with open('all.csv', 'w') as result:

改成：

with open('all.csv', 'w', newline='') as result:

注意里面有段逻辑是防止文件header重复。

好一点的方案

下面这个方案要灵活多了。可以自己定义多个文件夹，还可以支持文件夹下任意数量的csv文件：

import csv 
from os import listdir

# 目录列表
dirs = ['d1', 'd2']

# 打开结果文件
with open('all.csv', 'w') as result:
    # 把结果文件转成一个csv写入器对象
    csv_writer = csv.writer(result)
    # 判定是否已经添加了header行
    is_header_added = False 

    # 循环目录
    for dir in dirs:
        # 循环目录中所有的文件
        for filename in listdir(dir):
            # 找到csv文件
            if filename.endswith('.csv'):
                with open(f'{dir}/{filename}') as file:
                    csvreader = csv.reader(file)

                    # 读取文件的header行
                    header = next(csvreader)
                    # 目标文件只添加一次header
                    if not is_header_added:
                        csv_writer.writerow(header)
                        is_header_added = True 

                    # 添加数据行
                    for row in csvreader:
                        csv_writer.writerow(row)               

print('合并后的结果：')
with open('all.csv') as result:
    for row in result:
        # 注意打印时加上end=''，否则会出现多余的空行
        print(row, end='')

注释写的还算清楚，这里就不多说了。

这个方案应该算比较灵活了，例子中是用的相对路径，假设目录就在当前运行Python的目录下。如果把目录改成绝对路径应该也是可以的。

今天大大超过3分钟了，就说到这里，有问题给我留言。

最近更新：

Python每天3分钟 – #032

Python每天3分钟 – #031

Python每天3分钟 – #030

声明：本网站资源来源于网络收集，如有侵权，请联系站长进行删除处理。分享目的仅供大家学习和交流，请不要用于商业用途，否则后果自负。本站提供的源码、模板、插件等等其他资源，都不包含技术服务请大家谅解。本站资源售价只是赞助，收取费用仅维持本站的日常运营所需。反馈邮箱：1159995880@qq.com

Python每天3分钟 – 批量合并不同文件夹内的多个csv文件

批量合并不同文件夹内的多个csv文件

简单实现

好一点的方案

评论(0)

提示：请文明发言取消回复

近期文章

文章展示

地方门户分类信息网站源码城市信息聚合系统PHP语言

【地方房产系统】开源系统多城市房产房市营销推广系统源码修复版自适应移动端

帝国CMS简单大气淘宝客导购淘宝优惠券网站源码下载 HTML5响应式

WordPress主题、tob主题自适应响应式图片模板、种图片展示网站、新闻站

Thinkphp内核开发百分百收卡网二手礼品卡兑换回收网站源码下载

新版设计图稿素材资源下载站源码

排行榜展示

eyoucms破解授权，易优cms破解授权，易优cms专业版破解

Modown素材资源付费下载站WordPress主题模板

2025最新萤火商城小程序v2.1.2开源版+uniapp前端

PHP进销存源码 ERP多仓库管理系统源码手机端+小程序版进销存全开源可二开 uniapp

最新修复版熊猫办公源码/帝国CMS内核完整的PPT素材整站源码

php源码多城市同城信息分类服务网站模板

淘宝客+京东+拼多多三合一返佣系统：含公众号微信端+H5端+封装APP，带详细搭建教程

站长推荐——良心、好用到爆的十个网站，每一个都值得收藏！

Python每天3分钟 – 批量合并不同文件夹内的多个csv文件

批量合并不同文件夹内的多个csv文件

简单实现

好一点的方案

相关文章

评论(0)

提示：请文明发言 取消回复

近期文章

文章展示

排行榜展示

提示：请文明发言取消回复