07-遍历目录树
10.2 遍历目录树
假定你希望对某个文件夹中的所有文件进行重命名,包括该文件夹中所有子文件夹中的所有文件。也就是说,你希望遍历目录树,并处理遇到的每个文件。写程序完成这件事可能需要一些技巧,好在Python提供了一个函数可以替你处理这个过程。
请看C:\delicious文件夹及其内容,如图10-1所示。
这里有一个示例程序,针对图10-1所示的目录树,使用了 os.walk() 函数:
import os
for folderName, subfolders, filenames in os.walk('C:\\delicious'):
print('The current folder is ' + folderName)
for subfolder in subfolders:
print('SUBFOLDER OF ' + folderName + ': ' + subfolder)
for filename in filenames:
print('FILE INSIDE ' + folderName + ': '+ filename)
print('')

os.walk() 函数被传入一个字符串值,即一个文件夹的路径。你可以在一个 for 循环语句中使用 os.walk() 函数遍历目录树,就像使用 range() 函数遍历某个范围的数字一样。不像 range() , os.walk() 在循环的每次迭代中返回以下3个值。
- 当前文件夹名称的字符串。
- 当前文件夹中子文件夹的字符串的列表。
- 当前文件夹中文件的字符串的列表。
所谓当前文件夹,是指 for 循环时迭代的文件夹。程序的当前工作目录不会因为 os.walk() 而改变。
就像你可以在代码 for i in range(10): 中选择变量名称 i 一样,你也可以选择前面列出来的 3 个变量名称。我通常使用 foldername 、 subfolder 和 filename来表示它们 。
运行该程序,它的输出结果如下:
The current folder is C:\delicious
SUBFOLDER OF C:\delicious: cats
SUBFOLDER OF C:\delicious: walnut
FILE INSIDE C:\delicious: spam.txt
The current folder is C:\delicious\cats
FILE INSIDE C:\delicious\cats: catnames.txt
FILE INSIDE C:\delicious\cats: zophie.jpg
The current folder is C:\delicious\walnut
SUBFOLDER OF C:\delicious\walnut: waffles
The current folder is C:\delicious\walnut\waffles
FILE INSIDE C:\delicious\walnut\waffles: butter.txt.
因为 os.walk() 返回字符串的列表,并且将其保存在 subfolder 和 filename 变量中,所以你可以在它们自己的 for 循环中使用这些列表。用你自己编写的代码,取代 print() 函数调用(或者如果不需要,就删除 for 循环)。