Python3 zip() 函数
描述
zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存。
我们可以使用 list() 转换来输出列表。
如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将元组解压为列表。
zip 方法在 Python 2 和 Python 3 中的不同:在 Python 2.x zip() 返回的是一个列表。
如果需要了解 Python2 的应用,可以参考 Python zip()。
语法
zip 语法:
zip([iterable, ...])
参数说明:
- iterabl -- 一个或多个迭代器;
返回值
返回一个对象。
实例
以下实例展示了 zip 的使用方法:
>>>a = [1,2,3]
>>> b = [4,5,6]
>>> c = [4,5,6,7,8]
>>> zipped = zip(a,b) # 返回一个对象
>>> zipped
<zip object at 0x103abc288>
>>> list(zipped) # list() 转换为列表
[(1, 4), (2, 5), (3, 6)]
>>> list(zip(a,c)) # 元素个数与最短的列表一致
[(1, 4), (2, 5), (3, 6)]
>>> a1, a2 = zip(*zip(a,b)) # 与 zip 相反,zip(*) 可理解为解压,返回二维矩阵式
>>> list(a1)
[1, 2, 3]
>>> list(a2)
[4, 5, 6]
>>>
Conan
103***7367@qq.com
机器学习模型训练中,经常需要打乱数据集,用 zip() 函数可以实现如下:
输出结果(因未设置随机种子seed,因此每次运行结果可能不一样):
Conan
103***7367@qq.com
What_how_why
252***7579@qq.com
@Conan 非常感谢你让我了解到zip在处理数据方面的作用。
但美中不足的是你的代码不能实现数据的打乱。
将样本和标签一一对应组合起来,并转换成 list 类型方便后续打乱操作 random.shuffle(zipped_data) 。
原因:在上面的这行代码中,你将打乱操作放到注释里了。
重新整理如下:
我还有一个问题,如果真正的在机器学习模型训练中,将样本和标签一 一对应组合起来,是使用一下代码吗?
但是在上述代码中,写x序列比较麻烦,可以采用以下代码:
What_how_why
252***7579@qq.com
K
shu***.luo@qq.com
enumerate() 函数返回的是一个索引序列(对象),所以你第三段代码末尾
enumerate(x, start = 1)
只实现了zip(x, y)
, 若想实现zipped_data = list(zip(x, y))
你需要将这句修改为zipped_data = list(enumerate(x, start = 1)
。K
shu***.luo@qq.com