对于一个有序序列,可以通过索引的方法来访问对应位置的值。字符串便是一个有序序列的例子,Python使用 []
来对有序序列进行索引。
s = "hello world"
s[0]
Python中索引是从 0
开始的,所以索引 0
对应与序列的第 1
个元素。为了得到第 5
个元素,需要使用索引值 4
。
s[4]
除了正向索引,Python还引入了负索引值的用法,即从后向前开始计数,例如,索引 -2
表示倒数第 2
个元素:
s[-2]
单个索引大于等于字符串的长度时,会报错:
s[11]
分片用来从序列中提取出想要的子序列,其用法为:
var[lower:upper:step]
其范围包括 lower
,但不包括 upper
,即 [lower, upper)
, step
表示取值间隔大小,如果没有默认为1
。
s
s[1:3]
分片中包含的元素的个数为 3-1=2
。
也可以使用负索引来指定分片的范围:
s[1:-2]
包括索引 1
但是不包括索引 -2
。
lower和upper可以省略,省略lower意味着从开头开始分片,省略upper意味着一直分片到结尾。
s[:3]
s[-3:]
s[:]
每隔两个取一个值:
s[::2]
当step的值为负时,省略lower意味着从结尾开始分片,省略upper意味着一直分片到开头。
s[::-1]
当给定的upper超出字符串的长度(注意:因为不包含upper,所以可以等于)时,Python并不会报错,不过只会计算到结尾。
s[:100]
[low, up)
形式的原因¶假设需要表示字符串 hello
中的内部子串 el
:
方式 | [low, up) |
(low, up] |
(lower, upper) |
[lower, upper] |
---|---|---|---|---|
表示 | [1,3) |
(0,2] |
(0,3) |
[1,2] |
序列长度 | up - low |
up - low |
up - low - 1 |
up - low + 1 |
对长度来说,前两种方式比较好,因为不需要烦人的加一减一。
现在只考虑前两种方法,假设要表示字符串hello
中的从头开始的子串hel
:
方式 | [low, up) |
(low, up] |
---|---|---|
表示 | [0,3) |
(-1,2] |
序列长度 | up - low |
up - low |
第二种表示方法从-1
开始,不是很好,所以选择使用第一种[low, up)
的形式。
Just too beautiful to ignore.
----Guido van Rossum
两种简单的情况:
从头开始的n个元素;
[0, n)
[1, n+1)
第i+1
个元素到第i+n
个元素。
[i, n+i)
[i+1, n+i+1)
1-base有个+1
部分,所以不推荐。
综合这两种原因,Python使用0-base的方法来进行索引。