Trong bài viết này chúng ta sẽ tìm hiểu mọi thứ liên quan đến kiểu dữ liệu Set trong Python như: cách khởi tạo Set, thêm hoặc xóa các thành phần tử ra khỏi Set, và tất cả các hoạt động được thực hiện trên Set trong Python.
1. Tìm hiểu Set trong Python là gì?
Set là một tập các phần tử dữ liệu không có thứ tự, mỗi phần tử là duy nhất (không trùng lặp) và phải bất biến (không thể thay đổi). Tuy nhiên chúng ta có thể thêm hoặc xóa các phần tử ra khỏi Set một cách dễ dàng.
Cú pháp
Sau đây là cú pháp tạo Set trong Python.
1
|
my_set = {element_1, element_2, element_3, ...} |
Trong đó mỗi element là một phần tử và có thể có thuộc nhiều kiểu dữ liệu khác nhau, không nhất thiết phải đồng nhất.
Vì các phần tử không thể thay đổi giá trị nên Set không cho phép lưu trữ kiểu List hoặc Dictionary.
1
2
3
4
5
6
7
|
# set of integers my_set = { 1 , 2 , 3 } print (my_set) # set of mixed datatypes my_set = { 1.0 , "Hello" , ( 1 , 2 , 3 )} print (my_set) |
Như bạn thấy, ở ví dụ đầu tiên thì mình truyền dữ liệu đơn giản, còn ở ví dụ thứ hai thì có thểm kiểu Tuple.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
# set do not have duplicates # Output: {1, 2, 3, 4} my_set = { 1 , 2 , 3 , 4 , 3 , 2 } print (my_set) # set cannot have mutable items # here [3, 4] is a mutable list # If you uncomment line #12, # this will cause an error. # TypeError: unhashable type: 'list' #my_set = {1, 2, [3, 4]} # we can make set from a list # Output: {1, 2, 3} my_set = set ([ 1 , 2 , 3 , 2 ]) print (my_set) |
Ở ví dụ này mình đã cố tình truyền dữ liệu bị trùng và kết quả là nó lọc hết chỉ giữ lại 1 giá trị bị trùng mà thôi. Nếu bạn bỏ đi phần comment ở dòng 12 thì sẽ bị báo lỗi vì ta không thể lưu trữ List bên trong Set. Ở ví dụ cuối cùng là mình đã khởi tạo một Set từ List chứ không phải tạo phần tử Set chứa kiểu dữ liệu List đâu nhé, đừng nhầm lẫn đoạn đó.
Khởi tạo Set rỗng
Việc khởi tạo Set rỗng sẽ có chút nhầm lẫn, việc sử dụng cặp {} sẽ gây hiểu lầm với kiểu dữ liệu Dictionary, vì vậy để khởi tạo một Set rỗng thì nên sử dụng đối tượng Set() và không truyền bất kì đối số nào vào.
1
2
3
4
5
6
7
8
9
10
11
12
13
|
# initialize a with {} a = {} # check data type of a # Output: <class 'dict'> print ( type (a)) # initialize a with set() a = set () # check data type of a # Output: <class 'set'> print ( type (a)) |
2. Làm thế nào để thay đổi Set trong Python?
Set không phải là kiểu dữ liệu có chỉ mục nên việc truy xuất thông qua chỉ mục index là điều không thể. Tuy nhiên nó hỗ trợ một số phương thức giúp ban làm điều này.
- add() dùng để thêm phần tử
- update() dùng để cập nhật phần tử
Hãy đọc kỹ phần ví dụ dưới đây sẽ giúp bạn hiểu rõ hơn.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
# initialize my_set my_set = { 1 , 3 } print (my_set) # if you uncomment line 9, # you will get an error # TypeError: 'set' object does not support indexing #my_set[0] # add an element # Output: {1, 2, 3} my_set.add( 2 ) print (my_set) # add multiple elements # Output: {1, 2, 3, 4} my_set.update([ 2 , 3 , 4 ]) print (my_set) # add list and set # Output: {1, 2, 3, 4, 5, 6, 8} my_set.update([ 4 , 5 ], { 1 , 6 , 8 }) print (my_set) |
Chạy lên kết quả sẽ như sau:
1
2
3
4
|
{ 1 , 3 } { 1 , 2 , 3 } { 1 , 2 , 3 , 4 } { 1 , 2 , 3 , 4 , 5 , 6 , 8 } |
3. Làm sao để xóa phần tử ra khỏi Set
Để loại bỏ phần tử ra khỏi Set thì ta sử dụng hai phương thức discard()
và remove()
. Cả hai đều có chung một mục đích, tuy nhiêm điểm khác biệt là với discard()
thì sẽ không sinh lỗi nếu giá trị cần xóa không tồn tại, còn remove()
thì sẽ sinh lỗi.
Ví dụ dưới đây sẽ minh họa cho điều này:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
|
# initialize my_set my_set = { 1 , 3 , 4 , 5 , 6 } print (my_set) # discard an element # Output: {1, 3, 5, 6} my_set.discard( 4 ) print (my_set) # remove an element # Output: {1, 3, 5} my_set.remove( 6 ) print (my_set) # discard an element # not present in my_set # Output: {1, 3, 5} my_set.discard( 2 ) print (my_set) # remove an element # not present in my_set # If you uncomment line 27, # you will get an error. # Output: KeyError: 2 #my_set.remove(2) |
Tương tự, chúng ta có thể xóa và trả về phần tử đã xóa bằng phươn thức pop()
, hoặc xóa toàn bộ phần tử bằng phương thức clear()
.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
# initialize my_set # Output: set of unique elements my_set = set ( "HelloWorld" ) print (my_set) # pop an element # Output: random element print (my_set.pop()) # pop another element # Output: random element my_set.pop() print (my_set) # clear my_set #Output: set() my_set.clear() print (my_set) |
4. Các hành động thường gặp trên Set
Set có thể sử dụng với nhiều phép toán như liên kết, hợp, … bằng cách sử dụng các toán tử và phương thức mà nó hỗ trợ sẵn.
Set union
Toán tử union kí hiệu là |
.
1
2
3
4
5
6
7
|
# initialize A and B A = { 1 , 2 , 3 , 4 , 5 } B = { 4 , 5 , 6 , 7 , 8 } # use | operator # Output: {1, 2, 3, 4, 5, 6, 7, 8} print (A | B) |
Set Intersection
Phép giao intersection ký hiệu là &
.
1
2
3
4
5
6
7
|
# initialize A and B A = { 1 , 2 , 3 , 4 , 5 } B = { 4 , 5 , 6 , 7 , 8 } # use & operator # Output: {4, 5} print (A & B) |
Set Difference
Phép Difference kí hiệu là -
.
# initialize A and B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # use - operator on A # Output: {1, 2, 3} print(A - B)
Set Symmetric Difference
Toán tử Set Symmetric Difference kí hiệu là ^
.
# initialize A and B A = {1, 2, 3, 4, 5} B = {4, 5, 6, 7, 8} # use ^ operator # Output: {1, 2, 3, 6, 7, 8} print(A ^ B)
5. Một vài thao tác khác trên Set
Bây giờ mình sẽ làm một vài ví dụ về các thao tác khác thường gặp trên Set, đây là những thao tác được sử dụng rất nhiều khi bạn làm việc với Python.
Kiểm tra phần tử tồn tại trong Set
Để kiểm tra một phần tử có tồn tại không trong Set thì ta sử dụng toán tử in
, toán tử này được sử dụng khá nhiều, hầu như tất cả các loại dữ liệu đều có.
1
2
3
4
5
6
7
8
9
10
|
# initialize my_set my_set = set ( "apple" ) # check if 'a' is present # Output: True print ( 'a' in my_set) # check if 'p' is present # Output: False print ( 'p' not in my_set) |
Lặp qua các phần tử của Set
Để lặp qua các phần tử của Set thì ta có thể sử dụng vòng lặp for, đây là vòng lặp được sử dụng nhiều nhất trong Python.
1
2
3
4
5
6
7
|
>>> for letter in set ( "apple" ): ... print (letter) ... a p e l |
6. Lời kết
Như vậy là mình đã giới thiệu xong kiến thức cơ bản về tập hợp Set trong Python.
Bạn cần lưu ý rằng với Set thì không thể thay đổi giá trị của các phần tử, bản chất khi sử dụng phương thức udpate là bạn đã bổ sung các phần tử. Tuy nhiên bạn có thể thực hiện các thao tác như xóa phần tử.
Nguồn:https://freetuts.net