Tin Học 10 - Kết Nối Tri Thức - Bài 3: Một Số Kiểu Dữ Liệu Và Dữ Liệu Văn Bản
Chào các bạn học sinh, nhằm cung cấp những kiến thức hiệu quả về tin học lớp 10 cho các bạn giúp cho các em học sinh dễ dàng tiếp cận nhanh tin học, thông tin xử lý trong máy tính hiện đại để vận dụng trong chương trình Tin Học. Trong bài viết này mình sẽ hướng dẫn cho bạn chi tiết Tin Học 10 - Kết Nối Tri Thức - Bài 3: Một Số Kiểu Dữ Liệu Và Dữ Liệu Văn Bản. Hãy cùng mình tham khảo bên dưới!
Video hướng dẫn
Mục tiêu bài học
- Nhận biết được các kiểu dữ liệu trong chương trình tin học.
- Biết được các bảng mã thông dụng (ASCII, Unicode,..)
- Giải thích sơ lược một số hóa văn bản.
1. Phân loại và biểu diễn thông tin trong máy tính
a. Phân loại dữ liệu
Dữ liệu được phân thành các loại: Văn bản (kí tự, dòng chữ), số, logic, dạng đa phương tiện (âm thanh, hình ảnh),...
Khi đưa vào máy tính thông tin chuyển thành dữ liệu thì khi đó dữ liệu trên máy được phân loại phù hợp với các phép xử lí trong máy tính.
Ví dụ: Khi bạn gõ một nội dung: "Hello" vào máy tính. Khi đưa vào máy tính, dữ liệu sẽ được biểu diễn thông tin sang dạng nhị phân: 1001110100101.
Bảng biểu diễn kí tự và dãy bit
Ký tự | Dãy bit biểu diễn |
A | 0100 0001 |
B | 0100 0010 |
C | 0100 0011 |
D | 0100 0100 |
E | 0100 0101 |
F | 0100 0110 |
G | 0100 0111 |
H | 0100 1000 |
I | 0100 1001 |
J | 0100 1010 |
K | 0100 1011 |
L | 0100 1100 |
M | 0100 1101 |
N | 0100 1110 |
O | 0100 1111 |
Ví dụ 2: Dựa vào bảng biểu diễn trên, hãy biểu diễn kí tự "Coffee" thành các dãy bit?
Coffee => 01000011 01001111 01000110 01000110 01000101 01000101
Cách tính số ký tự được mã hóa dựa vào số bit
Số bit | Số kí tự được mã hóa | Dãy bit biểu diễn |
2 bit | 2 mũ 2 (= 4 ký tự) | 00, 01, 10, 11 |
3 bit | 2 mũ 3 ( = 8 ký tự) | 000, 001,010, 011, 100, 110, 101, 111 |
4 bit | 2 mũ 4 ( = 16 ký tự) | 0000, 0001, 0010, 0011, 0100, 0101, 0111, 0110,1000,1001,1010,1011,1111,1100,1101,1110,0111 |
7 bite | 2 mũ 7 (= 128 ký tự) | |
1 byte (8 bit) | 2 mũ 8 ( = 256 ký tự) | |
2 byte | 2 mũ 16 (= 65536 ký tự) | |
3 byte | 2 mũ 24 | |
4 byte | 2 mũ 32 |
Biểu diễn dữ liệu văn bản
a. Bảng mã ASCII
Ban đầu bảng mã này dùng các mã 7 bit, với 128 mã khác nhau chỉ thể hiện đúng 128 kí tự.
- Bảng mã 7 bit chỉ đủ dùng cho tiếng Anh trong khi nhiều quốc gia dùng kí tự riêng, như Trung Quốc, Hy Lạp, …
⇒ Người ta mở rộng bảng mã 7 bit thành bảng mã 8 bit gọi là ASCII mở rộng cho phép mã hóa 256 kí tự.
b. Bảng mã Unicode và tiếng việt trong Unicode
Bảng mã Unicode
Bao gồm:
Phương pháp mã hóa UTF-8
- 1 byte: Mã hóa ký tự Latinh không dấu.
- 2 byte: Mã hóa các nguyên âm có dấu và chữ đ Đ.
- 3 byte: Mã hóa các ký tự đặc biệt.
Ví dụ: "A" = 01000001
Phương pháp mã hóa UTF-16
- 2 byte: 65535 kí tự.
- 4 byte: Ký tự bổ sung
Ví dụ: "A" = 00000000 01000001
Phương pháp mã hóa UTF-32
- 4 byte: Gồm tất cả ký tự
Ví dụ: "A" = 00000000 00000000 00000000 01000001
c. Số hóa văn bản
- Tệp văn bản là định dạng lưu trữ ở bộ nhớ ngoài.
- Số hóa văn bản được thực hiện trên các phần mềm soạn thảo văn bản như Word, Writer,...
Vậy là mình đã hướng dẫn xong Bài 3: Một Số Kiểu Dữ Liệu Và Dữ Liệu Văn Bản. Tiếp theo, mời bạn qua Bài 4: Hệ Nhị Phân Và Dữ Liệu Số Nguyên
Xem thêm:
CHO ĐIỂM BÀI VIẾT NÀY