Tin Học 10 - Kết Nối Tri Thức - Bài 3: Một Số Kiểu Dữ Liệu Và Dữ Liệu Văn Bản

Chào các bạn học sinh, nhằm cung cấp những kiến thức hiệu quả về tin học lớp 10 cho các bạn giúp cho các em học sinh dễ dàng tiếp cận nhanh tin học, thông tin xử lý trong máy tính hiện đại để vận dụng trong chương trình Tin Học. Trong bài viết này mình sẽ hướng dẫn cho bạn chi tiết Tin Học 10 - Kết Nối Tri Thức - Bài 3: Một Số Kiểu Dữ Liệu Và Dữ Liệu Văn Bản. Hãy cùng mình tham khảo bên dưới!

Video hướng dẫn

Mục tiêu bài học

  • Nhận biết được các kiểu dữ liệu trong chương trình tin học.
  • Biết được các bảng mã thông dụng (ASCII, Unicode,..)
  • Giải thích sơ lược một số hóa văn bản.

1. Phân loại và biểu diễn thông tin trong máy tính

a. Phân loại dữ liệu

Dữ liệu được phân thành các loại: Văn bản (kí tự, dòng chữ), số, logic, dạng đa phương tiện (âm thanh, hình ảnh),...

Khi đưa vào máy tính thông tin chuyển thành dữ liệu thì khi đó dữ liệu trên máy được phân loại phù hợp với các phép xử lí trong máy tính.

Ví dụ: Khi bạn gõ một nội dung: "Hello" vào máy tính. Khi đưa vào máy tính, dữ liệu sẽ được biểu diễn thông tin sang dạng nhị phân: 1001110100101.

Bảng biểu diễn kí tự và dãy bit

Ký tự Dãy bit biểu diễn
A 0100 0001
B 0100 0010
C 0100 0011
D 0100 0100
E 0100 0101
F 0100 0110
G 0100 0111
H 0100 1000
I 0100 1001
J 0100 1010
K 0100 1011
L 0100 1100
M 0100 1101
N 0100 1110
O 0100 1111

Ví dụ 2: Dựa vào bảng biểu diễn trên, hãy biểu diễn kí tự "Coffee" thành các dãy bit?

Coffee => 01000011 01001111 01000110 01000110 01000101 01000101

Cách tính số ký tự được mã hóa dựa vào số bit

Số bit Số kí tự được mã hóa Dãy bit biểu diễn
2 bit 2 mũ 2 (= 4 ký tự) 00, 01, 10, 11
3 bit 2 mũ 3 ( = 8 ký tự) 000, 001,010, 011, 100, 110, 101, 111
4 bit 2 mũ 4 ( = 16 ký tự) 0000, 0001, 0010, 0011, 0100, 0101, 0111, 0110,1000,1001,1010,1011,1111,1100,1101,1110,0111
7 bite 2 mũ 7 (= 128 ký tự)  
1 byte (8 bit) 2 mũ 8 ( = 256 ký tự)  
2 byte 2 mũ 16 (= 65536 ký tự)  
3 byte 2 mũ 24  
4 byte 2 mũ 32  

Biểu diễn dữ liệu văn bản 

a. Bảng mã ASCII

Ban đầu bảng mã này dùng các mã 7 bit, với 128 mã khác nhau chỉ thể hiện đúng 128 kí tự.

- Bảng mã 7 bit chỉ đủ dùng cho tiếng Anh trong khi nhiều quốc gia dùng kí tự riêng, như Trung Quốc, Hy Lạp, …

⇒ Người ta mở rộng bảng mã 7 bit thành bảng mã 8 bit gọi là ASCII mở rộng cho phép mã hóa 256 kí tự.

b. Bảng mã Unicode và tiếng việt trong Unicode

Bảng mã Unicode

Bao gồm:

Phương pháp mã hóa UTF-8

- 1 byte: Mã hóa ký tự Latinh không dấu.

- 2 byte: Mã hóa các nguyên âm có dấu và chữ đ Đ.

- 3 byte: Mã hóa các ký tự đặc biệt.

Ví dụ: "A" = 01000001

Phương pháp mã hóa UTF-16

- 2 byte: 65535 kí tự.

- 4 byte: Ký tự bổ sung

Ví dụ: "A" = 00000000 01000001

Phương pháp mã hóa UTF-32

- 4 byte: Gồm tất cả ký tự

Ví dụ: "A" = 00000000 00000000 00000000 01000001

c. Số hóa văn bản

  • Tệp văn bản là định dạng lưu trữ ở bộ nhớ ngoài.
  • Số hóa văn bản được thực hiện trên các phần mềm soạn thảo văn bản như Word, Writer,...

Vậy là mình đã hướng dẫn xong Bài 3: Một Số Kiểu Dữ Liệu Và Dữ Liệu Văn Bản. Tiếp theo, mời bạn qua bài 4.

CHO ĐIỂM BÀI VIẾT NÀY

vote data

HÌNH ẢNH HỌC VIÊN

học vi tính văn phòng trung tâm tin học Sao Việt học máy vi tính văn phòng trung tâm dạy tin học văn phòng lớp học máy tính văn phòng khóa học tin học Excel khóa học tin học văn phòng khóa học sử dụng máy vi tính học vi tính cho người đi làm khóa học tin học văn phòng khóa học sử dụng máy tính khóa học vẽ Autocad 2D - 3D