Mã hóa URL là gì

URL mã hóa URL là quá trình dịch các ký tự không an toàn và không hợp lệ thành một đại diện rõ ràng và được chấp nhận rộng rãi bởi các trình duyệt web và máy chủ, tức là thành một định dạng URL hợp lệ. Định dạng URL hợp lệ có nghĩa là URL chỉ chứa các ký tự hợp lệ được chỉ định bởi các thông số kỹ thuật chính thức.

Tiêuchuẩn URL chỉ có thể sử dụng một tập hợp ký tự giới hạn: chữ cái Latinh, số và chỉ một vài dấu chấm câu. Tất cả các ký tự khác cần được mã hóa. Ví dụ, chữ Cyrillic, chữ cái có dấu phụ, chữ ghép, chữ tượng hình nên được mã hóa. Sơ đồ mã hóa phải rõ ràng, có thể đảo ngược và cung cấp các URL hợp lệ. Bộ mã hóa URL thay thế các ký tự ASCII không an toàn bằng “%“ theo sau là hai chữ số thập lục phân. URL không thể chứa khoảng trắng. Đối với khả năng tương tác toàn cầu, URL phải được mã hóa thống nhất.

Bạnđang tìm kiếm một công cụ mã hóa URL? Sau đó, ứng dụng này được thực hiện cho bạn! Sử dụng công cụ mã hóa URL trực tuyến của chúng tôi để mã hóa dữ liệu của bạn!

Một URL có thể bao gồm các từ (tedu.com.vn), hoặc một địa chỉ giao thức internet (IP) (192.68.20.50).

Hầu hết mọi người đều nhập tên trang khi lướt web, vì tên thì dễ nhớ hơn các số.

 

URL – Bộ định vị tài nguyên thống nhất

Các trình duyệt yêu cầu tải trang từ dịch vụ web bằng cách dùng một URL.

Một bộ định vị tài nguyên thống nhất (URL) được sửa dụng để xác định địa chỉ một tài liệu (hoặc dữ liệu khác) trên web.

Một địa chỉ web như https://tedu.com.vn/ tuân theo những quy tắc sau:

scheme://prefix.domain:port/path/filename

Giải thích:

  • scheme - định nghĩa kiểu dịch vụ Internet (thường là HTTP hoặc HTTPS)
  • prefix - phần tiền tố của tên miền (mặc định với HTTPS là www)
  • domain - định nghĩa tên miền (ví dụ tedu.com.vn)
  • port - định nghĩa số cổng tại host (mặc định với HTTP là 80)
  • path - định nghĩa đường dẫn tới máy chủ (nếu bỏ qua thì đây sẽ là thư mục gốc (root) của trang)
  • filename - định nghĩa tên của tập tin hoặc nguồn dữ liệu

 

Các URL Scheme phổ biến

Bảng dưới đây liệt kê một số scheme phổ biến

Scheme

Viết tắt của

Mô tả

http

HyperText Transfer Protocol

Trang web phổ biến, chưa được mã hóa

https

Secure HyperText Transfer Protocol

Trang web bảo mật, đã được mã hóa

ftp

File Transfer Protocol

Tải xuống hoặc tải lên các tệp

file

 

Một tệp trên máy tính

 

Mã hóa URL

Các URL chỉ có thể được gửi qua Internet bằng bộ ký tự ASCII. Nếu một URL chứa các ký tự ngoài bộ mã ASCII, URL đó cần phải được chuyển đổi.

Mã hóa URL chuyển đổi các ký tự không thuộc ASCII về một định dạng có thể truyền qua Internet.

Mã hóa URL thay thế các ký tự không thuộc ASCII bằng một “%” theo sau bởi các số thập lục phân.

Các URL không thể chứa khoảng trắng. Mã hóa URL thường thay thế khoảng trắng bằng dấu cộng (+) hoặc %20.

Thông qua những định nghĩa và ví dụ minh họa, bạn sẽ biết URL là gì? Tại sao phải mã hóa URL? và các giao thức phổ biến trong URL.

Mã hóa URL trong HTML

« Bài TrướcBài Tiếp »

URL là một cách gọi khác của địa chỉ web.

URL có thể là một tên miền (webvn.com) hoặc một địa chỉ IP (192.68.20.50).

Hầu hết mọi người nhập tên miền khi duyệt web bởi vì tên miền dễ nhớ hơn địa chỉ IP.

URL là gì?

URL là chữ viết tắt của Uniform Resource Locator (Định vị Tài nguyên thống nhất).

Trình duyệt gửi yêu cầu phục vụ tới máy chủ chứa web bằng cách sử dụng URL.

Khi bạn nhấp chuột vào một liên kết trong trang HTML, thẻ <a> sẽ dẫn bạn đến một địa chỉ trên web.

URL được dùng để xác định địa chỉ của một tài liệu (hoặc những dữ liệu khác) trên mạng.

Một địa chỉ web như https://webvn.com tuân theo những quy tắc cú pháp sau:

1

scheme://host.domain:port/path/filename

Giải thích:

  • scheme – quy định tên giao thức kết nối tới máy chủ (phổ biến nhất là http)
  • host – quy định tên miền máy chủ, tên miền phụ (tên miền máy chủ mặc định cho http là www)
  • domain – quy định tên miền (webvn.com)
  • port – quy định cổng để truy cập máy chủ (mặc định cho http là cổng 80)
  • path – quy định đường dẫn tới dữ liệu trên máy chủ (nếu bỏ qua thì sẽ trỏ về thư mục gốc của trang web)
  • filename – quy định tên của một tài liệu hoặc tài nguyên

Giao thức phổ biến trong URL

Bảng dưới đây sẽ liệt kê một vài giao thức phổ biến trong URL:

Giao thứcViết đầy đủMiêu tảhttpHyperText Transfer ProtocolCác trang web phổ biến. Không được mã hóa.httpsSecure HyperText Transfer ProtocolCác trang web có bảo mât, được mã hóa.ftpFile Transfer ProtocolTải hoặc gửi tệp tinfile Một tệp tin trong máy tính

Mã hóa URL trong HTML

URL chỉ có thể được tryền qua mạng Internet bằng cách sử dụng bảng mã ký tự ASCII.

Nếu ký tự trong URL không nằm trong bảng mã ASCII nó cần phải được chuyển đổi về ký tự trong bảng mã ASCII.

Mã hóa URL sẽ chuyển đổi các ký tự thành một định dạng có thể được truyền qua mạng Internet.

Mã hóa URL thay thế những ký tự không thuộc bảng mã ASCII bằng dấu “%” kèm theo sau là số hệ thập lục phân.

URL không thể chứa khoảng trống. Mã hóa URL thường thay thế ký tự trống với một dấu cộng (+), hoặc %20.