Địa chỉ truy cập mặc định

Địa chỉ truy cập mặc định, hay default document là một thuật ngữ, gọi đến một file nhất định trong thư mục, được truy xuất khi người dùng gửi một yêu cầu truy cập web tới thư mục này. Khi đó, địa chỉ truy cập mặc định vào thư mục sẽ không cần phải đính kèm theo tên file.

Ví dụ, khi bạn truy cập địa chỉ https://vietnap.vn/ và địa chỉ https://vietnap.vn/index.php sẽ ra kết quả giống nhau. Đó là do default document trong thư mục chính ở trang web vietnap.net đã được thiết lập là index.php

Tại sao nên thiết lập địa chỉ truy cập mặc định mà không ghi luôn vào URL khi truy cập?

Cải thiện trải nghiệm người dùng (UX)

Lợi ích rõ ràng nhất về mặt người dùng là dễ nhớ hơn, không phải đánh nhiều chữ khi truy cập vào một website. Hay đặc biệt với người Việt, chúng ta sử dụng các bộ gõ tiếng Việt khác nhau, việc không phải điền tên file đầy đủ sẽ giúp giảm bớt việc gõ sai địa chỉ, gây khó chịu cho người dùng.

Thông thường, địa chỉ truy cập mặc định sẽ có tên là index.htm, index.html, index.php… Tên này đã được thiết lập sẵn trong cấu hình mặc định của web server.

Tối ưu hoá cho công cụ tìm kiếm và AI

Xét về mặt hệ thống, ngày nay, các công cụ tìm kiếm hay trí tuệ nhân tạo có thể ghé thăm trang web của bạn nhiều lần. Việc phải truy cập đầy đủ tên file sẽ khiến cho các công cụ này phải tiêu tốn nhiều tài nguyên hệ thống hơn để lưu trữ thông tin. Tài nguyên là chi phí, các công cụ tìm kiếm này sẽ yêu thích những địa chỉ web đơn giản hơn là phức tạp. Kết quả là nó sẽ ghé thăm các địa chỉ đơn giản nhiều lần hơn, với tần suất cao hơn, thay vì phải xử lý một địa chỉ web phức tạp tốn nhiều thời gian.

Có thể bạn nghĩ một địa chỉ thì đâu đáng bao nhiêu. Nhưng nó không đơn giản vậy. Một địa chỉ được các công cụ tìm kiếm ghé thăm nhiều lần. Mỗi lần sẽ đọc và so sánh lại với dữ liệu hiện có. Tuỳ thuộc vào cấu hình của cơ sở dữ liệu mà các công cụ này có thể lưu trữ nhiều bản dữ liệu khác nhau, đặc biệt là với các công cụ AI hiện nay, các bản dữ liệu luôn được cập nhật để tăng cường tính chính xác.

Tăng cường tính bảo mật

Một thực tế đáng buồn hiện nay là nhiều bạn trẻ vọc các công cụ trên mạng, phá các website, nhưng không thực sự hiểu về các ngôn ngữ lập trình. Việc loại bỏ các phần mở rộng file, như .php, .asp có thể giúp ẩn bớt đi thông tin về ngôn ngữ lập trình mà website đang dùng. Có thể ngôn ngữ đó đang tồn tại một lỗ hổng bảo mật mà người quản trị máy chủ chưa nâng cấp.

Giảm sai sót khi chuyển đổi công nghệ

Bạn đang chuyển website cũ, được viết bằng HTML sang một CMS như WordPress. Khi đó, truy cập vào file index.html cũ sẽ không hoạt động đúng như với index.php của WordPress. Nếu như có ai trước đó đã giới thiệu website của bạn với địa chỉ http://domain/index.html thì hiện nay, ghé thăm địa chỉ đó sẽ bị báo lỗi link hỏng 404, làm mọi người lầm tưởng website của bạn không còn hoạt động. Việc chỉ lưu địa chỉ http://domain/ sẽ tránh được sai sót này.

Cách thiết lập địa chỉ truy cập mặc định như thế nào?

Có thể thiết lập trực tiếp trong cấu hình web server, hoặc qua .htaccess với các web server có hỗ trợ.

Với Apache, có hỗ trợ .htaccess

  1. Trong thư mục bạn muốn cấu hình, tạo một file có tên .htaccess (lưu ý dấu chấm đầu tên)
  2. Viết nội dung như sau:

DirectoryIndex index.php index.html home.html

Thứ tự truy cập là mức độ ưu tiên.

  • Nếu file index.php tồn tại, nó sẽ được xử lý đầu tiên, và bỏ qua các file phía sau.
  • Nếu file index.php không tồn tại, web server sẽ tiếp tục tìm đến file index.html…

Với OpenLitespeed (OLS) và Litespeed

Hai phần mềm web server này cũng hỗ trợ .htaccess, bạn có thể thiết lập cấu hình như trên. Tuy nhiên, OLS chỉ đọc dữ liệu ở lần khởi động đầu tiên. Do vậy, nếu có sửa đổi nội dung file .htaccess, bạn cần reload lại OLS để nó đọc dữ liệu mới. Có thể thiết lập cronjob để đọc tự động nếu có thay đổi liên tục, hay nhiều file .htaccess thay đổi ở các thời điểm khác nhau mà bạn không kiểm soát hết. Ví dụ xem tại đây với việc thiết lập cronjob kiểm tra .htaccess trên máy chủ sử dụng DirectAdmin và OpenLitespeed .

Với NGINX

NGINX có thể cài đặt chạy trực tiếp, hoặc làm proxy cho Apache.

Với chế độ NGINX reverse proxy, do có Apache chạy sau NGINX proxy, bạn có thể theo hướng dẫn trên áp dụng cho Apache. NGINX sẽ chuyển tiếp yêu cầu đọc đến Apache để xử lý theo nội dung file .htaccess.

Còn nếu chỉ có NGINX, không hỗ trợ .htaccess, bạn cần sửa đổi trong file cấu hình web server. Tìm đến file cấu hình cho website bạn đang muốn sửa đổi, tìm cấu hình location

location / {
root /home/user_xxx/public_html;
index index.php index.html index.htm;
}

Lưu ý khi cấu hình địa chỉ truy cập mặc định

  • Thứ tự ưu tiên xử lý từ trái sang phải. Khi web server đã tìm thấy một file tồn tại, các files phía sau sẽ được bỏ qua, không tiếp tục xử lý. Hãy đặt file sử dụng nhiều nhất lên đầu để giảm bớt thời gian web server phải tìm kiếm, giúp giảm chỉ số TTFB trong web vitals.
  • Lưu ý bảo mật: Nên luôn có một file default document trong mỗi thư mục. Nếu không có địa chỉ truy cập mặc định, và cấu hình web server cho phép hiển thị file trong thư mục, toàn bộ danh sách các files có thể bị phơi bày khi người dùng truy cập vào thư mục đó, dẫn đến việc rò rỉ dữ liệu.