Phần 17 - Khái Niệm Về Htaccess Va Redirect 301
Htaccess là gì?
Htaccess là một tệp tin cấu hình đặc biệt, htaccess cho phép bạn thay đổi cách hoạt động của máy chủ Apache ở tầng thư mục. Tệp tin htaccess gồm các dòng lệnh, có thể tùy biến theo người dùng, được đặt trong một thư mục nào đó, nó sẽ có tác dụng cho thư mục đó và tất cả các thư mục con. Một trong những ứng dụng phổ biến của htaccess là cho phép viết lại đường dẫn URL (rewrite URL).
Trở lại ứng dụng SEO của htaccess, khi một khách hay bọ tìm kiếm thăm một trang web, máy chủ sẽ kiểm tra tệp tin đặt biệt để tìm các tùy biến của webmaster, bao gồm cả các tùy biến bảo mật. Máy chủ sau đó sẽ thực thi các lệnh tìm thấy trong tệp tin htaccess thường gồm chuyển hướng redirection, bảo mật và báo lỗi.
Redirect 301 là gì?
Chuyển hướng redirect 301 hay redirection 301 thường được hiểu như việc di rời vĩnh viễn (moved permanently). Nó trả về mã lỗi 301 trong phần header nhằm thông báo cho máy tìm kiếm hay trình duyệt, máy chủ rằng trang web hiện tại đã được chuyển rời tới địa chỉ mới.
Cài đặt redirect 301
Điều đầu tiên là bạn phải đảm bào chắc server Apache của bạn hỗ trợ mod_rewrite cho phép sử dụng .htaccess để áp dụng redirect 301 . Sau đó bạn phải tải tệp tin .htaccess từ thư mục gốc chứa các trang web của bạn. Nếu như bạn không có tệp tin .htaccess trong thư mục gốc thì bạn phải tạo nó với trình soạn thảo text như Notepad, Ultraedit hay EditPadPro, v.v. Phải chắc chắn rằng bạn viết đúng tên và có dấu chấm “.” đầu tệp tin.
Người sử dụng Windows sẽ không thể tạo được tệp tin .htaccess vì tệp tin đặc biệt này không chứa tên, nó chỉ chứa tên của phần tên mở rộng. Vì thế bạn hãy tải tệp tin text bất kỳ trong window rồi tải lên server qua FTP rồi đổi tên trên sever.
Sau khi tải tệp tin .htaccess xuống máy, nếu đã có các dòng lệnh trước đó thì hãy cẩn thận đừng thay đổi nếu như bạn không chắc, tốt nhất hãy sao lưu một bản để phòng trường hợp cần thiết bạn vẫn có thể quay trở lại.
Cài đặt cơ bản
Dòng lệnh bắt đầu .htaccess
Dòng lệnh .htaccess của bạn nên bắt đầu như sau :
Dòng lệnh redirect 301 về cơ bản có dạng như sau trong tệp tin .htaccess :
Chú ý : Để bắt đầu thì bạn nên redirect 301 các trang trên cũng host, bạn chỉ nên chuyển các trang cũ đến thư mục gốc tương đối. Có thể thực hiện việc này bằng việc loại bỏ “http://www.gapro.net” mà chỉ thêm đường dẫn tương đối đến thư mục gốc.
Điểm mạnh nhât của việc thay đổi hàng loạt đường dẫn URL chính là mod_rewrite của Apache, đặc biệt là khi thay đổi tên miền hay thư mục
hay số lượng lớn các tập tin. Chúng ta hãy tìm hiểu phần tiếp theo.
Chuyển toàn bộ đến tên miền mới
Nếu bạn quyết định thay đổi tên miền thì các đường dẫn trước đây từ các website bên ngoài, từ máy tìm kiếm và ngay cả các đường dẫn tuyệt đối trên website cũ đều bị thay đổi và khi bạn truy cập, các địa chỉ trên sẽ trỏ bạn đến trang báo lỗi 404 : trang không tìm thấy.
Vì thế nếu bạn thay đổi tên miền thì đừng để mất các liên kết quí báu và người dùng tiềm năng từ máy tìm kiếm, hãy redirect các liên kết cũ tới tên miền mới :
Redirect toàn bộ trang trong một thư mục đến mọt trang mới
Giả sử như bạn không còn sử dụng thư mục “thuvienthietke” nữa và muốn chuyển tất cả các trang trong thư mục này đến trang “thuvienweb.php” thì hãy thêm dòng lệnh sau vào tệp tin .htaccess nằm tại thư mục gốc :
Để chuyến trang web động page.php?id=n (với n là giá trị biến) tới một trang tĩnh mới new-page.html thì bạn có thể làm như sau :
Đôi khi các bạn bắt gặp việc website sử dụng “www” trong URL (Ví dụ như http://gapro.net), trong khi có những website lại không dùng “www” này như http://vnexpress.net. Nên nhớ rằng “tương ứng” với dịch vụ Web. Các bạn có thể lựa chọn riêng cho mình. Nhưng không thể chọn cả hai vì sẽ gây ra trùng lặp nội dung. sau đây là hai ví dụ, hướng dẫn bạn xủ lý triệt để vấn đề này.
Trường hợp sử dụng www
Loại bỏ Query_String
Đôi khi một trang web của bạn có thể hiển thị hai đường dẫn url khác nhưng ( cùng một nội dung) ví dụ thuvienweb.php và thuvienweb.php?v=joomla. Tương tự như phần trên, điều này sẽ tạp ra nội dung trùng lặp trên website của bạn. Vì vậy bạn có thể loại bỏ các tham biến như sau :
Việc chuyển .php sang .html có tác dụng khi bạn cần viết lại đường dẫn thân thiện với máy tìm kiếm (Friendly URL for SEO).
Dù Google mới chấp nhận việc sử dụng gạch dưới “_” như là ký tự ngăn cách, nhưng trong thực tế người dùng vẫn quen thuộc với dấu gạch ngang “-”. Bản thân mình cũng ủng hộ dấu gạch ngang vì nó dễ nhìn hơn. Bạn có thể chuyển đổi toàn bộ dấu “_” sang “-” như sau :
Trong bài viết sử dụng Feedbuner, các bạn có thể sử dụng plugin để quản lý Feeds RSS trên Blog Wordpress. Nếu không các bạn có thể sử dụng code htaccess sau :
Đối với người dùng WordPress, các bạn có thể sử dụng plug-in Redirection Permanent Link để chuyến hướng các trang.
Bào vệ ăn cắp tài nguyên và băng thông
Đôi khi các tài liệu, film hay hình ảnh mà bạn tải trên host của mình bị người khác dùng và đăng trên website khác sẽ gây tốn băng thông, bạn có thể hạn chế việc ăn cắp bằng cách chỉ cho phép các tài nguyên trên tiếp cận trên những website bạn cho phép như sau (Nếu không sẽ trả về thư mục /feed/) :
.
Htaccess là một tệp tin cấu hình đặc biệt, htaccess cho phép bạn thay đổi cách hoạt động của máy chủ Apache ở tầng thư mục. Tệp tin htaccess gồm các dòng lệnh, có thể tùy biến theo người dùng, được đặt trong một thư mục nào đó, nó sẽ có tác dụng cho thư mục đó và tất cả các thư mục con. Một trong những ứng dụng phổ biến của htaccess là cho phép viết lại đường dẫn URL (rewrite URL).
Trở lại ứng dụng SEO của htaccess, khi một khách hay bọ tìm kiếm thăm một trang web, máy chủ sẽ kiểm tra tệp tin đặt biệt để tìm các tùy biến của webmaster, bao gồm cả các tùy biến bảo mật. Máy chủ sau đó sẽ thực thi các lệnh tìm thấy trong tệp tin htaccess thường gồm chuyển hướng redirection, bảo mật và báo lỗi.
Redirect 301 là gì?
Chuyển hướng redirect 301 hay redirection 301 thường được hiểu như việc di rời vĩnh viễn (moved permanently). Nó trả về mã lỗi 301 trong phần header nhằm thông báo cho máy tìm kiếm hay trình duyệt, máy chủ rằng trang web hiện tại đã được chuyển rời tới địa chỉ mới.
Cài đặt redirect 301
Điều đầu tiên là bạn phải đảm bào chắc server Apache của bạn hỗ trợ mod_rewrite cho phép sử dụng .htaccess để áp dụng redirect 301 . Sau đó bạn phải tải tệp tin .htaccess từ thư mục gốc chứa các trang web của bạn. Nếu như bạn không có tệp tin .htaccess trong thư mục gốc thì bạn phải tạo nó với trình soạn thảo text như Notepad, Ultraedit hay EditPadPro, v.v. Phải chắc chắn rằng bạn viết đúng tên và có dấu chấm “.” đầu tệp tin.
Người sử dụng Windows sẽ không thể tạo được tệp tin .htaccess vì tệp tin đặc biệt này không chứa tên, nó chỉ chứa tên của phần tên mở rộng. Vì thế bạn hãy tải tệp tin text bất kỳ trong window rồi tải lên server qua FTP rồi đổi tên trên sever.
Sau khi tải tệp tin .htaccess xuống máy, nếu đã có các dòng lệnh trước đó thì hãy cẩn thận đừng thay đổi nếu như bạn không chắc, tốt nhất hãy sao lưu một bản để phòng trường hợp cần thiết bạn vẫn có thể quay trở lại.
Cài đặt cơ bản
Dòng lệnh bắt đầu .htaccess
Dòng lệnh .htaccess của bạn nên bắt đầu như sau :
Dòng lệnh cơ bản redirect 301Options +FollowSymLinksRewriteEngine OnRewriteBase /
Dòng lệnh redirect 301 về cơ bản có dạng như sau trong tệp tin .htaccess :
Dòng lệnh trên thông báo chuyển rời tệp tin old.htm trong thư mục old đến vị trí mới tại http://www.gapro.net/new.htm.redirect 301 /old/old.htm http://www.gapro.net/new.htm
Chú ý : Để bắt đầu thì bạn nên redirect 301 các trang trên cũng host, bạn chỉ nên chuyển các trang cũ đến thư mục gốc tương đối. Có thể thực hiện việc này bằng việc loại bỏ “http://www.gapro.net” mà chỉ thêm đường dẫn tương đối đến thư mục gốc.
Điểm mạnh nhât của việc thay đổi hàng loạt đường dẫn URL chính là mod_rewrite của Apache, đặc biệt là khi thay đổi tên miền hay thư mục
hay số lượng lớn các tập tin. Chúng ta hãy tìm hiểu phần tiếp theo.
Chuyển toàn bộ đến tên miền mới
Nếu bạn quyết định thay đổi tên miền thì các đường dẫn trước đây từ các website bên ngoài, từ máy tìm kiếm và ngay cả các đường dẫn tuyệt đối trên website cũ đều bị thay đổi và khi bạn truy cập, các địa chỉ trên sẽ trỏ bạn đến trang báo lỗi 404 : trang không tìm thấy.
Vì thế nếu bạn thay đổi tên miền thì đừng để mất các liên kết quí báu và người dùng tiềm năng từ máy tìm kiếm, hãy redirect các liên kết cũ tới tên miền mới :
Hãy thay đổi www.gapro.netbằng tên miền mới của bạn.Options +FollowSymLinksRewriteEngine onRewriteRule (.*) http://www.gapro.net/ [R=301,L]
Redirect toàn bộ trang trong một thư mục đến mọt trang mới
Giả sử như bạn không còn sử dụng thư mục “thuvienthietke” nữa và muốn chuyển tất cả các trang trong thư mục này đến trang “thuvienweb.php” thì hãy thêm dòng lệnh sau vào tệp tin .htaccess nằm tại thư mục gốc :
RewriteRule ^thuvienthietke(.*)$ /thuvienweb.php [L,R=301]Chuyển các trang động tới một trang mới
Để chuyến trang web động page.php?id=n (với n là giá trị biến) tới một trang tĩnh mới new-page.html thì bạn có thể làm như sau :
RewriteRule ^page.php?id=(.*)$ /new-page.htm [L,R=301]URL với www hay không www
Đôi khi các bạn bắt gặp việc website sử dụng “www” trong URL (Ví dụ như http://gapro.net), trong khi có những website lại không dùng “www” này như http://vnexpress.net. Nên nhớ rằng “tương ứng” với dịch vụ Web. Các bạn có thể lựa chọn riêng cho mình. Nhưng không thể chọn cả hai vì sẽ gây ra trùng lặp nội dung. sau đây là hai ví dụ, hướng dẫn bạn xủ lý triệt để vấn đề này.
Trường hợp sử dụng www
Ngoài ra còn có cách viết sau có thể áp dụng cho tất cả các host và domain, không phải edit lại :Options +FollowSymLinksRewriteEngine OnRewriteBase /RewriteCond %{HTTP_HOST} !^www\.gapro.\.net$ [NC]RewriteRule ^(.*)$ http://www.gapro.net/ [R=301,L]
Trường hợp không sử dụng wwwOptions +FollowSymLinksRewriteEngine OnRewriteBase /RewriteCond %{HTTP_HOST} !^www\.[a-z-]+\.[a-z]{2,6} [NC]RewriteCond %{HTTP_HOST} ([a-z-]+\.[a-z]{2,6})$ [NC]RewriteRule ^/(.*)$ http://%1/ [R=301,L]
Options +FollowSymLinks
RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_HOST} !^aevn\.fr$ [NC]
RewriteRule ^(.*)$ http://aevn.fr/ [R=301,L]Bạn có thể thử lại với các tên miền ví dụ trên mà tớ áp dụng thành công đúng như trích dẫn.
Loại bỏ Query_String
Đôi khi một trang web của bạn có thể hiển thị hai đường dẫn url khác nhưng ( cùng một nội dung) ví dụ thuvienweb.php và thuvienweb.php?v=joomla. Tương tự như phần trên, điều này sẽ tạp ra nội dung trùng lặp trên website của bạn. Vì vậy bạn có thể loại bỏ các tham biến như sau :
Ngoài ra nếu như tham biến QUERY_STRING không được gấn giá trị nào hết và URl kết thúc bởi biến rỗng “?”, thì bạn nên loại bỏ chúng, ví dụ “index.php?” :RewriteCond %{THE_REQUEST} ^GET\ /.*\;.*\ HTTP/RewriteCond %{QUERY_STRING} !^$RewriteRule .* http://www.gapro.net%{REQUEST_URI}? [R=301,L]
Chuyển phần đuôi mở rộng từ .php sang .htmlRewriteEngine OnRewriteBase /RewriteCond %{QUERY_STRING} .RewriteRule ^index.php /index.php? [L]
Việc chuyển .php sang .html có tác dụng khi bạn cần viết lại đường dẫn thân thiện với máy tìm kiếm (Friendly URL for SEO).
RewriteRule ^(.*)\.html$ .php [R=301,L]Chuyển gạch dưới (_) thành gạch ngang(-)
Dù Google mới chấp nhận việc sử dụng gạch dưới “_” như là ký tự ngăn cách, nhưng trong thực tế người dùng vẫn quen thuộc với dấu gạch ngang “-”. Bản thân mình cũng ủng hộ dấu gạch ngang vì nó dễ nhìn hơn. Bạn có thể chuyển đổi toàn bộ dấu “_” sang “-” như sau :
Options +FollowSymLinks
RewriteEngine On
RewriteBase /
RewriteRule !\.(html|php)$ - [S=4]
RewriteRule ^([^_]*)_([^_]*)_([^_]*)_([^_]*)_(.*)$ ---- [E=uscor:Yes]
RewriteRule ^([^_]*)_([^_]*)_([^_]*)_(.*)$ --- [E=uscor:Yes]
RewriteRule ^([^_]*)_([^_]*)_(.*)$ -- [E=uscor:Yes]
RewriteRule ^([^_]*)_(.*)$ - [E=uscor:Yes]
RewriteCond %{ENV:uscor} ^Yes$
RewriteRule (.*) http://www.gapro.net/ [R=301,L]Redirect Wordpress Feeds tới Feedburner
Trong bài viết sử dụng Feedbuner, các bạn có thể sử dụng plugin để quản lý Feeds RSS trên Blog Wordpress. Nếu không các bạn có thể sử dụng code htaccess sau :
RewriteEngine OnRewriteBase /RewriteCond %{REQUEST_URI} ^/feed\.gif$RewriteRule .* - [L]RewriteCond %{HTTP_USER_AGENT} !^.*(FeedBurner|FeedValidator) [NC]RewriteRule ^feed/?.*$ http://feeds.gapro.net/gapro/ [L,R=302]RewriteCond %{REQUEST_FILENAME} !-fRewriteCond %{REQUEST_FILENAME} !-dRewriteRule . /index.php [L]
Đối với người dùng WordPress, các bạn có thể sử dụng plug-in Redirection Permanent Link để chuyến hướng các trang.
Bào vệ ăn cắp tài nguyên và băng thông
Đôi khi các tài liệu, film hay hình ảnh mà bạn tải trên host của mình bị người khác dùng và đăng trên website khác sẽ gây tốn băng thông, bạn có thể hạn chế việc ăn cắp bằng cách chỉ cho phép các tài nguyên trên tiếp cận trên những website bạn cho phép như sau (Nếu không sẽ trả về thư mục /feed/) :
RewriteEngine OnRewriteBase /RewriteCond %{HTTP_REFERER} !^$RewriteCond %{HTTP_REFERER} !^http://(www\.)?thuvienwebmaster.com/.*$ [NC]RewriteRule \.(gif|jpg|swf|flv|png)$ /feed/ [R=302,L]
.
Không có nhận xét nào: