Lỗi 404 và Sụt Hạng Trong SEO
Trong một buổi podcast với Google Office Hours, Gary Illyes của Google đã trả lời một câu hỏi về việc sụt hạng mà dường như liên quan đến lỗi trang 404 Page Not Found.
Lỗi 404 Ngoại Tuyến
Có nhiều lý do cho lỗi 404 do các bot tạo ra. Một trong những nguyên nhân cho các phản ứng lỗi này có thể là chúng xuất phát từ các máy quét tự động đang tìm kiếm các tệp hoặc thư mục phổ biến cho các plugin hoặc chủ đề dễ bị tấn công.
Việc kiểm tra địa chỉ IP và user agent của bot gây ra các phản ứng lỗi máy chủ 404 cũng có thể cung cấp gợi ý nếu những phản ứng 404 đó từ các bot quét tự động. Nếu địa chỉ IP cho thấy nó xuất phát từ một máy chủ web, hoặc một địa chỉ IP Nga hoặc Trung Quốc thì có thể đó là một hacker. Nếu user agent là một phiên bản lỗi thời của Chrome hoặc Firefox thì có thể đó là một bot của hacker. Đó chỉ là một trong số nhiều lý do.
Google Trả Lời Câu Hỏi
Người đặt câu hỏi liên kết việc sụt hạng với các phản ứng máy chủ 404 Page Not Found.
Đây là câu hỏi đã được đặt ra:
'Các URL 404 giả đang tấn công trang web của tôi từ nguồn bên ngoài, có thể liên quan đến việc sụt hạng không? Tôi có thể làm gì để sửa chúng?'
Gary Illyes của Google đã trả lời:
'Các URL 404 giả mạo mà Googlebot có thể đã quét không thể được hợp lý đưa ra sự sụt hạng. Việc có bất kỳ số lượng 404 nào trên một trang web là bình thường và bạn không cần phải sửa chúng, tuy nhiên nếu bạn thấy trong phần mềm thống kê của mình có một số lượng lớn người dùng thực tế cũng trải qua các URL 404 đó, thì tôi cá nhân sẽ cố gắng chuyển hướng họ bằng cách nào đó, ví dụ như hiển thị cho họ một số nội dung liên quan thay vì.'
Sụt Hạng và Trang 404 Not Found
Gary cho biết rằng các lỗi 404 là bình thường và không có khả năng gây ra sụt hạng trong tìm kiếm. Đúng là lỗi 404 là một sự cố phổ biến. Nói chung thì việc này là ổn và đa số thời gian không cần phải sửa gì.
404 Do Người Dùng Thực Tế Tạo Ra
Có những trường hợp khác khi lỗi 404 được tạo ra bởi người thực sự đang theo một liên kết từ nơi nào đó và nhận được phản ứng Page Not Found. Điều này dễ chẩn đoán bằng cách kiểm tra xem URL mà khách truy cập trang web đang cố truy cập có gần giống với một URL thực sự không. Đó là một dấu hiệu cho thấy ai đó đã gõ sai URL và cách để sửa chữa là tạo một chuyển hướng từ URL bị gõ sai đến đúng.
Về Sụt Hạng
Một điều mà Gary không đề cập nhưng đáng để nói đến là có thể có một khả năng nhỏ rằng một bot đã tìm thấy một lỗ hổng và các lỗi 404 đã được gây ra bởi một máy quét đang quét lỗ hổng trước khi cuối cùng tìm thấy một.
Một cách để kiểm tra điều đó là sử dụng phpMyAdmin, một ứng dụng máy chủ, để xem các bảng cơ sở dữ liệu của bạn trong phần người dùng và xem xem có người dùng không được nhận dạng không.
Một cách khác, nếu trang web được lưu trữ trên WordPress, là sử dụng một plugin bảo mật để quét trang web xem nó có đang sử dụng một chủ đề hoặc plugin dễ bị tấn công không.
Jetpack Protect là một công cụ quét lỗ hổng miễn phí được tạo ra bởi các nhà phát triển tại Automattic. Nó sẽ không sửa chữa lỗ hổng nhưng sẽ cảnh báo người dùng nếu nó phát hiện lỗ hổng liên quan đến plugin hoặc chủ đề. Phiên bản trả phí cung cấp nhiều bảo vệ hơn.
Các plugin bảo mật WordPress đáng tin cậy khác là Sucuri và Wordfence, cả hai đều có các tính năng khác nhau và có sẵn trong phiên bản miễn phí và trả phí.
Nhưng nếu không phải trường hợp đó thì sụt hạng chỉ là một sự trùng hợp và nguyên nhân thực sự nằm ở đâu khác.
Nghe câu hỏi và câu trả lời tại phút 12:27 của bản ghi podcast Office Hours:
Hình ảnh nổi bật của Shutterstock/Asier Romero