Duplicate Content là gì? Cách khắc phục Duplicate Content đầy đủ năm 2020

Duplicate Content là gì?

Duplicate content (hay còn gọi là Nội dung trùng lặp) là nội dung tương tự với nội dung xuất hiện trên các trang web khác hoặc trên các trang khác nhau trên cùng một trang web.

Làm thế nào để xử lý Duplicate Content SEO?

Nói chung, Google không muốn xếp hạng các trang có nội dung trùng lặp.

Trên thực tế, Google tuyên bố rằng :

Google cố gắng lập chỉ mục và hiển thị các trang có thông tin riêng biệt.

Vì vậy, nếu bạn có các trang trên trang web của mình mà KHÔNG có thông tin riêng biệt, nó có thể làm tổn thương thứ hạng công cụ tìm kiếm của bạn.

Cụ thể, đây là ba vấn đề chính mà các trang web có nhiều nội dung trùng lặp gặp phải.

Ít lưu lượng hữu cơ: Điều này khá đơn giản. Google không muốn xếp hạng các trang sử dụng nội dung được sao chép từ các trang khác trong chỉ mục của Google.

(Bao gồm các trang trên trang web của riêng bạn)

Ví dụ: giả sử bạn có ba trang trên trang web của mình có nội dung tương tự.

Google không chắc trang nào là bản gốc của bản gốc. Vì vậy, cả ba trang sẽ đấu tranh để xếp hạng.

Hình phạt (Rất hiếm): Google đã nói rằng nội dung trùng lặp có thể dẫn đến một hình phạt hoặc khử hoàn toàn của một trang web.

Tuy nhiên, đây là siêu hiếm. Và nó chỉ được thực hiện trong trường hợp một trang web cố tình cào hoặc sao chép nội dung từ các trang web khác.

Vì vậy, nếu bạn có một loạt các trang trùng lặp trên trang web của mình, có lẽ bạn không cần phải lo lắng về một hình phạt nội dung trùng lặp.

Ít trang được lập chỉ mục: Điều này đặc biệt quan trọng đối với các trang web có nhiều trang (như trang thương mại điện tử).

Đôi khi Google không chỉ ghi lại nội dung trùng lặp. Nó thực sự từ chối lập chỉ mục nó.

Vì vậy, nếu bạn có các trang trên trang web của mình không được lập chỉ mục, có thể là do ngân sách thu thập dữ liệu của bạn bị lãng phí cho nội dung trùng lặp.

Thực hành tốt nhất

Xem cùng một nội dung trên các URL khác nhau

Nói cách khác: các trang trên trang web của bạn đang nhân lên trên các URL khác nhau.

Đây là lý do phổ biến nhất mà các vấn đề nội dung trùng lặp bật lên.

Ví dụ: giả sử bạn điều hành một trang web thương mại điện tử.

Và bạn có một trang sản phẩm bán áo phông.

Nếu mọi thứ được thiết lập đúng, mọi kích cỡ và màu sắc của áo phông đó sẽ vẫn nằm trên cùng một URL.

Nhưng đôi khi, bạn sẽ thấy rằng trang web của mình tạo một URL mới cho mỗi phiên bản khác nhau của sản phẩm của bạn, điều này dẫn đến THOUSANDS của các trang nội dung trùng lặp.

Một vi dụ khac:

Nếu trang web của bạn có chức năng tìm kiếm, những trang kết quả tìm kiếm đó cũng có thể được lập chỉ mục. Một lần nữa, điều này có thể dễ dàng thêm hơn 1.000 trang vào trang web của bạn. Tất cả đều chứa nội dung trùng lặp.

Kiểm tra các trang được lập chỉ mục

Một trong những cách dễ nhất để tìm nội dung trùng lặp là xem số lượng trang từ trang web của bạn được lập chỉ mục trong Google.

Bạn có thể làm điều này bằng cách tìm kiếm trang web: example.com trong Google.

Hoặc xem các trang được lập chỉ mục của bạn trong Google Search Console .

Dù bằng cách nào, con số này sẽ phù hợp với số lượng trang mà bạn đã tạo thủ công.

Ví dụ: GPNSEO có 160 trang được lập chỉ mục:

Đó là số lượng trang mà chúng tôi đã thực hiện.

Nếu con số đó là 16.000 hoặc 160.000, chúng tôi sẽ biết rằng rất nhiều trang sẽ được thêm tự động. Và những trang đó có thể chứa một lượng đáng kể nội dung trùng lặp.

Hãy chắc chắn rằng trang web của bạn chuyển hướng chính xác

Đôi khi, bạn không chỉ có nhiều phiên bản của cùng một trang mà là cùng một TRANG WEB.

Mặc dù hiếm, tôi đã thấy nó xảy ra trong tự nhiên nhiều lần.

Vấn đề này tăng lên khi phiên bản trang web WWW của bạn không chuyển hướng sang phiên bản không phải WWW.

(Hoặc ngược lại)

Điều này cũng có thể xảy ra nếu bạn chuyển trang web của mình sang HTTPS ‘và không chuyển hướng trang HTTP.

Nói tóm lại: tất cả các phiên bản khác nhau của trang web của bạn sẽ kết thúc ở cùng một nơi.

Sử dụng chuyển hướng 301

Chuyển hướng 301 là cách dễ nhất để khắc phục các sự cố nội dung trùng lặp trên trang web của bạn.

(Bên cạnh việc xóa các trang hoàn toàn)

Vì vậy, nếu bạn tìm thấy một loạt các trang nội dung trùng lặp trên trang web của mình, hãy chuyển hướng chúng trở lại ban đầu.

Khi Googlebot dừng lại, nó sẽ xử lý chuyển hướng và CHỈ lập chỉ mục nội dung gốc.

(Điều này có thể giúp trang gốc bắt đầu xếp hạng)

Giữ một mắt ra cho nội dung tương tự

Nội dung trùng lặp KHÔNG CHỈ có nghĩa là nội dung được sao chép từng từ từ một nơi khác.

Trên thực tế, Google định nghĩa nội dung trùng lặp là:

Vì vậy, ngay cả khi nội dung của bạn khác về mặt kỹ thuật so với những gì ngoài kia, bạn vẫn có thể gặp phải các vấn đề về nội dung trùng lặp.

Đây không phải là một vấn đề cho hầu hết các trang web. Hầu hết các trang web có một vài chục trang. Và họ viết những thứ độc đáo cho mỗi trang.

Nhưng có những trường hợp mà nội dung trùng lặp tương tự của Wap có thể tăng lên.

Ví dụ: giả sử bạn điều hành một trang web dạy mọi người cách nói tiếng Pháp.

Và bạn phục vụ khu vực Boston lớn hơn.

Chà, bạn có thể có một trang dịch vụ được tối ưu hóa xung quanh từ khóa: Học tiếng Pháp Boston.

Và một trang khác đang cố xếp hạng cho Học Tìm hiểu tiếng Pháp Cambridge.

Đôi khi nội dung về mặt kỹ thuật sẽ khác nhau. Ví dụ: một trang có một vị trí được liệt kê cho vị trí Boston. Và trang khác có địa chỉ Cambridge.

Nhưng đối với hầu hết các phần, nội dung là siêu tương tự.

Đó là nội dung trùng lặp về mặt kỹ thuật.

Có phải là một nỗi đau để viết nội dung độc đáo 100% cho mỗi trang trên trang web của bạn? Vâng Nhưng nếu bạn nghiêm túc về việc xếp hạng mọi trang trên trang web của mình, thì đó là điều bắt buộc.

Sử dụng thẻ Canonical

Thẻ rel = canonical cho các công cụ tìm kiếm:

Có, chúng tôi có một loạt các trang có nội dung trùng lặp. Nhưng trang NÀY là bản gốc. Bạn có thể bỏ qua phần còn lại.

Google đã nói rằng một thẻ chuẩn sẽ tốt hơn việc chặn các trang có nội dung trùng lặp.

(Ví dụ: chặn Googlebot bằng robot.txt hoặc bằng thẻ noindex trong HTML trang web của bạn)

Vì vậy, nếu bạn tìm thấy một loạt các trang trên trang web của mình với nội dung trùng lặp bạn muốn:

  • Xóa chúng
  • Chuyển hướng họ
  • Sử dụng thẻ chuẩn

Sử dụng một công cụ

Có một số công cụ SEO có các tính năng được thiết kế để phát hiện nội dung trùng lặp.

Ví dụ: Siteliner quét trang web của bạn để tìm các trang có chứa nhiều nội dung trùng lặp.

Trang tổng hợp

Giống như tôi đã đề cập, nếu bạn có nhiều trang có nội dung trùng lặp, bạn có thể muốn chuyển hướng chúng đến một trang.

(Hoặc sử dụng thẻ chính tắc)

Nhưng nếu bạn có các trang có nội dung tương tự thì sao?

Chà, bạn có thể nghiền ra nội dung độc đáo cho mỗi trang HOẶC hợp nhất chúng thành một trang lớn.

Ví dụ: giả sử bạn có 3 bài đăng blog trên trang web của bạn khác biệt về mặt kỹ thuật nhưng nội dung khá giống nhau.

Bạn có thể kết hợp 3 bài đăng đó thành một bài đăng blog tuyệt vời, độc đáo 100%.

Vì bạn đã xóa một số nội dung trùng lặp khỏi trang web của mình, trang đó sẽ xếp hạng tốt hơn 3 trang khác cộng lại.

Thẻ Noindex WordPress hoặc Trang chuyên mục

Nếu bạn sử dụng WordPress, bạn có thể nhận thấy rằng nó tự động tạo các trang thẻ và danh mục.

Các trang này là nguồn LỚN của nội dung trùng lặp.

Vì vậy, chúng rất hữu ích cho người dùng, tôi khuyên bạn nên thêm thẻ noindex vào các trang này. Bằng cách đó, chúng có thể tồn tại mà không cần công cụ tìm kiếm lập chỉ mục cho chúng.

Bạn cũng có thể thiết lập mọi thứ trong WordPress để những trang này hoàn toàn không được tạo.

Tìm hiểu thêm

Google xử lý nội dung trùng lặp như thế nào? : Video từ Google Matt Cutts về cách Google xem nội dung trùng lặp.

Huyền thoại về hình phạt nội dung trùng lặp : Bài đăng này nêu ra lý do tại sao hầu hết mọi người không cần phải lo lắng về một hình phạt nội dung trùng lặp hình phạt.

Write a Comment

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *