Chắc hẳn một SEOer đều phải biết và hiểu rõ Canonical. Canonical là gì?  Khi nào nên dùng chúng? Đâu là cách ngăn chặn, khắc phục một số lỗi phổ biến? Hãy cùng chúng tôi tìm hiểu qua bài viết sau nhé!

Nội Dung Chính

Định nghĩa Canonical?

Canonical là URL của trang được cho là chuẩn nhất trong số các trang Website có nội dung giống nhau hoặc tương tự trên site của bạn. Tức là, cần có một trang làm chuẩn trong số những trang bị trùng lặp và trang chuẩn đấy có chứa canonical URL.

Canonical

Canonical

Canonical URL là một thành phần HTML nhằm thông báo cho các công cụ tìm kiếm hiểu được cách thu thập dữ liệu trang và xếp hạng cấp độ quan trọng của nội dung. Trong trường hợp xảy ra cùng một nội dung trên các URL khác nhau, việc dùng mã này – còn được nhắc đên là thẻ rel = canonical – sẽ giúp công cụ tìm kiếm hiểu rõ hơn nội dung nào là quan trọng, giải quyết các sai lầm về nội dung trùng lặp, sửa đổi và nâng cấp xếp hạng của nội dung đó và cuối cùng, có thể dẫn nhiều khách hàng hơn đến trang Web của bạn.

Nguyên nhân sử dụng Canonical trong SEO website?

Sau khi đã hiểu được định nghĩa thẻ Canonical là gì, chúng ta cùng đi lý giải những lý do mà bạn nên dùng Canonical trong SEO Web nhé.

Nói một cách đơn giản, nội dung trùng lặp gây nhầm lẫn cho các công cụ tìm kiếm. Khi công cụ tìm kiếm xem xét nhiều trang có cùng nội dung và không có tín hiệu sửa đổi và cải thiện keyword bài bản, chúng:

  • Không hề biết phần nào để gán tín dụng
  • Không hề biết URL nào nên lập chỉ mục
  • Không biết trang nào nên thứ hạng

Thẻ rel = canonical làm rõ điều này, giúp các công cụ tìm kiếm hiểu nội dung, ngăn chúng bỏ qua trang và cải thiện cơ hội nội dung được thứ hạng.

Phần đông người từng nói rằng nội dung trùng lặp có thể dẫn đến các hình phạt tìm kiếm, làm giảm toàn bộ thứ hạng của trang Web hoặc xóa hoàn toàn khỏi SERPs. Thế nhưng, đến hiện tại nhiều SEO-er tin rằng vốn không có hình phạt thực sự nào cả.

Google không trừng trị các trang Website có nội dung trùng lặp; nó chỉ lọc ra các kết quả trùng lặp để tạo ra trải nghiệm tốt hơn và đáp ứng mục đích tìm kiếm của người dùng mà thôi.

Tối ưu hoá Canonical URL bằng cách nào?

Hiểu được thực chất của thẻ Canonical là gì, vậy làm thế nào để tối ưu hóa các canonical URL đạt hiệu quả nhất. Hãy cùng tham khảo ngay qua những chia sẻ dưới đây!

Làm cách nào để sửa đổi và cải thiện các canonical URL?

Việc sửa đổi và cải thiện canonical URL gồm có việc xác định nội dung trùng lặp và hiểu nguyên nhân của sự trùng lặp này. Có một số thủ thuật để biết được điều này.

Ví dụ: bạn có thể kiểm tra các trang được gợi ý, vì các công cụ tìm kiếm cũng hiển thị kết quả bằng việc xem xét nội dung của truy vấn đấy. Hơn nữa, hãy sử dụng một tìm kiếm nhỏ của Google hoặc Bing để kiểm tra xem các trang được lập chỉ mục trên trang Web của bạn có nhiều hơn số lượng bài báo hoặc trang đã xuất bản hay không.

Cải thiện các canonical URL

Cải thiện các canonical URL

Để tối ưu hóa một URL chuẩn, phải đảm bảo rằng bạn tuân theo các quy tắc cơ bản chi phối URL nói chung. Khi làm như vậy, cũng nên nhớ rằng bạn phải mang lại URL ưa thích, để liên kết đến một trang cụ thể, toàn bộ những điều này đều được các công cụ tìm kiếm nhìn thấy.

Việc thêm một cụm từ vào canonical URL tất nhiên là không đủ để nó được tối ưu hóa và không thể được coi là phương án toàn diện. Cũng cần tránh trường hợp URL quá dài, dễ bị lợi dụng trên kênh mạng xã hội và diễn đàn. Về điểm này, cấu trúc dữ liệu cây là một trong những yếu tố ảnh hưởng đến độ dài của URL.

Cách tối ưu hóa canonical URL và giá trị gia tăng mà nó mang lại là gì?

Sau khi đã chọn lựa được canonical URL mà bạn mong muốn ưu tiên cho một nội dung nhất định trên trang Web của mình, bây giờ bạn phải cần thiết lập nó bằng cách chọn phương pháp phù hợp dưới đây:

Tối ưu hóa canonical URL

Tối ưu hóa canonical URL

Phương pháp thứ nhất: Chèn thẻ canonical URL vào mã HTML

Việc dùng phương pháp này bao gồm việc đặt thẻ, với tính chất thích hợp, ở thẻ

Thẻ này phải được thêm trên tất cả các trang có nội dung giống hệt nhau; vì thế, tất cả chúng sẽ tham chiếu đến trang được Kết hợp với canonical URL. để thực thi việc này, giữa “head” và “/ head”, hãy chèn mã sau:

Phương pháp thứ 2: Sử dụng tiêu đề HTTP rel=canonical

Kể từ tháng 6 năm 2011, bạn có thể định cấu hình máy chủ bằng việc thêm một dòng trong tiêu đề HTTP rel= “canonical” để biểu thị canonical URL cho các tài liệu không phải dạng HTML.

Chẳng hạn với tệp PDF:

; rel=“canonaical”

; rel= “canonical” format, an expression that is to be inserted at the header level.

Phương pháp thứ 3: phương án của sơ đồ trang Website

Sơ đồ trang Website chứa các canonical URL của tất cả các trang trên trang Website của bạn. Toàn bộ các URL trong sơ đồ trang Website đều có thể được đề nghị là canonical URL. Dựa trên cấp độ trùng lặp hay giống nhau về nội dung là Googlebot sẽ quyết định đâu là trang trùng lặp.

Bạn không bắt buộc phải sử dụng bất kỳ phương pháp nào trong số này để nắm rõ ràng canonical URL cho các trang trùng lặp của mình. Tuy nhiên, khi làm như vậy, sẽ giúp ích cho bạn bảo đảm việc kiểm soát được URL nào là URL thích hợp nhất để liên kết đến một nội dung cụ thể trên trang Web của bạn. Trong trường hợp bạn không nắm rõ ràng rõ canonical URL thì Google sẽ tự động tùy chọn URL phù hợp nhất theo chuẩn mực của nó. Và những tiêu chí đó chưa chắc sẽ đúng ý bạn.

Dùng Canonical cho các trường hợp trùng lặp

Để dùng canonical URL hiệu quả ngoài việc hiểu được Canonical là gì thì điều quan trọng là phải nhận biết được đâu là các trang trùng lặp. dưới đây là một vài dạng trùng lặp thường gặp nhất:

Phiên bản “www” và không “www” hoặc phiên bản “http” và “https”

Các phiên bản www hoặc giao thức https thường gây nhầm lẫn cho người sử dụng và sự trùng lặp khi sử dụng các phiên bản này là rất lớn. ngoài ra, còn có một số phiên bản dành cho di động hay máy tính của Web.

Chẳng hạn 4 URL dưới đây đều được coi là trùng lặp và cùng một nội dung:

http://www.example.com

https://example.com

http:/example.com

https://example.com

Việc chọn lựa URL chuẩn đã được nói đến trong phần trước. Thế nhưng, trong trường hợp không rõ cách thực hiện, bạn nên tìm kiếm sự trợ giúp từ nhân viên lập trình trang Website.

Phiên bản có và không có dấu gạch chéo ở cuối URL

Đây cũng là một trường hợp phổ biến khác, việc có sự khác biệt dấu gạch chéo ở cuối mỗi URL và nếu như chúng đều có thể truy xuất được thì có nghĩa là những trang đó đang bị trùng lặp.

Ví dụ:

Marketing AI – kế hoạch | giải pháp Digital Marketing – Admicro.vn

Marketing AI – chiến lược | phương án Digital Marketing – Admicro.vn

Và trong code sẽ không chỉ rõ cho bạn biết đâu là canonical URL.

Phiên bản máy tính và di động

Phiên bản di động được biểu thị dưới dạng m.example.com.

Chẳng hạn, Kênh 14 có 2 phiên bản máy tính và di động với 2 URL như sau:

https://kenh14.vn

https://m.kenh14.vn

Hai trang này có nội dung hầu như trùng khớp hoàn toàn và được coi là trang trùng lặp.

Hai trang có nội dung trùng khớp

Hai trang có nội dung trùng khớp

Bộ lọc và sắp xếp

Việc sử dụng các tác vụ sắp đặt hoặc bộ lọc có thể làm ra nhiều URL không giống nhau với nội dung không thay đổi. Do đó, các công cụ khi được sử dụng sẽ gây nên sự trùng lặp.

Ví dụ, đây chính là trang mua sắm điện thoại iPhone tại trang Web của thegioididong:

https://www.thegioididong.com/dtdd-apple-iphone

Khi dùng các bộ lọc không giống nhau như giá, dung lượng, màu sắc… thì nhận được nhiều trang còn lại nhau:

https://www.thegioididong.com/dtdd-apple-iphone?p=tren-20-trieu

https://www.thegioididong.com/dtdd-apple-iphone-pin-3000-den-5000-mah

https://www.thegioididong.com/dtdd-apple-iphone-rom-128-den-256gb

https://www.thegioididong.com/dtdd-apple-iphone-ram-4-den-6gb

Và tất nhiên, cả 4 trang này đều thể hiện cùng một nội dung và chỉ khác nhau về cách sắp xếp. Trường hợp này cũng được coi là trùng lặp nội dung.

Trang tìm kiếm nội bộ

Mỗi trang Web đều hỗ trợ công cụ tìm kiếm và với mỗi keyword truy vấn không giống nhau sẽ cho ra những URL khác nhau. VD, khi tìm kiếm trên trang https://marketingai.admicro.vn/ ta có nhận được các URL sau:

https://marketingai.admicro.vn/?s=tiktok

https://marketingai.admicro.vn/?s=Facebook

https://marketingai.admicro.vn/?s=youtube

Đây cũng được xem là một dạng trùng lặp nội dung

Trang đích trỏ tới từ 1 trang liên kết (Referral Link)

Biểu thị rõ nhất trong hoạt động tiếp thị liên kết, khi người sử dụng truy xuất vào link mà bạn đặt trên trang của mình để đi đến trang đích có thêm tham số giới thiệu. Về thực chất, đấy vẫn là trang ban đầu và chỉ có URL thay đổi. Đây cũng là một lỗi trùng lặp nội dung.

Trên đây là những trường hợp trùng lặp nội dung phổ biến nhất, ngoài ra còn một vài trường hợp khác tuy nhiên ít gặp hơn như ID phiên, phiên bản máy in,…

Trùng lặp chéo giữa các tên miền

Có thể là những hệ thống Web vệ tinh của bạn mặc dù có tên miền khác nhau tuy nhiên có một số trang lại trùng lặp nội dung. Để không bị Google bắt lỗi bạn nên chỉ rõ đâu là URL trên site là chuẩn sau đó trỏ những trang trùng lặp đó về trang chuẩn.

Điều hướng 301 và Canonical Url có gì khác nhau?

Điều hướng 301 là mã hiện trạng HTTP được sử dụng để giao tiếp với phần mềm (trình duyệt, trình thu thập thông tin). Và công cụ tìm kiếm rằng trang gốc đang cố gắng truy cập đã được chuyển sang một trang Website mới, cùng lúc đó báo hiệu cho công cụ tìm kiếm xóa trang khỏi chỉ mục. Và chuyển mọi thông tin SEO đạt được sang trang mới. Khi trình duyệt của bạn nhận được mã này, nó sẽ tự động chuyển đến URL mới được đề cập cùng với mã tình trạng 301.

Điều hướng 301 và Canonical Url

Điều hướng 301 và Canonical Url

Trong lúc đó, tính chất canonical URL không chuyển phương hướng người truy cập đến URL mới, thay vì vậy, nó được dùng để làm tín hiệu cho các công cụ tìm kiếm biết rằng trang nào cần lập chỉ mục trong kết quả của tìm kiếm khi nội dung tương tự hoặc trùng lặp xảy ra trong một trang Web.

Sử dụng thẻ Canonical Url acafn tránh những lỗi gì?

Cho dù bạn hoàn toàn có thể kiểm soát các thẻ canonical, nhưng là một nhánh của kỹ thuật SEO nó khá khó giải quyết trong một số tình huống cụ thể. Sai lầm về chuẩn hóa có thể dẫn đến lỗi hiển thị trong công cụ tìm kiếm và hiển nhiên là việc này cũng sẽ ảnh hưởng đến xếp hạng của trang. Dưới đây là 5 lỗi mà bạn phải cần tránh khi sử dụng thẻ canonical URL.

Rel = canonical & phiên bản trên điện thoại di động

Một sai lầm phổ biến mà mọi người thường làm là tự tham chiếu các phiên bản URL di động của họ bằng thẻ canonical. Cách chuẩn xác để thực hiện là thêm một thẻ canonical trỏ từ URL trên thiết bị di động đến URL trên máy tính để bàn và cũng có một thẻ alternate trỏ từ URL máy tính để bàn đến URL di động.

Các thẻ HTML chuẩn xác cho điều này phải là:

(trỏ từ URL máy tính để bàn đến URL di động)

(trỏ từ URL trên thiết bị di động đến URL trên máy tính để bàn)

Google cũng gợi ý rằng bạn nên giữ nguyên thiết lập với rel-alternate từ máy tính để bàn sang điện thoại di động và rel-canonical từ thiết bị di động sang máy tính để bàn.

Chỉ định nội dung không ảnh hưởng trong thẻ canonical

Mục đích chủ yếu của thẻ canonical là khắc phục các sai lầm về nội dung trùng lặp. Nếu như bạn đang cố gắng dùng nó chỉ để xếp hạng trang Website nhất định trên các keyword không giống nhau, nó sẽ không hoạt động tốt.

Nếu bạn nghĩ rằng bạn có hai bài content hoặc một phần nội dung khá giống nhau, bạn sẽ chuẩn hóa một phiên bản. Tuy nhiên tốt hơn hết là bạn nên điều hướng 301 từ phiên bản yếu hơn sang phiên bản mạnh hơn. Thậm chí có thể hợp nhất cả hai thành một URL mạnh hơn.

Sử dụng nhiều phiên bản canonical

Thêm nhiều thẻ canonical như phía dưới là tốt:

Thêm nhiều thẻ canonical

Thêm nhiều thẻ canonical

Thế nhưng, việc có nhiều phiên bản canonical không hoàn toàn trực quan đối với công cụ tìm kiếm. Nếu như cho rằng các thẻ canonical giúp các công cụ tìm kiếm quyết định nhanh hơn, thì việc có nhiều thẻ canonical trên cùng một trang về căn bản như đang nói với Google rằng “đây là một trang trùng lặp”. Thay vì vậy, bạn sẽ hiển thị trang này, hoặc trang này, hoặc trang này”.

Toàn bộ các phiên bản trùng lặp cần có một thẻ canonical duy nhất trỏ đến URL của phiên bản chính. Hãy nhớ rằng: mỗi trang một thẻ canonical

Nhiều thẻ canonical từ một trang trỏ đến các phiên bản chính không giống nhau thực sự không tốt cho trang Web của bạn và cho dù chúng có thể bị SE bỏ qua nhưng sẽ tốt hơn nếu như bạn tránh chúng.

Vấn đề về HTTP & HTTPS trong canonical URL

Thông thường, khi hợp nhất từ HTTP sang HTTPS, nhiều người thường quên sửa các thẻ canonical. Mặc dù bạn đang chạy trang Web của mình trên HTTPS, tuy nhiên thẻ canonical sẽ yêu cầu Google kiểm tra phiên bản HTTP để thay thế. Nếu bạn điều hướng 301s đúng cách, nó sẽ đưa Google trở lại HTTPS, trong một vòng lặp liên tục.

Hợp chuẩn hóa nội dung được phân trang

Mọi người thường mắc sai lầm khi chuẩn hóa cho trang đầu tiên của danh mục sản phẩm. Đây là một ý tưởng tệ, vì tất cả các trang khác có thể chứa nội dung độc đáo và có thể được thứ hạng cao hơn cho các keyword không giống nhau.

Đối với nội dung được phân trang, tốt hơn nên dùng thẻ rel-prev/next thay vì thẻ rel-canonical. Nó khá đơn giản để thêm. Ví dụ: nếu bạn đang ở trang 2, bạn nên sử dụng:

Đặt sai vị trí vào thẻ

Canonical URL phải được đặt trong thẻ

Càn gần phần phía trên càng có lợi. Nếu chẳng may bạn đặt canonical vào trong thẻthì Google có thể bỏ qua nó.

Khi dùng Canonical Url bạn cần lưu ý những gì?

Canonical URL do bạn quyết định và canonical URL do các công cụ tìm kiếm (SE) chọn lựa có thể không giống nhau tùy thuộc vào thuật toán mà những SE đó sử dụng. Vì thế, bạn nên thường xuyên kiểm tra và nếu cần thiết thì nên thay đổi canonical URL của bạn sao cho phù hợp với thuật toán của SE.

Thuộc tính canonical URL chỉ nên được sử dụng khi khối lượng và số lượng trùng lặp nội dung lớn. Nếu như cấp độ trùng thấp thì không quan trọng phải thông báo để tránh lãng phí nguồn tiềm lực.

Trong một vài trường hợp, điều hướng 301 nên được ưu tiên sử dụng hơn việc chỉ định canonical URL, chẳng hạn đối với các giao thức http và https, hay phiên bản có www và không có www.

Kết luận

Không những các công cụ tìm kiếm mà ngay cả người dùng cũng hoàn toàn không thích việc nội dung bị trùng lặp. Việc này vừa liên quan không tốt đến SEO vừa làm tăng năng lực mất lưu lượng truy cập của Website. Canonical URL nổi lên như một thuộc tính hữu ích nhất giúp xử lý những vấn đề này. Nhưng không phải ai cũng hiểu canonical là gì và cách tối ưu hóa canonical URL để mang lại hiệu quả cao nhất.

Bài viết liên quan

ONESE – Nhà Máy Sản Xuất Nội Dung Chuyển Đổi Bán Hàng & SEO 4.0 – giúp doanh nghiệp bạn tối ưu trang web, sản xuất nội dung và phân phối nội dung lên các kênh truyền thông phù hợp. Chúng ta cùng nhau làm việc để doanh nghiệp của bạn Bán Nhiều Hàng & Tăng Lợi Nhuận với thứ hạng từ khóa được xếp hạng cao và nội dung chuyển đổi mua hàng tăng trưởng liên tục.

ONESE Digital Marketing

Điện thoại028 6292 1313

Emailinfo@onese.vn

Nguồn: thuyen.vn