Dưới đây là nhận định của team mình về thuật toán Link Spam được Google nói tới từ tháng 7/2021.
Thuật toán Link Spam - Đây là thuật toán làm anh em rối não.
Bởi khác với các thuật toán xử lý thao túng thứ hạng trước đây của Google, Link Spam không tạo ra một xu hướng tăng/giảm thứ hạng chung, không phải chỉ là tụt hoàn toàn hoặc tăng mạnh, có thể chỉ tăng rất ít hoặc giảm rất ít. Cùng là bị tác vụ thủ công nhưng có website thì bay mất, có website thì vẫn... chưa sao cả.
Lý do mình sẽ nói rõ ở dưới.
Mà đặc biệt cái tên gây hiểu nhầm của nó khiến anh em nghĩ nó chỉ nói về spam backlink. Nhưng nó là thuật toán khá toàn diện.
Mục tiêu thuật toán:
Dọn dẹp và sắp xếp lại dữ liệu trong hệ thống dữ liệu của Google, từ đó chống spam thao túng thứ hạng.
Về thuật ngữ Link Spam, ở đây có 2 vế bạn cần hiểu:
* Link: Cần hiểu Link không phải là backlink, link ở đây là 1 đường link (url) có chứa nội dung bên trong, có thể post, page, video, hình ảnh, kể cả trang chủ của bạn...tất cả chúng đều có tối thiểu 1 url đại diện để người dùng truy cập. Ví dụ:
- abc.com/post1 - đây là 1 đường link có chứa nội dung bài viết bên trong.
- abc.com - đây là 1 đường link chứa nội dung trang chủ của 1 website.
* Spam: Không phải là spam backlink, spam được hiểu là xấu/rác/không có giá trị với tài nguyên internet mà google hướng đến, được cố tình tạo ra để thao túng thứ hạng. Vậy, các yếu tố có thể bị coi là đường link spam có thể liệt kê:
- Đường link chứa nội dung sao chép từ một nội dung đã có sẵn trên internet
- Đường link chứa nội dung không cung cấp nhiều giá trị cho tìm kiếm của người dùng (mỏng hoặc không cung cấp thông tin cho 1 đối tượng hoặc không đáp ứng bất kỳ truy vấn tìm kiếm nào)
- Đường link nhận được nhiều liên kết thủ công, nhằm mục đích thao túng page rank.
Tóm lại Link Spam là một đường link rác cần được xử lý.
Cách thức hoạt động:
Phát hiện các link có yếu tố spam và xử lý. Khi Google nói về cách thức xử lý, mình thấy lạ rằng nó không hề nói tới việc phạt penalty như trước mà chỉ dùng từ ignore (bỏ qua), khá lạ lùng với cách làm việc xưa nay của nó.
Sau cùng mình tìm đọc được một bài viết về tư duy hoạt động của Google từ năm 2016:
Google Penguin không còn phạt các liên kết xấu nữa, mà nó sẽ phát triển thêm các thuật toán phát hiện và vô hiệu hóa các liên kết spam, nhằm loại bỏ tác động page rank, trái ngược với việc phạt chúng.
Tới bản cập nhật tháng 7/2021 chính thức có Link Spam xử lý giảm giá trị hoặc bỏ qua (ignore) hầu hết các liên kết spam, tùy vào lượng loại bỏ mà giảm độ tin cậy của website.
Tại sao nó làm vậy?
Bạn phải nhìn rộng ra cuộc chạy đua về AI giữa các ông lớn hiện tại: Google, Facebook, Tiktok, Microsoft...và mối liên quan giữa AI - Machine Learning - Big Data.
Hiểu đơn giản là ông lớn nào cũng muốn dẫn đầu trong việc phát triển AI của mình lên tầm cao nhất. Mà muốn phát triển được nhanh mạnh nhất, dữ liệu nạp vào (Big Data) cho Machine Learning xử lý phải là lớn nhất.
Mặt khác, việc các website spam nhằm mục đích đạt thứ hạng cao, không đồng nghĩa với việc là dữ liệu của nó luôn là rác. Nhiều website có nội dung tốt vẫn cung cấp dữ liệu nạp vào cho AI của Google học và phát triển.
Chính vì vậy, Google không phạt toàn bộ website mà chỉ bỏ qua các url riêng biệt có spam, thậm chí giữ lại các dữ liệu spam và ngăn chặn nó tiếp cận với người dùng.
Tóm lại, tùy mức độ spam mà có tác động khác nhau.
=> Từ đó bạn sẽ thấy các trường hợp bị xử lý như sau:
1. Tình trạng khó index, mất index:
Không phải toàn bộ website mất index mà chỉ một số đường link không được index. Google loại bỏ các link có spam này và giữ lại phần có giá trị.
2. Bài viết mất TOP từ khóa hoàn toàn nhưng vẫn được index:
Bạn có thể check website bvtt-tphcm.org.vn, trước đó TOP hàng triệu traffic/tháng, nhưng bị phạt spam mất TOP hoàn toàn, thậm chí bạn search tên thương hiệu website cũng không thấy, NHƯNG website này vẫn đang được index, bạn thử check cấu trúc site: mà xem.
Ở trường hợp này dữ liệu của website đang được Google giữ lại cho máy học, Google vẫn nạp vào kho data NHƯNG ngăn chặn nó tiếp cận người dùng tìm kiếm.
3. Thứ hạng bị tụt nhưng không nhiều:
Nội dung trong từng cái backlink của bạn đang spam thường không cung cấp giá trị gì cả. Nó cũng đã bị bỏ qua bởi thuật toán Link Spam, mất link là tụt hạng, điều đó không cần bàn cãi. Dù link đó còn index hay không thì nó chẳng có giá trị gì với page rank nữa.
4. Sai lầm chí mạng nhất gần đây và vấn đề phạt tác vụ thủ công hiện tại.
Đến lúc này chắc anh em hiểu tại sao, bị tác vụ thủ công nhưng ảnh hưởng ở các site khác nhau rồi chứ?
Tùy vào số lượng đường link bị đánh là spam mà website sẽ bị ảnh hưởng khác nhau. Nếu các đường link đó quyết định đến thứ hạng và độ tin cậy của website thì chắc chắn bạn tụt thảm. Còn các đường link dính tác vụ thủ công là không quan trọng thì website của bạn sẽ không ảnh hưởng nhiều ở thời điểm hiện tại.
Tại sao nói là thời điểm hiện tại? Bởi khi đã bị soi thì sớm muộn các phần spam khác trên website cũng bị đánh giá lại. Nó giống cái u nhọt trong website, ngày một lây lan ra các phần khác.
Thực tế việc phát hiện và phạt backlink từ thuật toán Link Spam đã diễn ra từ tháng 7 khi nó bắt đầu được phát hành.
Bọn mình đã tìm ra cách nó phát hiện các dạng link xấu và dạng link nào tuyệt đối không nên làm. Hướng triển khai backlink bây giờ khác biệt hơn xưa rất nhiều. Khuyên bạn nên tập trung vào branding nhiều hơn.
Trong bài viết này mình sẽ chỉ share tình trạng bị Link Spam nó soi backlink, còn dạng link bị phạt và cách xử lý cụ thể mình sẽ...tạm thời không share.
Anh em gần đây chắc không lạ gì tình trạng viết bài tâm huyết, share bài đó lên social hoặc ở một nơi nào đó và cái kết là...cái nơi share bài nó được index TOP còn bài trên website của mình thì lại mất hút!
Tư duy đặt backlink của nhiều anh em cho đến bây giờ - khi đã dính thuật toán Link Spam vẫn là: Chọn website thật mạnh kiểu gov báo chí tổ chức forum mạnh, website có nhiều traffic để đặt link đúng không?
Mình cũng khẳng định nó vẫn đúng với việc tăng thứ hạng!
Nhưng nên nhớ Link Spam sinh ra để chống lại các tác động thao túng thứ hạng không tự nhiên này và nó đã xử lý việc này một cách cực kỳ đơn giản.
Tư duy của nó là nếu gặp thông tin trùng lặp nó giữ lại nguồn thông tin có độ tin cậy cao hơn, tức là giữ lại website mạnh hơn và loại bỏ website yếu hơn, vì mục tiêu của nó hướng tới là người dùng tìm kiếm, chứ không phải các webmaster!
Rõ ràng, các bài viết trùng lặp thì đâu cần giữ lại tất cả, chỉ cần giữ lại 1 link trong số các link trùng lặp đó là đủ. Vậy, website của bạn có mạnh bằng các website bạn đặt link không? Nếu không mạnh bằng thì nó sẽ đá bay công sức của bạn và dành sự ưu ái về TOP cho cái nơi bạn đặt backlink. Thế mới đau!
Đúng là vỏ quýt dày thì có móng tay nhọn anh em ạ!
Google và người làm SEO luôn có mối quan hệ đối lập qua lại. Nên cá nhân mình nghĩ, móng tay nhọn sẽ có cắt móng tay, việc đi backlink này còn giá trị thì anh em sẽ còn cách lách thuật toán để đi tiếp.
Rõ ràng việc SEO các website không có thương hiệu ngoài đời thực thì không có cách nào khác, chúng ta phải tìm tới sức mạnh từ backlink và các yếu tố không tự nhiên. Muốn SEO sạch và bền vững thì thương hiệu đời thực mới là yếu tố quyết định!
Tạm thời kết thúc phần đoán mò tập 1 ở đây nhé anh em!
Bài viết của anh Nguyễn Cao Khánh trên Group "NGHIỆN SEO"
Nguồn: Link bài viết