Sitemaps là gì?

Sitemaps (sơ đồ website) là một thuật ngữ thường được thấy trong lĩnh vực SEO (Search Engine Optimization), đây là một tập tin liệt kê các link của trang web thuộc của bạn để giúp Google và các (search engines) khác hiểu cách tổ chức nội dung của website bạn. Do đó, Sitemaps sẽ giúp Googlebot hoặc các web crawlers khác thu thập dữ liệu của website bạn thông minh và hiệu quả hơn.

Tại sao cần phải có Sitemaps?

Sitemaps là một trong những thành phần quan trọng giúp các công cụ thu thập dữ liệu và lập chỉ mục website của bạn tốt hơn. Đặc biệt, sitemap cực kỳ hữu ích trong các trường hợp sau :

  • Website của bạn có lượng dữ liệu lớn và cập nhật thường xuyên thì sitemap sẽ giúp Googlebot cập nhật nhanh và không bỏ lỡ bất kỳ trang nào trong website của bạn
  • Website của bạn có những trang riêng biệt không liên kết với các trang khác trong website
  • Website của bạn mới tạo và có ít backlink bên ngoài (external links) trỏ về website của bạn. Nguyên tắc hoạt động của Googlebot và các web crawlers khi thu thập dữ liệu website thường đi theo các link trong nội dung của trang để thu thập thông tin, do đó nếu website của bạn quá mới hoặc có ít backlink trỏ về thì bạn cần có sitemap để Google index trang web của bạn nhanh và đầy đủ hơn.

Ngay cả khi bạn tổ chức các liên kết trong website bạn tốt nhất thì website của bạn cũng nên có sitemap để website được Googlebot index nhanh hơn và hiệu quả hơn.

Ngoài ra, sitemap còn có thể cung cấp những thẻ metadata chứa các thông tin liên quan đến các trang con trong danh sách như : lần cập nhật mới nhất (lastmod); trang thường xuyên thay đổi nội dung ra sao (changefreq – mỗi ngày, mỗi tuần, mỗi tháng,…); và tầm quan trọng của trang so với các trang khác trong website (priority).

Sitemaps là gì? - Googlebot Search Engine sitemaps - SEO - Search Engine Optimization

Sitemap giúp website được Google index nhanh hơn

Các loại Sitemap

Hiện nay có 2 loại sitemap là dạng Sitemap HTML và Sitemap XML. Trong đó Sitemap HTML được dùng để giúp người đọc hiểu sơ đồ website của bạn để đến các trang cần thiết nhanh nhất. Còn Sitemap XML là một dạng dữ liệu theo ngôn ngữ đánh dấu mở rộng (Extensible Markup Language) được thể hiện theo chuẩn riêng biệt giúp Googlebot và các công cụ tìm kiếm khác hiểu cấu trúc và nội dung website bạn một cách nhanh nhất và hiệu quả nhất.

Ví dụ sau đây là một dạng Sitemaps XML :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/phat-trien-website/hosting/</loc>
		<lastmod>2015-03-17T22:21:52+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.6</priority>
	</url>
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/marketing/</loc>
		<lastmod>2014-07-21T23:03:33+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.6</priority>
	</url>
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/phat-trien-website/</loc>
		<lastmod>2015-02-23T10:38:35+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.6</priority>
	</url>
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/marketing/digital-marketing/sem-digital-marketing/</loc>
		<lastmod>2013-11-24T09:46:22+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.6</priority>
	</url>
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/marketing/digital-marketing/sem-digital-marketing/seo-search-engine-optimization/</loc>
		<lastmod>2014-07-20T23:06:40+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.2</priority>
	</url>
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/marketing/digital-marketing/social-media-marketing-smm/</loc>
		<lastmod>2013-12-31T02:34:42+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.4</priority>
	</url>
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/phat-trien-website/blog/</loc>
		<lastmod>2014-01-05T15:56:05+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.2</priority>
	</url>
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/phat-trien-website/webmasters-tools/</loc>
		<lastmod>2015-03-19T08:29:15+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.6</priority>
	</url>
	<url>
		<loc>http://blog-xtraffic.pep.vn/category/phat-trien-website/blog/wordpress/</loc>
		<lastmod>2015-03-17T02:00:14+07:00</lastmod>
		<changefreq>weekly</changefreq>
		<priority>0.4</priority>
	</url>
</urlset>

Tuy nhiên, Google cũng lưu ý rằng sử dụng Sitemap không đảm bảo chắc chắn 100% rằng các link bên trong sitemap sẽ được Google thu thập, index cũng như có thứ hạng cao trong công cụ tìm kiếm, bởi vì quá trình này dựa vào rất nhiều thuật toán riêng biệt của Google để đánh giá tầm quan trọng của 1 trang web. Nhưng chắc chắn là việc sử dụng sitemap sẽ tốt hơn nhiều so với việc bạn không sử dụng nó.