Google ha actualizado su documento de ayuda sobre Googlebot para especificar que Googlebot rastreará hasta los primeros 15 MB de la página y luego se detendrá. Entonces, si desea asegurarse de que Google posicione su página de manera adecuada, asegúrese de que Googlebot pueda rastrear e indexar esa parte de la página dentro de los primeros 15 MB.
¿Qué es lo nuevo? En el documento de ayuda de Googlebot , Google agregó esta sección que dice:
Googlebot puede rastrear los primeros 15 MB de contenido en un archivo HTML o en un archivo de texto compatible. Después de los primeros 15 MB del archivo, Googlebot deja de rastrear y solo considera los primeros 15 MB de contenido para la indexación.
Por qué nos importa. En general, probablemente desee mantener sus páginas bastante livianas tanto para los usuarios como para los rastreadores de los motores de búsqueda. Pero aquí Google está siendo muy claro sobre cuánto consumirá Googlebot de tu página.
Una buena manera de probar esto es usar la herramienta de inspección de URL en Google Search Console y ver qué partes de la página muestra y ve Google dentro de la herramienta de depuración.
Si bien la mayoría de páginas no estan ni cerca de llegar a los 15MB, muchas páginas que dependen de muchas imagenes de buena calidad podrían llegar y/o sobrepasar los 15MB.
Si quieres verificar el tamaño de una URL puedes hacerlo con alguna herramienta online como esta o esta otra, o si quieres revisar todas las de tu web, puedes usar Screaming Frog, luego de rastrear toda la web ve a Internal, en filtros elige HTML y vas a encontrar una columna llamada «SIze» que es la que te indica cuanto pesa cada URL.
En la mayoría de casos no deberas preocuparte por este limite.