Evitar el uso de identificadores de sesión en las url para mejorar el ranking de búsquedas

Identificadores de sesión puede hacer que la vida del motor de búsqueda interesante. UN ID de sesión identifica una persona en particular visitando el sitio en un momento determinado, que permite al servidor para rastrear las páginas que el visitante observa y qué acciones lleva al visitante durante la sesión.

Si solicita una página de un sitio web, el servidor web que tiene la página envía a su navegador. Entonces, si usted solicita otra página, el servidor envía esa página, también, pero el servidor no sabe que eres la misma persona. Si el servidor tiene que saber quién es usted, que necesita una manera de identificar al usuario cada vez que solicita una página. Lo hace mediante el uso de identificadores de sesión.

ID de sesión se utilizan para una variedad de razones, pero su propósito principal es permitir a los desarrolladores web para crear varios tipos de sitios interactivos. Por ejemplo, si los desarrolladores han creado un entorno seguro, es posible que quieran obligar a los visitantes a ir a través de la página principal en primer lugar. O bien, los desarrolladores pueden desear una forma de reanudar una sesión sin terminar.

Al establecer las galletas que contienen el identificador de sesión en el ordenador del visitante, los desarrolladores pueden ver donde el visitante se encontraba en el sitio al final de la última sesión del visitante.

Los identificadores de sesión son comunes cuando se ejecutan aplicaciones de software que tienen cualquier tipo de procedimiento de seguridad, que necesitan almacenar variables, o que quieren derrotar a la caché del navegador - es decir, garantizar que el navegador siempre muestra información desde el servidor, nunca de su propia caché . sistemas cesta de la compra suelen utilizar los identificadores de sesión - que es cómo el sistema puede permitirle colocar un elemento en el carrito de la compra y luego vas y seguir comprando. Eso reconoce usted, basado en su identificador de sesión.

Un identificador de sesión se pueden crear de dos formas:

  • Almacenarla en una cookie.

  • Mostrarla en la propia URL.

Algunos sistemas están configurados para almacenar el identificador de sesión en una cookie, pero a continuación, utilizar un identificador de sesión URL si el navegador del usuario está configurado para no aceptar cookies. Aquí está un ejemplo de una dirección URL que contiene un identificador de sesión:

http://yourdomain.com/index.jsp-jsessionid=07D3CCD4D9A6A9F3CF9CAD4F9A728F44

los 07D3CCD4D9A6A9F3CF9CAD4F9A728F44 pedazo de la URL es el identificador único asignado a la sesión.

Si un motor de búsqueda reconoce una dirección URL que incluye un identificador de sesión, es probable que no lea la página indicada, ya que cada vez que el searchbot vuelve a su sitio, el identificador de sesión habrá expirado, por lo que el servidor va a hacer uno de los siguientes:

  • Mostrar una página de error en lugar de la página indexada o tal vez mostrar la página por defecto del sitio. En otras palabras, el motor de búsqueda ha indexado una página que no está allí si alguien hace clic en el enlace de la página de resultados de búsqueda.

  • Asignar un nuevo identificador de sesión. La dirección URL que el searchbot utilizado originalmente ha expirado, por lo que el servidor sustituye a la identificación con el otro y cambia la URL. Por lo tanto, la araña se podría alimentar varias direcciones URL de la misma página.

Incluso si el searchbot lee la página de referencia, no puede indexar la misma. webmasters a veces se quejan de que un motor de búsqueda entró en su sitio, solicita la misma página una y otra vez, y se fue sin indexación de la mayor parte del sitio. El searchbot simplemente se confundió y se fue. O, a veces, el motor de búsqueda no reconoce un ID de sesión en una dirección URL. Un cliente tenía cientos de URL indexadas por Google, sino porque estaban totalmente vencido hace tiempo identificadores de sesión, todos ellos señaló a la página principal del sitio.

Todos estos son los peores escenarios, como searchbots el mayor de los motores de búsqueda hacen todo lo posible para reconocer los identificadores de sesión y trabajar alrededor de ellos. Por otra parte, Google recomienda que si está utilizando identificadores de sesión, se utiliza la directiva canónica para decir a los motores de búsqueda la URL correcta de la página. Por ejemplo, digamos que usted está usando identificadores de sesión, y sus URL ser algo como esto:

http://youdomain.com/product.php?item=rodent-racing-gear &xyid = 76,345&sessionid = 9876

Un motor de búsqueda podría terminar con cientos de direcciones URL de referencia con eficacia la misma página. Por lo tanto, se puede poner el etiqueta en el la sección de las páginas web para contar los motores de búsqueda de la URL correcta, así:

problemas de identificación de sesión son más raros de lo que una vez eran- en el pasado, la fijación de un problema de identificación de sesión era como hacer magia: Los sitios que eran invisibles a los motores de búsqueda de repente se hacen visibles! Un propietario de un sitio en un grupo de discusión motor de búsqueda se describe cómo su sitio nunca había tenido más de 6 páginas indexadas por Google, sin embargo, una semana después de la eliminación de los identificadores de sesión, Google ha indexado más de 600 páginas.

Si su sitio tiene un problema de identificación de sesión, hay un par de otras cosas que puede hacer, además de utilizar la directiva canónica:

  • En lugar de utilizar los identificadores de sesión en la URL, tienda de información de la sesión en una cookie en el ordenador del usuario. Cada vez que se solicita una página, el servidor puede comprobar la cookie para ver si la información de sesión se almacena allí. Sin embargo, el servidor no debe exigir cookies, o es posible que encuentre más problemas.

  • Obtener su programador para omitir los identificadores de sesión si el dispositivo que solicita una página web desde el servidor es un searchbot. El servidor proporciona la misma página a la searchbot pero no asigna un identificador de sesión, por lo que el searchbot puede viajar a través del sitio sin necesidad de utilizar los identificadores de sesión. Este proceso se conoce como de suministro de agente de usuario, en el que el agente de usuario se refiere al dispositivo - navegador, searchbot, u otro programa - que está solicitando una página.

El método de agente de usuario tiene un problema potencial: En la técnica conocida a veces como encubierto, el servidor envía una página a los motores de búsqueda y otra a los visitantes del sitio real. Los motores de búsqueda en general, no les gusta el encubrimiento, ya que algunos sitios web tratan de engañar a ellos, proporcionando un contenido diferente del contenido que ven los visitantes del sitio.

Por supuesto, en el contexto del uso de esta técnica para evitar el problema de ID de sesión, ese no es el por intención que es una manera de mostrar la mismo contenido que ve el visitante del sitio, por lo que no es cierto que disimula. Sin embargo, el peligro es que los motores de búsqueda pueden verla como encubrimiento si descubren lo que está sucediendo.

Artículos Relacionados