Blog

Noticias Bing. Nuevas perspectivas para la calidad del barómetro de búsqueda: Errar es humano

Noticias Bing.
Nuevas perspectivas para la calidad del barómetro de búsqueda: Errar es humano

En Bing se han comprometido a ofrecer los mejores resultados posibles. Mientras que los equipos de investigación, expertos en el algoritmo de aprendizaje y los buscadores de datos tratan de mejorar continuamente la ortografía básica y los componentes de clasificación, la realidad es que algunos defectos venían desde tiempo atrás. Esto es en parte porque para enseñar al sistema  se basaba en búsquedas humanas, ya que la gente comete errores, siempre pueden introducir alguna falta de ortografía. Nuestra reciente actualización, da un paso adelante en el tratamiento de muchos de los defectos o faltas más comunes que encontramos en el sistema.
En este post, el colega Bill Ramsey, Gerente de Desarrollo de Bing, examinará tres categorías en las que se ha reducido la tasa de ocurrencia y severidad de las faltas de ortografía y defectos en la escritura de búsquedas: las consultas de URL’s, enlaces y Recursos de búsquedas relacionadas.

El Dr. Harry Shum, vicepresidente corporativo de Bing I + D

Una de las principales fuentes de defectos se refiere a lo que llamamos las consultas de URL. Estas son preguntas como “facebook.com” o “yahoo.com / mail”, donde la consulta se parece a una dirección URL. A primera vista, se podría pensar que esto es un problema sencillo de un motor de búsqueda. Después de todo, tenemos miles de millones de URLs – lo difícil puede ser encontrar una dentro de todas? En realidad, este tipo de consulta es bastante complicada. Porque todos somos humanos, las personas utilizan un sinnúmero de variantes ortográficas. Por ejemplo, “facebook.com” cuenta con más de un millar de distintas variantes, tales como “facebookc.om”, “facbook.com”, y “ww.faceboo.omc”. En la parte superior de los errores de ortografía, la gente no siempre sabe la dirección correcta. Por ejemplo, Southwest Airlines es southwest.com pero algunas personas tratan de “swair.com” esperando para llegar a la página principal de Southwest. También vemos comúnmente permutaciones de direcciones de Internet tales como “yahoo.com / mail” cuando la dirección URL correcta es “mail.yahoo.com”. Incluso si la figura de su intención, la multitud de los spammers y los ocupantes ilegales por ahí presentan otro desafío. Los spammers se aprovechan de las variantes de los dominios de la talla de coolmathgames.com (la gente está realmente buscando coolmath-games.com) o URLs que no están del todo el spam como facebooklogin.net (la mayoría de la gente sólo quiere acceder a facebook.com).

Nuestros esfuerzos de reducción de defectos en esta clase de consultas se centraron en tres áreas principales:

  1. La primera fue la correcta identificación de las direcciones URL que podemos corregir. Al identificar las URL problemáticas, evitamos problemas como la inclusión de los resultados de spam como searscardcom.com.
  2. El segundo esfuerzo, involucrados en ampliar nuestra capacidad de modelar los tipos de errores que los usuarios hacen sobre la base de cómo la gente usa Bing. Mediante el reconocimiento de patrones en miles de millones de registros, seremos capaces de corregir los errores comunes de ortografía en las direcciones URL.
  3. Por último se analizaron miles de millones de sesiones para encontrar patrones, para que los usuarios que buscan sitios como “swair.com” a la larga terminaría en el sitio previsto “southwest.com”.

Otro ejemplo se encuentra en los modelos de aprendizaje automático que  han de tener en cuenta una consulta como “Facebook login.com” como equivalente a “facebooklogin.net” a pesar de que los patrones de uso de las personas indican que no es la consulta prevista. Es muy común que las personas tipo A “. Com” cuando quieren una “. Net” o “. Org”. Además, también es común que la gente escriba las preguntas como “baño de cama y beyond.com” cuando se está buscando bedbathandbeyond.com. Nuestros modelos se han adaptado a estos patrones y ahora pueden concatenar los términos y cambiar “. Com” a “. Net”. Al mirar a varias fuentes de comportamiento de los usuarios hemos sido capaces de refinar nuestros modelos para entregar correctamente a los usuarios lo que pretendían (como en el ejemplo de Facebook.)

En definitiva nuevas mejoras que van a permitir a los usuarios realiza búsquedas en Bing de una forma mucho más cómoda, aún cuando no estén escribiendo bien esas búsquedas. Adelantos y ventajas que agradecemos al equipo de Bing.


25 junio, 2012

 

Logos Directorio de empresas